Home
» Wiki
»
De ce AI nu poate scrie text pe imagini?
De ce AI nu poate scrie text pe imagini?
Dacă ați folosit instrumente Generative AI pentru a crea imagini, este posibil să fi întâmpinat probleme la scrierea textului în imagini. A ști de ce se întâmplă acest lucru va ajuta la evitarea acestei probleme, precum și la găsirea modalităților de a o rezolva.
Cel mai mare motiv pentru care AI nu poate scrie text este din cauza datelor introduse din trecut. În timp ce AI este destul de bun la generarea de imagini în general, unele aspecte, cum ar fi textul, nu au fost folosite la același nivel pentru a antrena modele de limbaj mari (LLM) . Prin urmare, AI nu este foarte priceput să genereze text în imagini.
Deși destul de avansate, instrumentele AI sunt încă în stadii incipiente din punct de vedere tehnic. În plus, unele instrumente AI rămân fără date de antrenament. Există încă șansa ca instrumentele generatoare să poată genera text mai bun, dar pentru moment, va trebui să încercați o alternativă.
Există o alternativă la textul care nu poate fi citit în imaginile AI?
Deși generarea de text în imaginile AI este destul de dificilă, nu este imposibilă. Iată cele mai eficiente metode în acest moment...
1. Dați instrumentului solicitări mai specifice
Când oamenii încep să folosească AI, abilitățile lor de scriere promptă sunt adesea substandard. Cea mai mare greșeală este să dai solicitări vagi precum „creează o imagine a unei scene de stradă”.
Nu este surprinzător că obțineți rezultate substandard. Cel mai bun mod de a folosi AI generativ este să vă gândiți la promptul dvs. ca pe un brief creativ. Cu cât este mai specific, cu atât mai bine. Iată un exemplu de prompt:
Creați o imagine a exteriorului unei cafenele italiene. Vreau să aibă ca semn scrierea „Café” și ar trebui să fie într-o zi însorită.
Traducere brută : creați o imagine exterioară a unei cafenele italiene. Vreau ca imaginea să aibă cuvintele „Café” pe semn și într-o zi însorită.
După cum puteți vedea din imaginea de mai jos, ChatGPT s-a descurcat destul de bine. Acest lucru nu s-ar întâmpla dacă ai spune doar „Creează o imagine exterioară a unei cafenele italiene”.
Imaginea unei cafenele create în DALL-E
Din experiența personală, imaginile simple par a fi mai eficiente. De exemplu, imaginea de mai sus are mai puține elemente decât imaginea testată de mai jos, ceea ce înseamnă că AI are mai puțin de încercat și de învățat.
O scenă de stradă ajustată în aplicația DALL-E 3
2. Folosiți variante ale cuvântului „Text”
Schimbarea puțină a limbii în prompt poate face o mare diferență. După ce ați încercat termenul „text” de câteva ori, veți începe să aveți impresia că mergeți în cercuri, așa că încercați sinonime diferite.
De exemplu, în loc de „text”, puteți încerca:
Titlu
Alfabet
Cuvânt scris
Simbol
Dacă niciuna dintre acestea nu funcționează, continuați să încercați alternative. Ceea ce funcționează și ce nu funcționează poate varia în funcție de ceea ce încercați să creați. De exemplu, probabil că nu ați folosi „simbol” dacă ați încerca să proiectați o felicitare de ziua de naștere. Experimentarea cu diferite idei prompte AI este cheia aici, iar diferite instrumente pot funcționa în moduri diferite.
3. Adăugați text folosind instrumentele de înlocuire
Nu ar trebui să adăugați text prin instrumentele de înlocuire dacă cuvintele ar trebui să facă parte din imagine, dar este o idee bună dacă încercați să creați mai multe grafice. Va funcționa dacă doriți să proiectați un card, o grafică, o copertă de carte sau ceva similar.
Dacă intenționați să faceți acest lucru, asigurați-vă că există suficient spațiu în imagine. Puteți folosi orice instrument pe care doriți să adăugați text la imaginea dvs. Canva sau Adobe Photoshop Express sunt opțiuni recomandate, dar alte aplicații care vă permit să adăugați text la imagini de pe smartphone-ul dvs. vor funcționa și cu conținutul pe care îl creați folosind AI.
De asemenea, ar trebui să vă asigurați că textul se potrivește cu imaginea generată de AI. Folosiți fonturi care se potrivesc cu starea de spirit pe care încercați să o transmiteți și remodelați lucrurile așa cum simțiți că este necesar.
4. Păstrați textul scurt
Generarea textului imaginilor AI eșuează adesea pentru că încercați să adăugați prea mult text. Sincer, acest lucru se întâmplă ori de câte ori încercați să creați ceva mai lung de 10 caractere. Similar cu recomandarea de a păstra imaginile simple, ar trebui să faceți tot ce puteți pentru a păstra textul scurt.
Pentru a testa acest lucru, autorul a încercat o altă solicitare:
Vă rugăm să generați o imagine a unei bănci cu textul „bank” în exterior. Îmi doresc să fie într-o zonă centrală a orașului și o structură modernă, ca ceea ce ați vedea într-un oraș din SUA.
Traducere brută : Faceți o imagine a unei bănci cu cuvântul „bank” în exterior. Am vrut să fie în centrul orașului și să aibă o structură modernă, ca ceea ce ai vedea într-un oraș american.
După cum puteți vedea mai jos, motorul AI a făcut o treabă destul de bună de a asculta utilizatorul. Cu toate acestea, există unele erori într-o parte a imaginii. Așa că spuneți AI că doriți doar unul sau două semne pentru a limita șansa ca acest lucru să se întâmple. Aceste probleme par să apară și atunci când textul este mai mic, așa că rețineți asta.
Imagine de clădire modernă creată în DALL-E
5. Utilizați instrumente pentru a corecta erorile de text
Similar cu modul în care puteți elimina defectele din fotografiile realizate cu camera dvs., puteți încerca să utilizați un instrument care vă ajută să remediați erorile de text din fotografii. Există multe aplicații care remediază galimatia în fotografiile generate de AI, cum ar fi Storia Lab.
Eroare instrument Storia Lab AI Textify
Când utilizați aceste instrumente, de obicei puteți selecta text și modifica conținutul după caz. Unele aplicații sunt gratuite, dar în alte cazuri veți avea nevoie de un abonament plătit. Dacă creați o mulțime de imagini cu AI, puteți cumpăra un plan lunar sau anual pentru a-l accesa oricând aveți nevoie.
6. Folosiți instrumente AI pentru a genera text corect
Poate că ați auzit de Midjourney , DALL-E, Firefly și generatoare de imagini similare AI. Dar știați că există generatoare de artă AI specifice care generează text precis în imagini?
Deoarece una dintre caracteristicile de specialitate ale Ideogram este crearea de text care poate fi citit, cu siguranță puteți încerca această aplicație pentru unele dintre creațiile dvs. Ideogram are o funcție Magic Prompt care extinde caracteristica originală, ceea ce înseamnă că puteți obține rezultate și mai precise. Pe lângă planul gratuit, planurile de abonament plătite încep de la 8 USD/lună.
Deși AI are deficiențele sale în crearea de imagini cu text care poate fi citit, veți găsi câteva alternative dacă sunteți dispus să gândiți în afara casetei. Uneori, cea mai bună opțiune este să oferi instrumentului tău solicitări detaliate, care sunt mai puțin pronunțate de procesat. De asemenea, este posibil să doriți să remediați problemele din imaginile dvs. cu alt software sau să utilizați instrumente special concepute pentru a crea text precis.