Există o serie de instrumente AI de text în video și, deși tehnologia este cu adevărat impresionantă, există întotdeauna ceva despre rezultatul final care se simte neplăcut. A durat ceva timp pentru a identifica problema, dar totul s-a rezumat în cele din urmă la un singur lucru: efectul de vale uriașă.
Deși puteți folosi unele instrumente bazate pe inteligență artificială pentru a crea efecte vizuale în proiectele dvs. video, nu este recomandat să utilizați inteligența artificială singur pentru a crea materiale video, deoarece arată prea ciudat.
Cea mai mare problemă cu instrumentele AI Text-to-Video
Generarea de videoclipuri AI a parcurs un drum lung într-o perioadă scurtă de timp datorită progreselor în domeniul învățării profunde. În 2023, când generația de videoclipuri AI explodează, s-ar putea să vă amintiți că acest clip cu Will Smith mâncând spaghete a devenit viral. Deși acest tip de tehnologie era revoluționar la acea vreme, nu se poate nega cât de nefiresc și incomod arăta.
În 2024, aceste instrumente de modelare video AI sunt din ce în ce mai bune, creând imagini mai fine și mișcări mai realiste. Priviți diferența dintre videoclipurile create cu Runway Gen-2 în 2023 și videoclipurile OpenAI lansate în 2024 pentru a prezenta Sora AI. Sora nu este încă disponibilă pentru uz public, dar calitatea pare promițătoare:
Deși s-au îmbunătățit, rezultatele sunt încă neconcludente. În primul rând, Sora nu este încă disponibilă pentru utilizare, așa că suntem încă blocați cu generatoare mai puțin sofisticate care pot produce rezultate înfiorătoare precum videoclipul cu spaghete al lui Will Smith.
Vizionați videoclipul creat cu PixVerse folosind promptul „O persoană care se plimbă printr-un parc într-o zi însorită, zâmbind și făcând semn cu mâna camerei. Păsările zboară deasupra capului, iar copacii se leagănă ușor în briză” . (Traducere grosieră: „O persoană se plimbă printr-un parc într-o zi însorită, zâmbind și făcând cu mâna camerei. Păsările zboară deasupra capului și copacii se leagănă ușor în vânt”).
Primele două secunde arată bine, până când degetele, părul și fața persoanei încep să dispară în aer! Chiar dacă instrumente mai avansate precum Sora apar și ne oferă videoclipuri mai precise și mai frumoase, există încă ceva neliniștitor în ceea ce privește oamenii și peisajele generate de AI.
În timp ce modelele mai vechi au produs adesea videoclipuri care arătau în mod clar inteligența artificială, cum ar fi imaginile în stil argilă, îmbunătățirile de la instrumentele mai noi par aproape prea perfecte.
Nefiresc, inconfortabil și lipsit de viață. Acesta este exact efectul de vale uriaș - asemănător omului, dar nu chiar.
Indiferent cât de bune ar fi aceste instrumente, efectul de vale uriașă există întotdeauna. Cu excepția cazului în care optați pentru un stil abstract, suprarealist, care se vede doar în vise, nu ar trebui să vă bazați pe instrumentele AI text-to-video pentru niciunul dintre proiectele dvs. video.