OpenAI tocmai a introdus oficial o actualizare remarcabilă a capacității de generare de imagini AI în ChatGPT, un pas important înainte în loc să utilizeze un model separat de generare de imagini precum DALL-E anterior. Această nouă caracteristică a fost integrată direct în GPT-4o, aducând îmbunătățiri semnificative.
Depășirea limitărilor inerente
În timp ce multe modele actuale de generare de imagini AI pot crea imagini artistice impresionante, ele se luptă adesea cu elemente precum textul, logo-urile sau obiectele de zi cu zi. OpenAI susține că noul GPT-4o poate depăși aceste limitări datorită capacității sale de a:
- Afișează textul corect
- Respectați cu strictețe cerințele utilizatorului
- Valorificați cunoștințele de bază și contextul conversațional
- Permite editarea fotografiilor încărcate sau crearea de fotografii noi bazate pe fotografiile originale
- Disponibil pe scară largă
Această nouă funcție este în prezent implementată pentru utilizatorii ChatGPT Free, ChatGPT Plus, Pro și Team și va fi disponibilă pe ChatGPT Enterprise și Edu în săptămânile următoare. În special, acesta va fi instrumentul implicit de creare a imaginilor în ChatGPT, facilitând accesul utilizatorilor fără opțiuni suplimentare. Utilizatorii pot personaliza fotografiile cu:
- Raport de aspect specific
- Culoare exactă (folosind codul hexadecimal)
- Fundal transparent
- Suport multi-platformă

Pe lângă ChatGPT, această caracteristică va fi disponibilă și pe platforme, inclusiv Sora (generare de imagini), DALL·E GPT dedicat și GPT-4o API (pentru dezvoltatori, care se lansează în săptămânile următoare).
În ciuda promisiunii sale de multe îmbunătățiri, noul model are încă câteva limitări:
- Timpul de generare a imaginii poate fi de până la 1 minut datorită detaliilor ridicate
- Decuparea nedorită cu fotografii verticale
- Uneori, „fabricați” informații cu puțin context necesar
- Dificultate în procesarea a mai mult de 10-20 de concepte simultan
- Dificultate cu limbile non-latine
- Corecțiile detaliate (cum ar fi greșelile de ortografie) nu sunt foarte eficiente
- Este dificil de afișat informații detaliate la dimensiuni mici
Toate imaginile generate de GPT-4o vor conține metadate C2PA, permițând verificarea provenienței utilizând instrumentele interne ale OpenAI.
În ciuda unor limitări, GPT-4o promite să ofere imagini mai precise și personalizabile. OpenAI spune că va continua să îmbunătățească modelul în următoarele luni, deschizând noi posibilități pentru crearea de conținut vizual bazat pe inteligență artificială.
Cu această actualizare majoră, OpenAI continuă să-și consolideze liderul în cursa creativă AI, oferind o experiență mai fluidă și mai puternică utilizatorilor pe mai multe platforme.