Grupul tehnologic chinez Alibaba tocmai a anunțat un nou model AI numit QVQ-Max din seria Qwen, marcând o descoperire în domeniul AI multimedia. Caracteristica specială a acestui model este capacitatea de a analiza conținut imagine/video, apoi de a formula argumente și soluții pe baza informațiilor obținute.
Abilitatea impresionantă
QVQ-Max este descris de Alibaba ca o punte între modelele AI bazate pe text pur și lumea reală. Cu capacități de raționament vizual, sistemul poate:
- Analizați imaginile și identificați elementele cheie
- Aplicație versatilă în multe domenii, de la proiectarea ilustrației, crearea de scenarii video până la interpretarea personajelor
- Rezolvarea problemelor cu diagrame (matematică, fizică)
- Instrucțiuni de gătit pas cu pas pe baza imaginilor rețetei
Alibaba spune că modelul ajută la reducerea decalajului dintre AI care procesează doar text și informații din lumea reală. Datorită capacității sale de raționament vizual, QVQ-Max poate „vedea, înțelege și gândi” despre lumea din jurul său. Compania pune accent pe modelul său superior în analiza imaginii, identificând elementele cheie și flexibilitatea în aplicarea în multe domenii precum designul ilustrației, crearea de scenarii video sau jocul de rol.

La fel ca și alți chatbot-uri AI, QVQ-Max sprijină munca, educația și viața personală, dar datorită integrării vizuale rezolvă și sarcini mai specifice precum: rezolvarea problemelor de matematică/fizică cu diagrame, instrucțiuni de gătit prin imagini cu rețete.
Alibaba consideră QVQ-Max a fi prima versiune și a schițat o foaie de parcurs de upgrade pentru versiunile ulterioare. În primul rând, au dorit să îmbunătățească acuratețea recunoașterii imaginii folosind tehnici de împământare. În al doilea rând, modelul va fi optimizat pentru a gestiona multitasking și probleme complexe, cum ar fi lucrul cu telefoane, computere sau jocuri. În cele din urmă, Alibaba intenționează să se extindă de la interacțiunea text la verificarea instrumentelor și crearea de conținut de imagine.
Utilizatorii pot experimenta QVQ-Max prin:
- Vizitați chat.qwen.ai
- Selectați meniul model din colțul din stânga → „ Extindeți mai multe modele ”
- Selectați QVQ-Max și începeți să conversați
- Atașați fișiere imagine pentru a explora capabilitățile de procesare AI
Odată cu lansarea QVQ-Max, Alibaba continuă să-și afirme poziția în cursa pentru dezvoltarea AI multimedia, concurând direct cu giganții tehnologici globali. Modelul promite să aducă aplicații practice în muncă, educație și viața personală.