Alibaba lansează modelul de raționament vizual QVQ-Max: poate vedea, înțelege și gândi

Grupul tehnologic chinez Alibaba tocmai a anunțat un nou model AI numit QVQ-Max din seria Qwen, marcând o descoperire în domeniul AI multimedia. Caracteristica specială a acestui model este capacitatea de a analiza conținut imagine/video, apoi de a formula argumente și soluții pe baza informațiilor obținute.

Abilitatea impresionantă

QVQ-Max este descris de Alibaba ca o punte între modelele AI bazate pe text pur și lumea reală. Cu capacități de raționament vizual, sistemul poate:

  • Analizați imaginile și identificați elementele cheie
  • Aplicație versatilă în multe domenii, de la proiectarea ilustrației, crearea de scenarii video până la interpretarea personajelor
  • Rezolvarea problemelor cu diagrame (matematică, fizică)
  • Instrucțiuni de gătit pas cu pas pe baza imaginilor rețetei

Alibaba spune că modelul ajută la reducerea decalajului dintre AI care procesează doar text și informații din lumea reală. Datorită capacității sale de raționament vizual, QVQ-Max poate „vedea, înțelege și gândi” despre lumea din jurul său. Compania pune accent pe modelul său superior în analiza imaginii, identificând elementele cheie și flexibilitatea în aplicarea în multe domenii precum designul ilustrației, crearea de scenarii video sau jocul de rol.

Alibaba lansează modelul de raționament vizual QVQ-Max: poate vedea, înțelege și gândi

La fel ca și alți chatbot-uri AI, QVQ-Max sprijină munca, educația și viața personală, dar datorită integrării vizuale rezolvă și sarcini mai specifice precum: rezolvarea problemelor de matematică/fizică cu diagrame, instrucțiuni de gătit prin imagini cu rețete.

Alibaba consideră QVQ-Max a fi prima versiune și a schițat o foaie de parcurs de upgrade pentru versiunile ulterioare. În primul rând, au dorit să îmbunătățească acuratețea recunoașterii imaginii folosind tehnici de împământare. În al doilea rând, modelul va fi optimizat pentru a gestiona multitasking și probleme complexe, cum ar fi lucrul cu telefoane, computere sau jocuri. În cele din urmă, Alibaba intenționează să se extindă de la interacțiunea text la verificarea instrumentelor și crearea de conținut de imagine.

Utilizatorii pot experimenta QVQ-Max prin:

  1. Vizitați chat.qwen.ai
  2. Selectați meniul model din colțul din stânga → „ Extindeți mai multe modele
  3. Selectați QVQ-Max și începeți să conversați
  4. Atașați fișiere imagine pentru a explora capabilitățile de procesare AI

Odată cu lansarea QVQ-Max, Alibaba continuă să-și afirme poziția în cursa pentru dezvoltarea AI multimedia, concurând direct cu giganții tehnologici globali. Modelul promite să aducă aplicații practice în muncă, educație și viața personală.

Sign up and earn $1000 a day ⋙

Leave a Comment

Modul în care muzica stimulează creierul

Modul în care muzica stimulează creierul

Majoritatea oamenilor știu că muzica nu este doar pentru divertisment, ci are mult mai multe beneficii decât atât. Iată câteva modalități prin care muzica ne stimulează dezvoltarea creierului.

Cele mai frecvente deficiențe nutritive din dietă

Cele mai frecvente deficiențe nutritive din dietă

Dieta este foarte importantă pentru sănătatea noastră. Cu toate acestea, majoritatea dietelor noastre sunt adesea lipsite de acești șase nutrienți importanți.

Cum să utilizați aplicația CK Club de la Circle K pentru a primi oferte atractive

Cum să utilizați aplicația CK Club de la Circle K pentru a primi oferte atractive

Pentru a obține cele mai rapide informații promoționale de la Circle K, ar trebui să instalați aplicația CK Club. Aplicația salvează plățile la cumpărături sau la plata la Circle K, precum și numărul de timbre colectate.

Instagram va permite rulouri de până la 3 minute

Instagram va permite rulouri de până la 3 minute

Instagram tocmai a anunțat că va permite utilizatorilor să posteze videoclipuri Reels cu o durată de până la 3 minute, dublu față de limita anterioară de 90 de secunde.

Cum să vizualizați informațiile despre procesorul Chromebookului

Cum să vizualizați informațiile despre procesorul Chromebookului

Acest articol vă va ghida cum să vizualizați informațiile CPU, să verificați viteza procesorului direct pe Chromebook.

8 lucruri interesante pe care le poți face cu o veche tabletă Android

8 lucruri interesante pe care le poți face cu o veche tabletă Android

Dacă nu doriți să vindeți sau să oferiți vechea tabletă, o puteți utiliza în 5 moduri: ca ramă foto de înaltă calitate, player muzical, cititor de cărți electronice și reviste, asistent pentru treburile casnice și ca ecran secundar.

Cum să obții rapid unghii frumoase

Cum să obții rapid unghii frumoase

Vrei să ai rapid unghii frumoase, strălucitoare și sănătoase. Aceste sfaturi simple pentru unghii frumoase de mai jos vă vor fi utile.

Secretele de inspirație a culorilor doar designerii le cunosc

Secretele de inspirație a culorilor doar designerii le cunosc

Acest articol va enumera sfaturi inspirate de culori, împărtășite de designeri de top din comunitatea Creative Market, astfel încât să puteți obține combinația perfectă de culori de fiecare dată.

Tot ce aveți nevoie pentru a vă înlocui laptopul cu un telefon

Tot ce aveți nevoie pentru a vă înlocui laptopul cu un telefon

Îți poți înlocui cu adevărat laptopul cu telefonul? Da, dar veți avea nevoie de accesoriile potrivite pentru a vă transforma telefonul într-un laptop.

ChatGPT va putea în curând să vadă tot ce se întâmplă pe ecranul tău

ChatGPT va putea în curând să vadă tot ce se întâmplă pe ecranul tău

Un lucru important în videoclipul complet al evenimentului este că viitoarea caracteristică a aplicației ChatGPT a fost demonstrată, dar nu au fost distribuite detalii reale. Este capacitatea ChatGPT de a vedea tot ce se întâmplă pe ecranul dispozitivului utilizatorului.

AI învață să păcălească oamenii, în ciuda faptului că este antrenat să fie sincer

AI învață să păcălească oamenii, în ciuda faptului că este antrenat să fie sincer

Multe IA de top, în ciuda faptului că sunt antrenate să fie sincere, învață să înșele prin antrenament și îi induc sistematic pe utilizatori la convingeri false, arată un nou studiu.

Cum să schimbi întrebările pe ChatGPT

Cum să schimbi întrebările pe ChatGPT

ChatGPT are acum o opțiune de schimbare a întrebării, astfel încât utilizatorii să poată edita întrebarea sau conținutul pe care îl schimbă cu ChatGPT.

Cum să descoperiți codurile QR false și să vă păstrați datele în siguranță

Cum să descoperiți codurile QR false și să vă păstrați datele în siguranță

Codurile QR par destul de inofensive până când scanezi un cod QR prost și primești ceva urât în ​​sistemul tău. Dacă doriți să vă păstrați telefonul și datele în siguranță, există câteva moduri prin care puteți identifica codurile QR false.

Qualcomm lansează modemul X85 5G cu o serie de îmbunătățiri notabile

Qualcomm lansează modemul X85 5G cu o serie de îmbunătățiri notabile

Pe scena de la MWC 2025, Qualcomm a făcut furori când a introdus cea de-a opta generație de modem 5G numit X85, care se așteaptă să fie folosit în smartphone-urile emblematice care vor fi lansate în cursul acestui an.

Noua tehnologie permite telefoanelor să-și schimbe culoarea în mod flexibil

Noua tehnologie permite telefoanelor să-și schimbe culoarea în mod flexibil

Ai un iPhone 16 la modă „Ultramarine”, dar într-o bună zi te simți brusc plictisit de acea culoare; Ce vei face?