Meta lansează Llama 4: LLM multimodal suprem
Această serie include trei versiuni: Llama 4 Scout, Llama 4 Maverick și Llama 4 Behemoth.
La începutul lui aprilie 2025, Meta a lansat Llama 4 , cea mai recentă serie de modele AI concepute pentru a duce compania la următorul nivel. Fiecare nou model Llama 4 are îmbunătățiri semnificative față de predecesorii săi, iar acestea sunt noile caracteristici remarcabile de încercat.
3. Arhitectura Mixture of Experts (MoE).
Una dintre cele mai notabile caracteristici ale modelelor Llama 4 este noua arhitectură MoE, o premieră pentru seria Llama, care utilizează o abordare diferită față de modelele anterioare. În noua arhitectură, doar o mică parte din parametrii modelului sunt activate pentru fiecare jeton, spre deosebire de modelele tradiționale de transformatoare dense precum Llama 3 și mai jos, unde toți parametrii sunt activați pentru fiecare sarcină.
De exemplu, Llama 4 Maverick folosește doar 17 miliarde de parametri activi din 400 de miliarde, cu 128 de experți direcționați și un expert partajat. Llama 4 Scout, cel mai mic din serie, are un total de 109 miliarde de parametri, activând doar 17 miliarde cu 16 experți.
Cea mai mare versiune a trio-ului, Llama 4 Behemoth, folosește 288 de miliarde de parametri activi (cu 16 experți) dintr-un total de aproape două trilioane de parametri. Datorită acestei noi arhitecturi, doar doi specialiști sunt alocați fiecărei sarcini.
Datorită schimbării arhitecturale, modelele din seria Llama 4 sunt mai eficiente din punct de vedere computațional în timpul antrenamentului și inferenței. Activarea doar a unei mici porțiuni de parametri reduce costurile serviciului și latența. Datorită arhitecturii MoE, Meta susține că Llama poate rula pe un singur GPU Nvidia H100, o performanță impresionantă având în vedere numărul de parametri. Deși nu există valori specifice, se crede că fiecare interogare către ChatGPT utilizează mai multe GPU-uri Nvidia, ceea ce creează o suprasarcină mai mare în aproape fiecare măsurătoare măsurabilă.
2. Capacități native de procesare multimodală
O altă actualizare importantă a modelelor Llama 4 AI este procesarea multimodală nativă, ceea ce înseamnă că trio-ul poate înțelege textul și imaginile simultan.
Acest lucru se datorează combinației efectuate în faza de instruire inițială, unde textul și simbolurile vizuale sunt integrate într-o arhitectură unificată. Modelele sunt antrenate folosind cantități mari de date neetichetate text, imagini și video.
Nu este mai bine decât asta. Dacă vă amintiți, upgrade-ul Meta Llama 3.2 , lansat în septembrie 2024, a introdus o serie de modele noi (10 în total), inclusiv 5 modele de viziune multimodală și 5 modele text. Cu această generație, compania nu are nevoie să lanseze modele separate de text și viziune datorită capabilităților native de procesare multimodală.
În plus, Llama 4 folosește un encoder vizual îmbunătățit, permițând modelelor să gestioneze sarcini complexe de inferență vizuală și intrări cu mai multe imagini, făcându-le capabile să gestioneze aplicații care necesită înțelegere avansată a textului și imaginilor. Procesarea multimodală permite, de asemenea, ca modelele LLama 4 să fie utilizate într-o varietate de aplicații.
1. Fereastra contextuală lider în industrie
Modelele AI ale lui Llama 4 se laudă cu o fereastră contextuală fără precedent de până la 10 milioane de jetoane. În timp ce Llama 4 Behemoth este încă în dezvoltare la momentul publicării, Llama 4 Scout a stabilit un nou standard de referință în industrie, cu capacitatea sa de a suporta până la 10 milioane de jetoane în lungime de context, permițându-vă să introduceți text mai lung de 5 milioane de cuvinte.
Această lungime extinsă a contextului este o creștere semnificativă față de jetoanele de 8k ale Llama 3 când a fost lansat pentru prima dată și chiar extinderea ulterioară la 128k după actualizarea Llama 3.2. Și nu este interesant doar lungimea contextului de 10 milioane a lui Llama 4 Scout; Chiar și Llama 4 Maverick, cu lungimea de un milion de contexte, este o performanță impresionantă.
Llama 3.2 este în prezent unul dintre cei mai buni chatbot AI pentru conversații extinse. Cu toate acestea, fereastra de context extinsă a lui Llama 4 o pune pe Llama în frunte, depășind fereastra anterioară de top 2 milioane de token a Gemini, 200K a lui Claude 3.7 Sonnet și 128K a lui GPT-4.5.
Cu o fereastră de context mare, seria Llama 4 poate gestiona sarcini care necesită introducere cu cantități uriașe de informații. Această fereastră mare este utilă pentru sarcini precum analizarea documentelor lungi și multiple, analizarea în detaliu a bazelor mari de coduri și raționamentul pe seturi mari de date.
De asemenea, permite lui Llama 4 să poarte conversații extinse, spre deosebire de modelele anterioare Llama și modelele de la alte companii AI. Dacă unul dintre motivele pentru care Gemini 2.5 Pro este cel mai bun model de raționament este fereastra de context mare, vă puteți imagina cât de puternică este o fereastră de context 5x sau 10x.
Modelele Llama din seria 3 de la Meta au fost unele dintre cele mai bune LLM-uri de pe piață. Dar, odată cu lansarea seriei Llama 4, Meta face lucrurile cu un pas mai departe, concentrându-se nu numai pe performanța îmbunătățită a inferenței (mulțumită noii ferestre de context lider în industrie), ci și asigurând cele mai eficiente modele posibile prin utilizarea unei noi arhitecturi MoE atât în timpul instruirii, cât și al inferenței.
Capacitățile native de procesare multimodală ale Llama 4, arhitectura eficientă MoE și fereastra de context mare îl poziționează ca un model AI deschis, de înaltă performanță, flexibil, ponderat în funcție de greutate, care poate concura sau depăși modelele de vârf pentru inferență, codare și multe alte sarcini.
Studenții au nevoie de un anumit tip de laptop pentru studiile lor. Acesta nu ar trebui să fie doar suficient de puternic pentru a performa bine la specializarea aleasă, ci și suficient de compact și ușor pentru a fi transportat toată ziua.
Adăugarea unei imprimante la Windows 10 este simplă, deși procesul pentru dispozitivele cu fir va fi diferit față de cel pentru dispozitivele fără fir.
După cum știți, memoria RAM este o componentă hardware foarte importantă a unui computer, acționând ca memorie pentru procesarea datelor și fiind factorul care determină viteza unui laptop sau PC. În articolul de mai jos, WebTech360 vă va prezenta câteva modalități de a verifica erorile de RAM folosind software pe Windows.
Televizoarele inteligente au luat cu adevărat lumea cu asalt. Cu atât de multe funcții grozave și conectivitate la internet, tehnologia a schimbat modul în care ne uităm la televizor.
Frigiderele sunt aparate cunoscute în gospodării. Frigiderele au de obicei 2 compartimente, compartimentul cool este spatios si are o lumina care se aprinde automat de fiecare data cand utilizatorul il deschide, in timp ce compartimentul congelator este ingust si nu are lumina.
Rețelele Wi-Fi sunt afectate de mulți factori, dincolo de routere, lățime de bandă și interferențe, dar există câteva modalități inteligente de a vă îmbunătăți rețeaua.
Dacă doriți să reveniți la iOS 16 stabil pe telefonul dvs., iată ghidul de bază pentru dezinstalarea iOS 17 și downgrade de la iOS 17 la 16.
Iaurtul este un aliment minunat. Este bine să mănânci iaurt în fiecare zi? Când mănânci iaurt în fiecare zi, cum se va schimba corpul tău? Să aflăm împreună!
Acest articol discută cele mai hrănitoare tipuri de orez și cum să maximizați beneficiile pentru sănătate ale orezului pe care îl alegeți.
Stabilirea unui program de somn și a rutinei de culcare, schimbarea ceasului cu alarmă și ajustarea dietei sunt câteva dintre măsurile care vă pot ajuta să dormiți mai bine și să vă treziți la timp dimineața.
Inchiriez va rog! Landlord Sim este un joc mobil de simulare pe iOS și Android. Veți juca ca proprietarul unui complex de apartamente și veți începe să închiriați un apartament cu scopul de a îmbunătăți interiorul apartamentelor și de a le pregăti pentru chiriași.
Obțineți codul de joc Roblox Bathroom Tower Defense și răscumpărați pentru recompense interesante. Ele vă vor ajuta să faceți upgrade sau să deblocați turnuri cu daune mai mari.
Să învățăm despre structura, simbolurile și principiile de funcționare ale transformatoarelor în cel mai precis mod.
De la o calitate mai bună a imaginii și a sunetului la controlul vocal și multe altele, aceste funcții bazate pe inteligență artificială fac televizoarele inteligente mult mai bune!
Inițial, oamenii aveau mari speranțe în DeepSeek. Fiind un chatbot AI comercializat ca un concurent puternic pentru ChatGPT, acesta promite capacități și experiențe inteligente de chat.