Meta lansează Llama 4: LLM multimodal suprem
Această serie include trei versiuni: Llama 4 Scout, Llama 4 Maverick și Llama 4 Behemoth.
La începutul lui aprilie 2025, Meta a lansat Llama 4 , cea mai recentă serie de modele AI concepute pentru a duce compania la următorul nivel. Fiecare nou model Llama 4 are îmbunătățiri semnificative față de predecesorii săi, iar acestea sunt noile caracteristici remarcabile de încercat.
3. Arhitectura Mixture of Experts (MoE).
Una dintre cele mai notabile caracteristici ale modelelor Llama 4 este noua arhitectură MoE, o premieră pentru seria Llama, care utilizează o abordare diferită față de modelele anterioare. În noua arhitectură, doar o mică parte din parametrii modelului sunt activate pentru fiecare jeton, spre deosebire de modelele tradiționale de transformatoare dense precum Llama 3 și mai jos, unde toți parametrii sunt activați pentru fiecare sarcină.
De exemplu, Llama 4 Maverick folosește doar 17 miliarde de parametri activi din 400 de miliarde, cu 128 de experți direcționați și un expert partajat. Llama 4 Scout, cel mai mic din serie, are un total de 109 miliarde de parametri, activând doar 17 miliarde cu 16 experți.
Cea mai mare versiune a trio-ului, Llama 4 Behemoth, folosește 288 de miliarde de parametri activi (cu 16 experți) dintr-un total de aproape două trilioane de parametri. Datorită acestei noi arhitecturi, doar doi specialiști sunt alocați fiecărei sarcini.
Datorită schimbării arhitecturale, modelele din seria Llama 4 sunt mai eficiente din punct de vedere computațional în timpul antrenamentului și inferenței. Activarea doar a unei mici porțiuni de parametri reduce costurile serviciului și latența. Datorită arhitecturii MoE, Meta susține că Llama poate rula pe un singur GPU Nvidia H100, o performanță impresionantă având în vedere numărul de parametri. Deși nu există valori specifice, se crede că fiecare interogare către ChatGPT utilizează mai multe GPU-uri Nvidia, ceea ce creează o suprasarcină mai mare în aproape fiecare măsurătoare măsurabilă.
2. Capacități native de procesare multimodală
O altă actualizare importantă a modelelor Llama 4 AI este procesarea multimodală nativă, ceea ce înseamnă că trio-ul poate înțelege textul și imaginile simultan.
Acest lucru se datorează combinației efectuate în faza de instruire inițială, unde textul și simbolurile vizuale sunt integrate într-o arhitectură unificată. Modelele sunt antrenate folosind cantități mari de date neetichetate text, imagini și video.
Nu este mai bine decât asta. Dacă vă amintiți, upgrade-ul Meta Llama 3.2 , lansat în septembrie 2024, a introdus o serie de modele noi (10 în total), inclusiv 5 modele de viziune multimodală și 5 modele text. Cu această generație, compania nu are nevoie să lanseze modele separate de text și viziune datorită capabilităților native de procesare multimodală.
În plus, Llama 4 folosește un encoder vizual îmbunătățit, permițând modelelor să gestioneze sarcini complexe de inferență vizuală și intrări cu mai multe imagini, făcându-le capabile să gestioneze aplicații care necesită înțelegere avansată a textului și imaginilor. Procesarea multimodală permite, de asemenea, ca modelele LLama 4 să fie utilizate într-o varietate de aplicații.
1. Fereastra contextuală lider în industrie
Modelele AI ale lui Llama 4 se laudă cu o fereastră contextuală fără precedent de până la 10 milioane de jetoane. În timp ce Llama 4 Behemoth este încă în dezvoltare la momentul publicării, Llama 4 Scout a stabilit un nou standard de referință în industrie, cu capacitatea sa de a suporta până la 10 milioane de jetoane în lungime de context, permițându-vă să introduceți text mai lung de 5 milioane de cuvinte.
Această lungime extinsă a contextului este o creștere semnificativă față de jetoanele de 8k ale Llama 3 când a fost lansat pentru prima dată și chiar extinderea ulterioară la 128k după actualizarea Llama 3.2. Și nu este interesant doar lungimea contextului de 10 milioane a lui Llama 4 Scout; Chiar și Llama 4 Maverick, cu lungimea de un milion de contexte, este o performanță impresionantă.
Llama 3.2 este în prezent unul dintre cei mai buni chatbot AI pentru conversații extinse. Cu toate acestea, fereastra de context extinsă a lui Llama 4 o pune pe Llama în frunte, depășind fereastra anterioară de top 2 milioane de token a Gemini, 200K a lui Claude 3.7 Sonnet și 128K a lui GPT-4.5.
Cu o fereastră de context mare, seria Llama 4 poate gestiona sarcini care necesită introducere cu cantități uriașe de informații. Această fereastră mare este utilă pentru sarcini precum analizarea documentelor lungi și multiple, analizarea în detaliu a bazelor mari de coduri și raționamentul pe seturi mari de date.
De asemenea, permite lui Llama 4 să poarte conversații extinse, spre deosebire de modelele anterioare Llama și modelele de la alte companii AI. Dacă unul dintre motivele pentru care Gemini 2.5 Pro este cel mai bun model de raționament este fereastra de context mare, vă puteți imagina cât de puternică este o fereastră de context 5x sau 10x.
Modelele Llama din seria 3 de la Meta au fost unele dintre cele mai bune LLM-uri de pe piață. Dar, odată cu lansarea seriei Llama 4, Meta face lucrurile cu un pas mai departe, concentrându-se nu numai pe performanța îmbunătățită a inferenței (mulțumită noii ferestre de context lider în industrie), ci și asigurând cele mai eficiente modele posibile prin utilizarea unei noi arhitecturi MoE atât în timpul instruirii, cât și al inferenței.
Capacitățile native de procesare multimodală ale Llama 4, arhitectura eficientă MoE și fereastra de context mare îl poziționează ca un model AI deschis, de înaltă performanță, flexibil, ponderat în funcție de greutate, care poate concura sau depăși modelele de vârf pentru inferență, codare și multe alte sarcini.
Configurația Wuthering Waves a fost anunțată oficial de editorul jocului, în care jucătorii trebuie să aibă cel puțin GTX 1060 sau mai mare.
Aplicația calculator de pe telefonul dvs. Samsung are un calculator de bacșiș și vă poate ajuta să împărțiți factura cu alții. Astfel, nu trebuie să o faci singur și poți evita jena de a calcula greșit suma din capul tău.
Există multe editoare foto AI care fac din Photoshop o a doua alegere, iar funcțiile AI sunt instrumente utile pentru editarea fotografiilor fără a fi nevoie să învețe Photoshop complex.
Cu opțiunea de a ajusta permisiunile camerei pe Microsoft Edge, utilizatorii pot schimba cu ușurință opțiunile pentru site-uri web, asigurând astfel mai multă confidențialitate.
Bilgewater adaugă în mod clar câțiva campioni interesanți la Teamfight Tactics sezonul 9.5.
Folosirea unui laptop cu un monitor extern este o combinație excelentă pentru productivitate și pentru a vă ajuta să lucrați. Dar, în timp, vei descoperi că laptopul tău se epuizează brusc rapid și durata de viață a bateriei începe să scadă.
Nu se poate nega că telefoanele pliabile sunt destul de cool. Dar după un timp de utilizare, există destul de multe ciudații cu acest dispozitiv. Iată 5 dezavantaje majore ale telefoanelor cu ecran pliabil la care nu te-ai aștepta!
Adobe a adus tehnologia de creație video AI către mase într-un mod nou, deși încă nu a creat un film terminat folosind tehnologia.
Codul Genshin Impact 5.5 vă ajută să faceți schimb de pietre primordiale, minerale magice, experiență și multe alte recompense.
macOS Catalina și iPadOS includ suport pentru o nouă funcție numită Sidecar, concepută pentru a vă permite să utilizați iPad-ul ca afișaj secundar pentru Mac.
Acesta este un set de imagini de fundal pentru Nokia 1280, dacă ați trimis vreodată mesaje text pentru a obține imagini de fundal 1280, imagini de fundal pentru telefon din cărămidă, atunci încercați să vă uitați la aceste imagini de fundal.
Venus Aerospace a dezvăluit primele imagini cu noul său avion hipersonic numit Stargazer, care poate atinge o viteză maximă de 11.115 km/h, echivalent cu Mach 9.
Balonarea se poate întâmpla oricui. Vestea bună este că micul dejun este un moment grozav pentru a adăuga câteva ingrediente la masă care vă vor ajuta la reducerea balonării. Acel ingredient este banana.
OpenAI tocmai a introdus oficial o actualizare remarcabilă a capacității de generare de imagini AI în ChatGPT, un pas important înainte în loc să utilizeze un model separat de generare de imagini precum DALL-E anterior.
Startup-ul chinezesc AI DeepSeek tocmai a lansat oficial cel mai recent model de limbă mare (LLM), DeepSeek-V3-0324.