Cerebras lansează cea mai rapidă tehnologie de inferență AI din lume, performanță de 20 ori mai mare decât NVIDIA

Cerebras Systems tocmai a anunțat oficial Cerebras Inference, care este considerată cea mai rapidă soluție de inferență AI din lume. Această Cerebras Inference oferă performanțe de până la 1.800 de jetoane pe secundă pentru modelele Llama 3.1 8B (8 miliarde de parametri) și 450 de jetoane pe secundă pentru Llama 3.1 70B, ceea ce este de aproape 20 de ori mai rapid decât soluțiile de inferență AI bazate pe GPU NVIDIA, inclusiv soluțiile de inferență AI bazate pe GPU-uri NVIDIA, inclusiv soluțiile de inferență AI la scară largă Microsoft Azure.

Pe lângă performanța sa incredibilă, prețul serviciului acestei noi soluții de inferență este, de asemenea, foarte ieftin, la o fracțiune din prețul platformelor populare de cloud GPU. De exemplu, un client poate obține un milion de jetoane pentru doar 10 cenți, oferind astfel o performanță de preț de 100 de ori mai mare pentru sarcinile de lucru AI.

Precizia de 16 biți a Cerebras și viteza de inferență de 20 ori mai mare le vor permite dezvoltatorilor să construiască aplicații AI de înaltă generație de înaltă generație, fără a compromite viteza sau costul. Acest raport revoluționar preț/performanță este posibil de sistemul Cerebras CS-3 și de procesorul AI Wafer Scale Engine 3 (WSE-3). CS-3 oferă de 7.000 de ori mai multă lățime de bandă de memorie decât Nvidia H100, rezolvând provocarea tehnică a lățimii de bandă a memoriei pentru IA generativă.

Cerebras lansează cea mai rapidă tehnologie de inferență AI din lume, performanță de 20 ori mai mare decât NVIDIA

Cerebras Inference este disponibilă în prezent la următoarele trei niveluri:

  • Nivelul gratuit oferă acces gratuit la API și limite generoase de utilizare pentru oricine se înscrie.
  • Nivelul pentru dezvoltatori este conceput pentru implementări flexibile, fără server, oferind utilizatorilor puncte finale API la o fracțiune din costul alternativelor existente pe piață, cu modelele Llama 3.1 8B și 70B la prețuri de doar 10 cenți și, respectiv, 60 de cenți per milion de jetoane.
  • Planurile Enterprise Tier oferă modele ajustate, acorduri personalizate de nivel de servicii și asistență dedicată. Ideale pentru sarcinile de lucru persistente, companiile pot accesa Cerebras Inference prin cloud-ul privat gestionat de Cerebras sau on-premise.

Cu performanță record, prețuri competitive și acces deschis la API, Cerebras Inference stabilește un nou standard pentru dezvoltarea și implementarea LLM deschisă. Fiind singura soluție capabilă să ofere atât antrenament de mare viteză, cât și inferență, Cerebras deschide posibilități complet noi pentru AI.

Cu tendințele AI care evoluează rapid și NVIDIA deține în prezent o poziție dominantă pe piață, apariția unor companii precum Cerebras și Groq semnalează o potențială schimbare în dinamica întregii industrii. Pe măsură ce cererea pentru soluții de inferență AI mai rapide și mai rentabile crește, soluții precum Cerebras Inference sunt bine poziționate pentru a risca dominația NVIDIA, în special în spațiul de inferență.

Sign up and earn $1000 a day ⋙

Leave a Comment

Cele mai bune laptopuri pentru studenți în 2025

Cele mai bune laptopuri pentru studenți în 2025

Studenții au nevoie de un anumit tip de laptop pentru studiile lor. Acesta nu ar trebui să fie doar suficient de puternic pentru a performa bine la specializarea aleasă, ci și suficient de compact și ușor pentru a fi transportat toată ziua.

Cum se adaugă o imprimantă în Windows 10

Cum se adaugă o imprimantă în Windows 10

Adăugarea unei imprimante la Windows 10 este simplă, deși procesul pentru dispozitivele cu fir va fi diferit față de cel pentru dispozitivele fără fir.

Cum să verificați memoria RAM și erorile RAM de pe computer cu cea mai mare precizie

Cum să verificați memoria RAM și erorile RAM de pe computer cu cea mai mare precizie

După cum știți, memoria RAM este o componentă hardware foarte importantă a unui computer, acționând ca memorie pentru procesarea datelor și fiind factorul care determină viteza unui laptop sau PC. În articolul de mai jos, WebTech360 vă va prezenta câteva modalități de a verifica erorile de RAM folosind software pe Windows.

Diferența dintre televizorul obișnuit și Smart TV

Diferența dintre televizorul obișnuit și Smart TV

Televizoarele inteligente au luat cu adevărat lumea cu asalt. Cu atât de multe funcții grozave și conectivitate la internet, tehnologia a schimbat modul în care ne uităm la televizor.

De ce congelatorul nu are lumină, dar frigiderul are?

De ce congelatorul nu are lumină, dar frigiderul are?

Frigiderele sunt aparate cunoscute în gospodării. Frigiderele au de obicei 2 compartimente, compartimentul cool este spatios si are o lumina care se aprinde automat de fiecare data cand utilizatorul il deschide, in timp ce compartimentul congelator este ingust si nu are lumina.

2 moduri de a remedia congestionarea rețelei care încetinește conexiunea Wi-Fi

2 moduri de a remedia congestionarea rețelei care încetinește conexiunea Wi-Fi

Rețelele Wi-Fi sunt afectate de mulți factori, dincolo de routere, lățime de bandă și interferențe, dar există câteva modalități inteligente de a vă îmbunătăți rețeaua.

Cum să downgrade de la iOS 17 la iOS 16 fără a pierde date folosind Tenorshare Reiboot

Cum să downgrade de la iOS 17 la iOS 16 fără a pierde date folosind Tenorshare Reiboot

Dacă doriți să reveniți la iOS 16 stabil pe telefonul dvs., iată ghidul de bază pentru dezinstalarea iOS 17 și downgrade de la iOS 17 la 16.

Ce se întâmplă cu organismul când mănânci iaurt în fiecare zi?

Ce se întâmplă cu organismul când mănânci iaurt în fiecare zi?

Iaurtul este un aliment minunat. Este bine să mănânci iaurt în fiecare zi? Când mănânci iaurt în fiecare zi, cum se va schimba corpul tău? Să aflăm împreună!

Ce tip de orez este cel mai bun pentru sănătate?

Ce tip de orez este cel mai bun pentru sănătate?

Acest articol discută cele mai hrănitoare tipuri de orez și cum să maximizați beneficiile pentru sănătate ale orezului pe care îl alegeți.

Cum să te trezești la timp dimineața

Cum să te trezești la timp dimineața

Stabilirea unui program de somn și a rutinei de culcare, schimbarea ceasului cu alarmă și ajustarea dietei sunt câteva dintre măsurile care vă pot ajuta să dormiți mai bine și să vă treziți la timp dimineața.

Sfaturi pentru a juca Rent Please! Proprietar Sim pentru începători

Sfaturi pentru a juca Rent Please! Proprietar Sim pentru începători

Inchiriez va rog! Landlord Sim este un joc mobil de simulare pe iOS și Android. Veți juca ca proprietarul unui complex de apartamente și veți începe să închiriați un apartament cu scopul de a îmbunătăți interiorul apartamentelor și de a le pregăti pentru chiriași.

Cele mai recente coduri de apărare a turnului de baie și cum să introduceți codurile

Cele mai recente coduri de apărare a turnului de baie și cum să introduceți codurile

Obțineți codul de joc Roblox Bathroom Tower Defense și răscumpărați pentru recompense interesante. Ele vă vor ajuta să faceți upgrade sau să deblocați turnuri cu daune mai mari.

Structura, simbolurile și principiile de funcționare ale transformatoarelor

Structura, simbolurile și principiile de funcționare ale transformatoarelor

Să învățăm despre structura, simbolurile și principiile de funcționare ale transformatoarelor în cel mai precis mod.

4 moduri prin care AI face televizoarele inteligente mai bune

4 moduri prin care AI face televizoarele inteligente mai bune

De la o calitate mai bună a imaginii și a sunetului la controlul vocal și multe altele, aceste funcții bazate pe inteligență artificială fac televizoarele inteligente mult mai bune!

De ce ChatGPT este mai bun decât DeepSeek

De ce ChatGPT este mai bun decât DeepSeek

Inițial, oamenii aveau mari speranțe în DeepSeek. Fiind un chatbot AI comercializat ca un concurent puternic pentru ChatGPT, acesta promite capacități și experiențe inteligente de chat.