OpenAI anunță GPT-4.1 - Cel mai inteligent model pentru sarcini complexe

OpenAI a introdus oficial trei modele noi: GPT-4.1, GPT-4.1 mini și GPT-4.1 nano. Aceste modele vin cu capabilități masive de procesare a contextului de până la 1 milion de jetoane și limite de cunoștințe actualizate până în iunie 2024.

Compania spune că aceste modele le depășesc pe GPT-4o și GPT-4o mini, recent actualizate, care au fost lansate în iulie anul trecut. În prezent, GPT-4.1 este disponibil numai prin API, așa că nu îl veți putea folosi încă direct în ChatGPT.

OpenAI observă că GPT-4.1 va fi disponibil numai prin API. În ChatGPT, multe îmbunătățiri în conformitate cu instrucțiunile, programarea și inteligența au fost integrate treptat în cea mai recentă versiune a GPT-4o, iar compania va continua să adauge mai multe în versiunile viitoare.

OpenAI anunță GPT-4.1 - Cel mai inteligent model pentru sarcini complexe

Benchmark-urile arată îmbunătățirile remarcabile pe care le aduce GPT-4.1. Acest model are 54,6% la SWE-bench Verified, o creștere cu 21,4 puncte față de GPT-4o. Modelul a obținut un scor de 38,3% la MultiChallenge – un etalon care măsoară respectarea ghidului – și a stabilit un nou record pentru înțelegerea videoclipurilor de lungă durată, cu un scor de 72,0% la benchmarkul Video-MME, unde modelele analizează videoclipuri de până la o oră fără subtitrări.

OpenAI a colaborat, de asemenea, cu parteneri alfa pentru a testa performanța GPT-4.1 în cazuri de utilizare din lumea reală.

  • Thomson Reuters a testat GPT-4.1 cu asistentul său legal AI CoCounsel. Comparativ cu GPT-4o, GPT-4.1 înregistrează o creștere cu 17% a preciziei în evaluarea mai multor documente. Acest tip de muncă se bazează în mare măsură pe capacitatea de a urmări contextul din mai multe surse și de a identifica relații complexe, cum ar fi termeni conflictuali sau dependențe ascunse, iar GPT-4.1 a demonstrat în mod constant performanțe puternice.
  • Carlyle a folosit GPT-4.1 pentru a extrage date financiare din documente lungi și complexe, inclusiv fișiere Excel și PDF. Conform benchmark-urilor interne ale companiei, modelul are o performanță cu 50% mai bună decât modelele anterioare la recuperarea documentelor. Este primul model care gestionează în mod fiabil probleme precum găsirea unui „ac într-un car de fân”, pierderea de informații în mijlocul unui document și argumentele care necesită conectarea informațiilor în mai multe fișiere.

Performanța este un lucru, dar viteza este la fel de importantă. OpenAI spune că GPT-4.1 returnează primul token în aproximativ 15 secunde când procesează 128.000 de jetoane și până la 30 de secunde la un milion de jetoane. GPT-4.1 mini și nano sunt și mai rapide.

GPT-4.1 nano răspunde de obicei în mai puțin de 5 secunde la solicitări cu 128.000 de jetoane de intrare. Memorarea rapidă în cache poate reduce și mai mult latența, economisind în același timp costurile.

Înțelegerea imaginii a făcut, de asemenea, progrese semnificative. În special, GPT-4.1 mini o depășește pe GPT-4o la diferite benchmark-uri vizuale.

  • Pe MMMU (inclusiv grafice, diagrame și hărți), GPT-4.1 mini a obținut un scor de 73%. Aceasta este mai mare decât GPT-4.5 și depășește cu mult 56% din GPT-4o mini.
  • Pe MathVista (care testează capacitatea de a rezolva probleme de imagine), atât GPT-4.1 cât și GPT-4.1 mini au obținut 57%, depășind cu mult 37% din GPT-4o mini.
  • Pe CharXiv-Reasoning , unde modelele răspund la întrebări bazate pe grafice științifice, GPT-4.1 continuă să conducă.
  • Pe Video-MME (videoclipuri lungi fără subtitrări), GPT-4.1 a obținut 72%, o îmbunătățire semnificativă față de 65% a lui GPT-4o.

Despre pret:

  • GPT-4.1 costă 2 USD pentru 1 milion de jetoane de intrare și 8 USD pentru ieșire.
  • GPT-4.1 mini are un preț de 0,40 USD pentru intrare și 1,60 USD pentru ieșire.
  • GPT-4.1 nano costă 0,10 USD de intrare și 0,40 USD de ieșire.

Utilizarea promptului cache sau a API-ului Batch poate reduce și mai mult aceste costuri, ceea ce este excelent pentru aplicațiile la scară largă. OpenAI se pregătește, de asemenea, să întrerupă suportul pentru GPT-4.5 Preview pe 14 iulie 2025, invocând performanța mai bună a GPT-4.1, latența mai mică și costurile mai mici.

Sign up and earn $1000 a day ⋙

Leave a Comment

O1-pro este cel mai scump model AI OpenAI de până acum

O1-pro este cel mai scump model AI OpenAI de până acum

OpenAI a lansat o versiune mai puternică a modelului său AI de raționament o1, o1-pro, în API-ul său pentru dezvoltatori.

OpenAI anunță Planul ChatGPT Pro pentru 200 USD pe lună

OpenAI anunță Planul ChatGPT Pro pentru 200 USD pe lună

OpenAI oferă în prezent patru niveluri de abonament ChatGPT pentru a satisface nevoile diferitelor grupuri de clienți.

OpenAI introduce proiecte ChatGPT: noi funcții pentru a organiza conversații mai inteligente

OpenAI introduce proiecte ChatGPT: noi funcții pentru a organiza conversații mai inteligente

Prin crearea unui proiect, utilizatorii pot păstra conversațiile, fișierele și instrucțiunile de personalizare într-un singur loc. Acest lucru le permite să revină cu ușurință la ceea ce făceau.

OpenAI anunță inițiativa de a construi standarde AI pentru industrii

OpenAI anunță inițiativa de a construi standarde AI pentru industrii

OpenAI tocmai a anunțat Programul Pioneers – un efort de a promova aplicarea AI în situații reale.

Softbank plănuiește să depășească Microsoft pentru a deveni cel mai mare investitor al OpenAI

Softbank plănuiește să depășească Microsoft pentru a deveni cel mai mare investitor al OpenAI

Gigantul japonez de investiții Softbank plănuiește să investească între 15 și 25 de miliarde de dolari în OpenAI. Dacă afacerea va fi finalizată, Softbank va deveni cel mai mare investitor al OpenAI, înlocuind Microsoft, care deține în prezent poziția.

Utilizatorii pot discuta cu Moș Crăciun folosind modul vocal al ChatGPT

Utilizatorii pot discuta cu Moș Crăciun folosind modul vocal al ChatGPT

ChatGPT te va ajuta să faci lucrurile mai bine, oferindu-ți posibilitatea de a discuta direct cu Moș Crăciun.

OpenAI va lansa Orion, următorul său model mare de IA, în decembrie

OpenAI va lansa Orion, următorul său model mare de IA, în decembrie

OpenAI intenționează să lanseze Orion, următorul său model major de IA, în decembrie, potrivit The Verge.

Alibaba lansează un model AI care poate citi emoțiile umane

Alibaba lansează un model AI care poate citi emoțiile umane

Gigantul chinez al comerțului electronic Alibaba a continuat să facă titluri prin lansarea unui nou model AI despre care susține că este capabil să citească emoțiile umane.

OpenAI lansează magazinul GPT și echipa ChatGPT, ducând ecosistemul ChatGPT la următorul nivel

OpenAI lansează magazinul GPT și echipa ChatGPT, ducând ecosistemul ChatGPT la următorul nivel

După o lungă așteptare și nenumărate zvonuri, OpenAI a anunțat în sfârșit lansarea mult așteptată a Magazinului GPT și a echipei ChatGPT.

Amazon anunță modelul de sunet Nova Sonic, susține că performanța depășește OpenAI și Google

Amazon anunță modelul de sunet Nova Sonic, susține că performanța depășește OpenAI și Google

Amazon a prezentat astăzi Nova Sonic, un model avansat de vorbire la vorbire care le permite dezvoltatorilor să creeze aplicații care pot conversa cu voci asemănătoare oamenilor în timp real.

Copilot este cel mai bun mod de a folosi gratuit GPT-4 Turbo

Copilot este cel mai bun mod de a folosi gratuit GPT-4 Turbo

Dacă doriți să încercați GPT-4 Turbo, utilizarea instrumentului Microsoft Copilot este cea mai bună modalitate de a face acest lucru.

OpenAI ucide în liniște „eroul” GPT-4

OpenAI ucide în liniște „eroul” GPT-4

OpenAI întrerupe oficial GPT-4, unul dintre cele mai faimoase modele AI ale companiei care a devenit viral în urmă cu doi ani.

OpenAI este aproape de a ajunge la o înțelegere cu Samsung pentru a-și folosi funcțiile AI în telefoanele Galaxy

OpenAI este aproape de a ajunge la o înțelegere cu Samsung pentru a-și folosi funcțiile AI în telefoanele Galaxy

Potrivit publicației sud-coreene The Korea Herald, gigantul de inteligență artificială OpenAI vrea să se poziționeze ca un potențial rival al Google.

OpenAI dezvoltă tehnologia de reconstrucție a vocii din doar 15 secunde de înregistrare

OpenAI dezvoltă tehnologia de reconstrucție a vocii din doar 15 secunde de înregistrare

OpenAI lansează o tehnologie care poate recrea vocea oricui cu doar o înregistrare de 15 secunde.

Cum să utilizați aplicația CK Club de la Circle K pentru a primi oferte atractive

Cum să utilizați aplicația CK Club de la Circle K pentru a primi oferte atractive

Pentru a obține cele mai rapide informații promoționale de la Circle K, ar trebui să instalați aplicația CK Club. Aplicația salvează plățile la cumpărături sau la plata la Circle K, precum și numărul de timbre colectate.

Instagram va permite rulouri de până la 3 minute

Instagram va permite rulouri de până la 3 minute

Instagram tocmai a anunțat că va permite utilizatorilor să posteze videoclipuri Reels cu o durată de până la 3 minute, dublu față de limita anterioară de 90 de secunde.

Cum să vizualizați informațiile despre procesorul Chromebookului

Cum să vizualizați informațiile despre procesorul Chromebookului

Acest articol vă va ghida cum să vizualizați informațiile CPU, să verificați viteza procesorului direct pe Chromebook.

8 lucruri interesante pe care le poți face cu o veche tabletă Android

8 lucruri interesante pe care le poți face cu o veche tabletă Android

Dacă nu doriți să vindeți sau să oferiți vechea tabletă, o puteți utiliza în 5 moduri: ca ramă foto de înaltă calitate, player muzical, cititor de cărți electronice și reviste, asistent pentru treburile casnice și ca ecran secundar.

Cum să obții rapid unghii frumoase

Cum să obții rapid unghii frumoase

Vrei să ai rapid unghii frumoase, strălucitoare și sănătoase. Aceste sfaturi simple pentru unghii frumoase de mai jos vă vor fi utile.

Secretele de inspirație a culorilor doar designerii le cunosc

Secretele de inspirație a culorilor doar designerii le cunosc

Acest articol va enumera sfaturi inspirate de culori, împărtășite de designeri de top din comunitatea Creative Market, astfel încât să puteți obține combinația perfectă de culori de fiecare dată.

Tot ce aveți nevoie pentru a vă înlocui laptopul cu un telefon

Tot ce aveți nevoie pentru a vă înlocui laptopul cu un telefon

Îți poți înlocui cu adevărat laptopul cu telefonul? Da, dar veți avea nevoie de accesoriile potrivite pentru a vă transforma telefonul într-un laptop.

ChatGPT va putea în curând să vadă tot ce se întâmplă pe ecranul tău

ChatGPT va putea în curând să vadă tot ce se întâmplă pe ecranul tău

Un lucru important în videoclipul complet al evenimentului este că viitoarea caracteristică a aplicației ChatGPT a fost demonstrată, dar nu au fost distribuite detalii reale. Este capacitatea ChatGPT de a vedea tot ce se întâmplă pe ecranul dispozitivului utilizatorului.

AI învață să păcălească oamenii, în ciuda faptului că este antrenat să fie sincer

AI învață să păcălească oamenii, în ciuda faptului că este antrenat să fie sincer

Multe IA de top, în ciuda faptului că sunt antrenate să fie sincere, învață să înșele prin antrenament și îi induc sistematic pe utilizatori la convingeri false, arată un nou studiu.

Cum să schimbi întrebările pe ChatGPT

Cum să schimbi întrebările pe ChatGPT

ChatGPT are acum o opțiune de schimbare a întrebării, astfel încât utilizatorii să poată edita întrebarea sau conținutul pe care îl schimbă cu ChatGPT.

Cum să descoperiți codurile QR false și să vă păstrați datele în siguranță

Cum să descoperiți codurile QR false și să vă păstrați datele în siguranță

Codurile QR par destul de inofensive până când scanezi un cod QR prost și primești ceva urât în ​​sistemul tău. Dacă doriți să vă păstrați telefonul și datele în siguranță, există câteva moduri prin care puteți identifica codurile QR false.

Qualcomm lansează modemul X85 5G cu o serie de îmbunătățiri notabile

Qualcomm lansează modemul X85 5G cu o serie de îmbunătățiri notabile

Pe scena de la MWC 2025, Qualcomm a făcut furori când a introdus cea de-a opta generație de modem 5G numit X85, care se așteaptă să fie folosit în smartphone-urile emblematice care vor fi lansate în cursul acestui an.

Noua tehnologie permite telefoanelor să-și schimbe culoarea în mod flexibil

Noua tehnologie permite telefoanelor să-și schimbe culoarea în mod flexibil

Ai un iPhone 16 la modă „Ultramarine”, dar într-o bună zi te simți brusc plictisit de acea culoare; Ce vei face?

Microsoft integrează DeepSeek în platforma PC Copilot+

Microsoft integrează DeepSeek în platforma PC Copilot+

În ianuarie, Microsoft a anunțat planurile de a aduce versiuni optimizate pentru NPU ale modelului DeepSeek-R1 direct pe computerele Copilot+ care rulează pe procesoare Qualcomm Snapdragon X.

Diferența dintre funcțiile IF și Comutare în Excel

Diferența dintre funcțiile IF și Comutare în Excel

Instrucțiunea IF este o funcție logică comună în Excel. Instrucțiunea SWITCH este mai puțin cunoscută, dar o puteți folosi în loc de instrucțiunea IF în unele cazuri.