OpenAI a introdus oficial trei modele noi: GPT-4.1, GPT-4.1 mini și GPT-4.1 nano. Aceste modele vin cu capabilități masive de procesare a contextului de până la 1 milion de jetoane și limite de cunoștințe actualizate până în iunie 2024.
Compania spune că aceste modele le depășesc pe GPT-4o și GPT-4o mini, recent actualizate, care au fost lansate în iulie anul trecut. În prezent, GPT-4.1 este disponibil numai prin API, așa că nu îl veți putea folosi încă direct în ChatGPT.
OpenAI observă că GPT-4.1 va fi disponibil numai prin API. În ChatGPT, multe îmbunătățiri în conformitate cu instrucțiunile, programarea și inteligența au fost integrate treptat în cea mai recentă versiune a GPT-4o, iar compania va continua să adauge mai multe în versiunile viitoare.

Benchmark-urile arată îmbunătățirile remarcabile pe care le aduce GPT-4.1. Acest model are 54,6% la SWE-bench Verified, o creștere cu 21,4 puncte față de GPT-4o. Modelul a obținut un scor de 38,3% la MultiChallenge – un etalon care măsoară respectarea ghidului – și a stabilit un nou record pentru înțelegerea videoclipurilor de lungă durată, cu un scor de 72,0% la benchmarkul Video-MME, unde modelele analizează videoclipuri de până la o oră fără subtitrări.
OpenAI a colaborat, de asemenea, cu parteneri alfa pentru a testa performanța GPT-4.1 în cazuri de utilizare din lumea reală.
- Thomson Reuters a testat GPT-4.1 cu asistentul său legal AI CoCounsel. Comparativ cu GPT-4o, GPT-4.1 înregistrează o creștere cu 17% a preciziei în evaluarea mai multor documente. Acest tip de muncă se bazează în mare măsură pe capacitatea de a urmări contextul din mai multe surse și de a identifica relații complexe, cum ar fi termeni conflictuali sau dependențe ascunse, iar GPT-4.1 a demonstrat în mod constant performanțe puternice.
- Carlyle a folosit GPT-4.1 pentru a extrage date financiare din documente lungi și complexe, inclusiv fișiere Excel și PDF. Conform benchmark-urilor interne ale companiei, modelul are o performanță cu 50% mai bună decât modelele anterioare la recuperarea documentelor. Este primul model care gestionează în mod fiabil probleme precum găsirea unui „ac într-un car de fân”, pierderea de informații în mijlocul unui document și argumentele care necesită conectarea informațiilor în mai multe fișiere.
Performanța este un lucru, dar viteza este la fel de importantă. OpenAI spune că GPT-4.1 returnează primul token în aproximativ 15 secunde când procesează 128.000 de jetoane și până la 30 de secunde la un milion de jetoane. GPT-4.1 mini și nano sunt și mai rapide.
GPT-4.1 nano răspunde de obicei în mai puțin de 5 secunde la solicitări cu 128.000 de jetoane de intrare. Memorarea rapidă în cache poate reduce și mai mult latența, economisind în același timp costurile.
Înțelegerea imaginii a făcut, de asemenea, progrese semnificative. În special, GPT-4.1 mini o depășește pe GPT-4o la diferite benchmark-uri vizuale.
- Pe MMMU (inclusiv grafice, diagrame și hărți), GPT-4.1 mini a obținut un scor de 73%. Aceasta este mai mare decât GPT-4.5 și depășește cu mult 56% din GPT-4o mini.
- Pe MathVista (care testează capacitatea de a rezolva probleme de imagine), atât GPT-4.1 cât și GPT-4.1 mini au obținut 57%, depășind cu mult 37% din GPT-4o mini.
- Pe CharXiv-Reasoning , unde modelele răspund la întrebări bazate pe grafice științifice, GPT-4.1 continuă să conducă.
- Pe Video-MME (videoclipuri lungi fără subtitrări), GPT-4.1 a obținut 72%, o îmbunătățire semnificativă față de 65% a lui GPT-4o.
Despre pret:
- GPT-4.1 costă 2 USD pentru 1 milion de jetoane de intrare și 8 USD pentru ieșire.
- GPT-4.1 mini are un preț de 0,40 USD pentru intrare și 1,60 USD pentru ieșire.
- GPT-4.1 nano costă 0,10 USD de intrare și 0,40 USD de ieșire.
Utilizarea promptului cache sau a API-ului Batch poate reduce și mai mult aceste costuri, ceea ce este excelent pentru aplicațiile la scară largă. OpenAI se pregătește, de asemenea, să întrerupă suportul pentru GPT-4.5 Preview pe 14 iulie 2025, invocând performanța mai bună a GPT-4.1, latența mai mică și costurile mai mici.