OpenAI tocmai a anunțat Programul Pioneers – un efort de a promova aplicarea AI în situații reale. Programul se concentrează pe îmbunătățirea modului în care sunt evaluate modelele AI, deoarece dezvoltatorii și companiile se bazează din ce în ce mai mult pe repere pentru a selecta și optimiza modelele adecvate.
Mișcarea vine după ce Meta a fost acuzată că a manipulat benchmark-ul LMArena pentru a crește clasamentul modelului lor Llama 4. Programul Pioneers își propune să colaboreze cu companii și cercetători OpenAI pentru a dezvolta standarde de evaluare care să reflecte provocările din lumea reală, mai degrabă decât să concureze pentru scoruri pe clasament.
Potrivit OpenAI, companiile selectate vor primi sprijin direct din partea echipelor lor de cercetare, concentrându-se pe două obiective principale:
- Creați repere pentru fiecare domeniu : Dezvoltați metode de evaluare separate pentru fiecare domeniu (drept, finanțe, medicină, asigurări, contabilitate).
- Perfecționați antrenamentul pentru modele : dezvoltați modele de IA profunde care abordează cele mai importante trei cazuri de utilizare în afaceri.
OpenAI subliniază că în prezent nu există un standard comun pentru măsurarea performanței AI în multe dintre aceste domenii, ceea ce duce la dificultăți în evaluarea sau îmbunătățirea corectă a modelelor. Lucrând direct, compania speră să definească clar „ce este eficient” în fiecare industrie și să publice aceste criterii pentru ca comunitatea să le aplice.
Pe partea de reglare a modelelor, companiile participante vor fi sprijinite în instruirea versiunilor personalizate de AI folosind Reinforcement Fine-Tuning (RFT) – o metodă OpenAI pentru crearea de modele „expert” care excelează la seturi restrânse de sarcini. Aceste modele se angajează să fie pregătite pentru implementarea la scară de producție.
În ceea ce privește foaia de parcurs de implementare, prima fază se va concentra în principal pe un grup de startup-uri selectate în funcție de impactul real al produsului. OpenAI acordă prioritate echipelor care abordează probleme specifice în care IA profundă poate face o diferență tangibilă. Odată cu aceasta se extinde în viitor la întreprinderi mari și domenii mai complexe.