DeepSeek, compania chineză din spatele modelului AI gratuit care a zguduit lumea tehnologiei, se confruntă cu o serie de acuzații negative, inclusiv utilizarea de contrabandă a GPU-urilor Nvidia pentru a antrena și a rula modelul său AI eponim.
În consecință, Departamentul de Comerț al SUA are în vedere să investigheze dacă DeepSeek a accesat și colectat ilegal GPU-uri Nvidia prin intermediari din Singapore. În ultimii ani, Statele Unite au menținut restricții stricte privind exportul de cipuri avansate în China, urmărind să-și mențină poziția de lider în tehnologie și să limiteze dezvoltarea rapidă a rivalului său.
DeepSeek a făcut recent titluri pentru lansarea modelului său de inferență R1. Se spune că acest model are performanțe apropiate de modelul OpenAI o1, care este disponibil doar în planul de abonament ChatGPT Pro care necesită un abonament plătit. Ceea ce face ca DeepSeek să fie atât de valoros este că nu numai că are performanțe similare, dar este, de asemenea, lansat ca sursă deschisă și gratuit pentru toată lumea. Cei care nu au avut niciodată șansa de a experimenta modelul de inferență de ultimă oră OpenAI au acum DeepSeek R1 ca alternativă demnă.
DeepSeek a fost atât de populară încât aplicația a urcat pe locul 1 în topurile din App Store din SUA, ceea ce a făcut ca piața de valori din SUA să scadă cu o capitalizare bursieră de 2 trilioane de dolari, distrusă în doar câteva zile.
În special, DeepSeek susține că a făcut toate acestea cu doar 2.000 de GPU-uri Nvidia H800 și costuri de investiții estimate la 6 milioane de dolari, un număr mic în comparație cu investițiile uriașe turnate în OpenAI și în multe alte modele similare AI.
Potrivit Citigroup, giganții tehnologici americani precum Microsoft, Meta, Amazon și Alphabet au cheltuit un total de aproximativ 209 miliarde de dolari pe infrastructura de date anul trecut, din care 80% a fost pentru centre de date. Acest lucru i-a lăsat pe mulți să se întrebe dacă DeepSeek realizează ceva diferit de OpenAI și alte companii AI din SUA și dacă este cu adevărat posibil să antreneze modele AI cu atât de multe resurse mai puține.

David Sacks, fost oficial al inteligenței artificiale sub președintele Donald Trump, a declarat într-un interviu recent că există „dovezi substanțiale” că DeepSeek a distilat producția OpenAI pentru a-și antrena propriul model. Acest proces de distilare implică un „model copil” (DeepSeek) care imită raționamentul „modelului părinte” (OpenAI), similar modului în care oamenii învață, punând milioane de întrebări. Microsoft și OpenAI și-au lansat, de asemenea, propriile investigații în această problemă, în primul rând pentru a clarifica dacă DeepSeek a accesat datele OpenAI în mod necorespunzător.
DeepSeek a spus că folosește cipul H800 - un chipset AI pe care Nvidia l-a dezvoltat special pentru piața chineză după ce au fost impuse pentru prima dată controalele la export. Nu este clar cum a achiziționat DeepSeek Nvidia H800, dar compania le-ar putea cumpăra la sfârșitul anului 2022 sau 2023.
În prezent, nu există dovezi că DeepSeek a folosit jetoane de contrabandă. Dar se spune că multe companii chineze de inteligență artificială au făcut acest lucru. Contrabanda organizată de cipuri AI în China a fost urmărită în mai multe țări, inclusiv în Malaezia, Singapore și Emiratele Arabe Unite.