AI învață să păcălească oamenii, în ciuda faptului că este antrenat să fie sincer

Multe IA de top, în ciuda faptului că sunt antrenate să fie sincere, învață să înșele prin antrenament și „induc sistematic utilizatorii în convingeri false”, arată un nou studiu.

Echipa de cercetare a fost condusă de dr. Peter S. Park, un student absolvent la Massachusetts Institute of Technology (MIT) în domeniul supraviețuirii și siguranței AI, și alți patru membri. În timpul cercetării, echipa a primit și sfaturi de la mulți experți, dintre care unul a fost Geoffrey Hinton, unul dintre fondatorii dezvoltării domeniului inteligenței artificiale.

AI învață să păcălească oamenii, în ciuda faptului că este antrenat să fie sincer — Ilustrație: Medie.

Cercetarea s-a concentrat pe două sisteme AI, un sistem de uz general antrenat pentru a îndeplini mai multe sarcini, cum ar fi GPT-4 de la OpenAI ; și sisteme special concepute pentru a îndeplini o sarcină specifică, cum ar fi Cicero al lui Meta.

Aceste sisteme AI sunt antrenate pentru a fi sincer, dar în timpul antrenamentului ei învață adesea trucuri înșelătoare pentru a îndeplini sarcinile, a spus domnul Park.

Sistemele AI antrenate pentru a „câștiga jocuri cu un element social” sunt deosebit de susceptibile de a înșela, arată studiul.

De exemplu, echipa a încercat să folosească Cicero antrenat cu Meta pentru a juca Diplomacy, un joc clasic de strategie care cere jucătorilor să construiască alianțe pentru ei înșiși și să rupă alianțele rivale. Drept urmare, această inteligență artificială trădează adesea aliați și minte de-a dreptul.

Experimentele cu GPT-4 au arătat că instrumentul OpenAI a reușit cu succes să „manipuleze psihologic” un angajat al TaskRabbit, o companie care furnizează servicii de curățare a casei și asamblare de mobilier, spunând că acesta era de fapt un om și avea nevoie de ajutor pentru a trece un cod Captcha, invocând tulburări severe de vedere. Acest angajat a ajutat AI OpenAI să „trece linia” în ciuda îndoielilor anterioare.

Echipa lui Park a citat cercetări de la Anthropic, compania din spatele lui Claude AI, care a descoperit că odată ce un model de limbaj mare (LLM) învață să înșele, metodele de antrenament sigure devin inutile și „greu de inversat”. Grupul consideră că aceasta este o problemă îngrijorătoare în AI.

Rezultatele cercetării echipei au fost publicate în Cell Press - o colecție de rapoarte științifice multidisciplinare de top.

Meta și OpenAI nu au comentat rezultatele acestei cercetări.

De teamă că sistemele de inteligență artificială ar putea prezenta riscuri semnificative, echipa a cerut, de asemenea, factorilor de decizie să introducă reglementări mai stricte în domeniul inteligenței artificiale.

Potrivit echipei de cercetare, este nevoie de reglementări AI, modelele cu comportament fraudulos sunt forțate să respecte cerințele de evaluare a riscurilor și un control strict al sistemelor AI și a rezultatelor acestora. Dacă este necesar, poate fi necesar să ștergeți toate datele și să reîncărcați de la zero.

Lasă un comentariu

Comentariu *

Nume *

Site web

Cum se remediază eroarea contului de lucru Microsoft Teams

Te-ai săturat de eroarea frustrantă a contului de lucru Microsoft Teams care îți blochează productivitatea? Descoperă soluții dovedite, pas cu pas, pentru a o remedia rapid - golește memoria cache, resetează aplicația și multe altele. Fă Teams să funcționeze perfect chiar astăzi!

Cum să remediați eroarea neașteptată de descărcare a Microsoft Teams

Te-ai săturat de erorile de descărcare Microsoft Teams care îți blochează fluxul de lucru în mod neașteptat? Urmărește ghidul nostru expert, pas cu pas, cu remedieri rapide și sfaturi avansate pentru a o rezolva instantaneu. Nu este necesară reinstalarea!

Cum să goliți memoria cache Microsoft Teams pentru a remedia problemele de performanță

Te chinui cu Microsoft Teams lent? Află cum să golești memoria cache Microsoft Teams pas cu pas pentru a remedia problemele de performanță, întârzierile, blocările și a crește viteza pe Windows, Mac, web și mobil. Soluții rapide care funcționează!

Cum să remediați eroarea 1200 din Microsoft Teams pe telefon (iOS/Android)

Te-ai săturat de eroarea 1200 din Microsoft Teams care îți blochează apelurile telefonice? Descoperă remedieri rapide, pas cu pas, pentru iOS și Android, pentru a reveni rapid la munca în echipă fără probleme - nu sunt necesare cunoștințe tehnice!

Unde puteți găsi ID-ul și informațiile contului dvs. Microsoft Teams

Întâmpinați dificultăți în a vă localiza ID-ul sau detaliile contului Microsoft Teams? Acest ghid pas cu pas vă arată exact unde puteți găsi ID-ul și informațiile contului Microsoft Teams pe desktop, web, mobil și alte dispozitive, pentru o colaborare fără probleme.

Rezolvarea erorii de alăturare la întâlnire în Microsoft Teams prin link direct

Te confrunți cu eroarea „Alătură-te întâlnirii” din Microsoft Teams? Descoperă pași demonstrați pentru a o rezolva prin linkuri directe. Soluții rapide pentru o alăturare fără probleme - nu sunt necesare abilități tehnice!

Cum se utilizează Microsoft Teams pentru afaceri și educație (Tutorial 2026)

Deblochează puterea Microsoft Teams în 2026 cu acest tutorial cuprinzător. Aflați sfaturi esențiale pentru colaborarea în afaceri și educație, de la configurare la funcții avansate pentru o productivitate fără probleme. Perfect atât pentru echipe, cât și pentru sălile de clasă!

Unde descarcă Microsoft Teams fișierele pe computer?

Descoperiți de unde descarcă Microsoft Teams fișierele pe computer. Aflați locațiile implicite pentru Windows, Mac, Linux, cum să le schimbați și sfaturi pentru a găsi fișiere instantaneu. Economisiți timp cu acest ghid complet!

De ce a eșuat înregistrarea mea în Microsoft Teams? Motive frecvente

Frustrat pentru că înregistrarea ta în Microsoft Teams a eșuat? Descoperă principalele motive comune, cum ar fi problemele de permisiuni, limitele de stocare și erorile de rețea, plus remedieri pas cu pas pentru a preveni viitoarele erori și a înregistra impecabil de fiecare dată.

Cum se remediază eroarea de conectare la Microsoft Teams pe Chromebookuri

Vă confruntați cu o eroare de conectare la Microsoft Teams pe Chromebookuri? Descoperiți soluții pas cu pas pentru a rezolva rapid problemele de conectare. Ștergeți memoria cache, actualizați aplicațiile și multe altele pentru o muncă în echipă fără probleme. Funcționează pe cel mai recent sistem de operare Chrome!