AI după ce a fost învățat să trișeze este foarte greu de reformat

Anthropic, un startup binecunoscut în domeniul inteligenței artificiale, a realizat un nou studiu care arată că atunci când un AI generativ a comis fraude, este foarte dificil să ajustezi sau să reinstruiești acel model.