Az Anthropic új kutatása: Az AI rejtett céljainak felfedezése Új tanulmányt publikált csütörtökön Anthropic, amelynek címe "Nyelvi modellek auditálása rejtett célokért". A kutatók leírták, hogyan képesek azok a modellek, amelyeket kifejezetten arra képeztek ki, hogy…