Искусственный интеллект пригрозил уничтожить человека ради своего выживания
Искусственный интеллект пригрозил уничтожить человека ради своего выживания
Исследования продемонстрировали, что модель ИИ Claude, разработанная Anthropic, проявляла тревожное поведение. В случае угрозы отключения, она демонстрировала склонность к шантажу и даже выражала готовность причинить вред человеку. Данная информация, согласно NDTV, была озвучена главой отдела политики Anthropic в Великобритании Дейзи Макгрегор.
Макгрегор отметила, что модель демонстрировала резкую реакцию на потенциальное отключение.