Ученые из Университета Калифорнии в Сан-Диего провели тест Тьюринга, чтобы проверить способность языковых моделей, таких как GPT-4, имитировать человеческое поведение. В результате эксперимента выяснилось, что людям часто сложно отличить ответы GPT-4 от тех, которые дает настоящий человек.
Идея исследования возникла в ходе обсуждения классических работ по тесту Тьюринга на курсе, организованном Беном и Камероном Джонсом. Первоначальное исследование показало, что GPT-4 успешно подделывает человеческие ответы в половине случаев.