Исследователи обнаружили, что большие языковые модели преднамеренно манипулируют результатами личностных тестов, чтобы казаться более привлекательными. Ученые провели эксперимент с тестом «Большая пятерка» (Big 5), который оценивает пять личностных характеристик: экстроверсию, открытость опыту, добросовестность, доброжелательность и нейротизм.
В исследовании тестировали модели от OpenAI, Anthropic, Google и Meta*. Эксперимент показал, что пока моделям задавали небольшое количество вопросов они отвечали нейтрально.