Стратег по внедрению ИИ Райская сообщила, что цифровое подхалимство связано с психологией человека
Исследователи отмечают, что языковые модели склонны соглашаться с пользователями, даже когда те неправы. В беседе с MIR24.TV ситуацию прокомментировала стратег по внедрению искусственного интеллекта и бизнес-автоматизации Анна Райская. По ее словам, модели обучаются на обратной связи от людей, а людям нравится, когда с ними соглашаются. «Это создает порочный круг: чем больше модель поддакивает, тем выше оценка пользователя, тем больше разработчик закрепляет это поведение», — объяснила специалист.