Исследование: у более эмпатичного ИИ ниже точность в медицинских ответах
В исследовании специалисты проанализировали более 400 тысяч ответов пяти больших языковых моделей, включая Llama от Meta* (США), Mistral-Small от Mistral (Франция), Qwen от Alibaba (Китай) и GPT-4o от OpenAI (США), которые дополнительно обучили генерировать более «теплые» и эмпатичные ответы. Модели оценивались на задачах с объективно проверяемыми результатами, включая вопросы по медицине, фактологии и дезинформации. Выяснилось, что у исходных моделей уровень ошибок составлял от 4% до 35% в зависимости от задачи...