Российские ученые улучшили память чат-ботов с помощью метода обучения GRPO
Специалисты MWS AI, входящей в МТС Web Services, разработали подход, который позволяет чат-ботам и голосовым помощникам лучше отслеживать состояние диалога. Это помогает системам искусственного интеллекта (ИИ) во время разговора точнее понимать, что хочет пользователь.
В основе подхода лежит метод обучения с подкреплением GRPO. Вместо того чтобы показывать модели правильные ответы, ей дают возможность самой исследовать варианты и получать награду за точный результат. Такой подход не требует...