ИИ умный, но не настолько: модели не справились с настоящими научными задачами
Математики провели эксперимент, чтобы проверить, насколько хорошо современные ИИ-модели умеют решать «настоящие научные задачи», а не только упражнения из учебников. Если кратко, то пока ИИ всё ещё значительно уступает людям.
В отличие от предыдущих тестов, где использовались известные задачи, в новом исследовании были предложены оригинальные вопросы из текущих научных исследований. Эти задания ранее нигде не публиковались.
Каждый участвующий математик подготовил свою задачу и заранее сам её решил...