Википедия решила облегчить доступ к своим данным для разработчиков искусственного интеллекта (ИИ), предлагая специально подготовленный набор данных. Сотрудничая с платформой Kaggle, Wikimedia Foundation анонсировала публикацию набора структурированных данных на английском и французском языках, предназначенных для тренировки моделей ИИ.
Новый набор данных включает в себя аннотации, краткие описания, ссылки на изображения, информацию из инфобоксов и разделы статей. Однако в нем отсутствуют такие элементы, как ссылки и аудиофайлы.