SEO

Яндекс выложил в опенсорс один из крупнейших в мире датасетов для развития рекомендательных систем

31.05.2025

0 84 Время чтения: 1 минута

Яндекс выложил в открытый доступ один из крупнейших в мире датасетов для развития рекомендательных систем – Yambda (YAndex Music Billion-interactions DAtaset). С помощью Yambda ученые, исследователи и вузы со всего мира смогут тестировать и улучшать рекомендательные алгоритмы.

Датасет в трех вариантах: с полной версией данных и с уменьшенными. Разработчики могут выбрать тот вариант, который соответствует их задаче и подходит под вычислительные ресурсы.

Александр Плошкин, руководитель направления по развитию качества персонализации в Яндексе:

Рекомендательные алгоритмы помогают людям находить нужные товары, фильмы, музыку и многое другое – именно они лежат в основе сервисов от интернет-магазинов до онлайн-кинотеатров. Развитие этих алгоритмов напрямую зависит от научных исследований, для которых нужны качественные и объемные датасеты. При этом опенсорс-датасеты чаще всего невелики по размеру или уже устарели, так как коммерческие компании, которые накапливают терабайты данных, редко их публикуют. Это создает разрыв между академическими исследованиями и потребностями бизнеса.

Публикация больших открытых датасетов наподобие Yambda помогает решить эту проблему.

Yambda создан на основе обезличенных данных Яндекс Музыки, но подходит для оценки качества любых рекомендательных систем, так как в их основе лежат общие алгоритмы.

Данные датасета доступны на HuggingFace, код для оценки замеров – на GitHub.

Напомним, ранее Яндекс обновил опенсорс-фреймворк DivKit: верстка мобильных интерфейсов стала проще.

Источник

Теги

31.05.2025

0 84 Время чтения: 1 минута

Читать следующую

Читать следующую

В 2025 году трафик поисковиков сократился на четверть

Какие нейросети используют россияне для работы и повседневных задач. Исследование ВЦИОМ

ИТ-ассоциации России выступают против налоговой реформы 2026 года

Аудитория мессенджера МАХ превысила 45 миллионов человек

Яндекс Маркет сократил количество блоков в карточке товара и добавил новый параметр

Четверть компаний используют CDP в маркетинге и рекламе. Исследование VK CXhub

Яндекс Вебмастер добавил новый способ подтверждения прав на домен

Антифрод Яндекса научился предотвращать показ рекламы ботам

Яндекс добавил в поисковую выдачу подсказки для сравнения цен с рыночными

Yandex Cloud прошла сертификацию по стандарту, определяющему требования к системе управления ИИ

Добавить комментарий Отменить ответ

Какие нейросети используют россияне для работы и повседневных задач. Исследование ВЦИОМ