Доклад

47:55
16+
Видеозапись доклада

Игорь Кретинин, Mail.Ru Group: Машинное обучение в рекламной системе MAIL.RU

Игорь Кретинин
Программист-исследователь в Mail.Ru Group
  • Видео
HighLoad++ 2014
31 октября 2014, Москва, Россия
HighLoad++ 2014
3
Мне понравилось 0
Мне не понравилось 0

О спикере

Интересы: машинное обучение, data mining, kaggle.com, физика.

О докладе

На основе данных, накапливаемых и хранимых в инфраструктуре рекламной системы MAIL.RU (HDFS, поток данных ~100K записей в секунду), проводится машинное обучение классификаторов, позволяющих разделять различные группы пользователей Интернета. Для представления признаков, характеризующих конкретный обучающий прецедент, используется модель bag-of-words, в рамках которой векторы признаков имеют большую размерность и являются разреженными. Уменьшение размерности пространства признаков методом латентного размещения Дирихле (LDA) позволяет в ряде случаев также проводить тематическое моделирование распределения признаков. Рассматриваются две практические задачи: (1) разделение пользователей на два класса в соответствии с требованиями таргетированной рекламной кампании; и (2) предсказание месячного дохода пользователя.
#бизнес #ит #по #разработка
Комментарии для сайта Cackle