Доклад

Валерий Старынин, Badoo: Использование Hadoop в Badoo

Профессиональная конференция разработчиков высоконагруженных систем HighLoad++ 2014. 31.10.2014. Москва, Россия
ТезисыМы используем Hadoop для сохранения всего click stream с сайта и серверов мобильных приложений - это порядка 1 миллиарда событий в день. А еще мы собираем и анализируем действия пользователей с северной и клиентской стороны - это еще порядка миллиарда событий в день.Как все это организовать, запустить и использовать, что можно и что нельзя сделать с помощью Hadoop - об этом будет мой доклад.ОписаниеВ Badoo мы собираем и анализируем большое количество статистической информации. Настолько большое, что сейчас мы просто обязаны думать о масштабировании и параллелизации систем сбора, хранения и отчетов (reporting). Именно для хранения более полной информации, облегчения масштабирования и ускорения получения отчетов мы стали применять Hadoop. Каких результатов мы смогли добиться, какие задачи еще стоят перед нами и какие ограничения мы выявили для себя - обо всем этом я и расскажу в докладе.

Тематика: Информационные технологии

Обсуждение

Комментарии для сайта Cackle
Оцените доклад
Авторизируйтесь, чтобы продолжить просмотр