«Яндекс» запускает проект «Фабрика данных», рассказал «Ведомостям» основатель и гендиректор Yandex N.V. (владеет 100% российского «Яндекса») Аркадий Волож. По его словам, для компании это новое направление по работе с большими данными (Big Data), которое вышло из стадии изучения в стадию поиска бизнес-модели («большие данные» – это базы разрозненных данных, объем которых требует разработки специальных инструментов для их обработки – «Ведомости»).
Если раньше «Яндекс» использовал обработку больших данных для собственных сервисов – прежде всего для поиска, таргетинга рекламы, предсказания пробок, то теперь компания готова диверсифицировать свой бизнес и начать оказывать услуги по обработке и анализу данных для других компаний.
Сейчас «Яндекс» зарабатывает больше 90% выручки на контекстной рекламе, остальное – на медийной. В 2013 г. выручка «Яндекса» составила $1,2 млрд (39,5 млрд руб.) В этом году компания прогнозирует рост выручки в рублях на уровне 27-30%. В 2013 г. рост выручки «Яндекса» составил 37%, в 2012 г. – 44%, в 2011 г. – 60%.
Как эксперимент проект больших данных стартовал в «Яндексе» еще зимой. С тех пор, по словам Воложа, «Яндекс» запустил несколько десятков пилотных проектов с разными партнерами. «Такого рода технологии, как у «Яндекса», есть далеко не у всех, наверное, у пары десятков компаний в мире», – говорит он. До старта «Фабрики данных» у «Яндекса» уже был один пример применения технологии подсчета больших данных – в Европейскиом Центре ядерных исследований (ЦЕРН). «Это сработало и дало надежду, что может сработать где-то еще», – добавляет Волож.
Руководитель проекта «Фабрика данных» Евгения Завалишина рассказала «Ведомостям», что «Яндекс» выделил четыре сферы, в которых могут применяться эти технологии. Например, в поведенческой аналитике. Так, в проекте с крупным розничным банком «Яндекс» проанализировал часть клиентской базы данных и дал рекомендации, каким клиентам какой продукт предложить. Этот эксперимент был очень успешным, говорит Завалишина. При этом компания не анализировала сами продукты банка, а просто отследила, кто что покупал и как реагировал на предложения продуктов.
Технологии «Яндекса», по словам Завалишиной, также могут применяться еще в трех сферах: анализе данных с различных датчиков (это может помочь компаниям предсказать поломки), распознавании образов и голоса (например, слежка за газопроводом или линией электропередач при помощи дронов и анализ полученной информации), в построении оптимальных маршрутов, предсказании дорожных проблем.
По словам Воложа, для «Яндекса» «Фабрика данных» пока стартап: компания уже немного зарабатывает на своих услугах, но много инвестирует в развитие этого проекта. «У нас есть несколько гипотез, в какую сторону двигаться. Мы уже точно поняли, что хорошие продукты на базе Big Data – это не научная фантастика, поэтому принято окончательное решение развивать это направление», – объясняет он. Однако история с Big Data, по словам Воложа, еще очень новая: «многие это изучают, но в основном пока идут исследования и первые пилотные проекты. Все понимают, что это что-то большое, но денег еще нет, и непонятно, какая бизнес-модель лучше всего выстрелит».
Волож и Завалишина говорят, что оценки аналитиков рынка Big Data сильно разнятся. «Но все сходятся на том, что рынок огромный и очень многообещающий, считает Завалишина. Аналитики IDC подсчитали, что в мире к 2018 г. рынок больших данных составит $60 млрд, Business Analytics Software считает, что к 2018 г. он составит $30 млрд.
Самая известная компания, которая занимается поставкой решений для правительственных агентств в США, — Palantir. Очень большой бизнес – платформа для работы нескольких десятков служб в США, которые занимаются антитерроризмом, говорит вице-президент IBS Сергей Мацоцкий. Среди финансовых решений используются как классические статистические методы, так и эмпирические аналитики. «Здесь граница между классическим дата майнингом и Big Data не очень жесткая. В Big Data активно используются статистические методы, в дата майнинге и раньше использовались элементы анализа «а ля Big Data», – говорит он.
В ритейле сейчас наблюдается бурное развитие рекомендательных сервисов, среди которых лидируют Amazon и eBay. «В офлайновом ритейле – чемпион Wallmart, который всегда анализировал покупательские предпочтения, но сейчас активно развивается анализ не только чеков, но, например, видеоинформации о передвижениях покупателей в магазине», – говорит Мацоцкий.