Термин Big Data — большие данные — стал популярным несколько лет назад. Все больше компаний используют в своей работе аналитику, основанную на сложных математических моделях.
В феврале 2012 года в The New York Times вышла статья под заголовком "Как компании узнают ваши секреты". Ее автор Чарльз Дахигг буквально разворошил осиное гнездо — он рассказал, как сотрудник отдела статистики сети Target Эндрю Пол разработал систему, которая позволяет предугадывать потребности клиентов. Например, одна школьница получила от Target по почте купоны на товары для новорожденных, и ее отец устроил в магазине грандиозный скандал. Правда, позже выяснилось, что девушка и правда беременна. Пример того, как математическая система оказалась прозорливее родителей, вошел в учебники, и с тех пор использование в бизнесе больших данных только набирает обороты.
Под термином "большие данные" специалисты обычно имеют в виду огромный объем информации (часто неструктурированной), которая поступает очень быстро и не поддается обработке с помощью стандартного программного обеспечения. Для хранения, обработки и анализа таких данных нужна специальная архитектура. Технологии работы с большими данными позволяют тестировать разные гипотезы, выявлять неочевидные связи и скрытые закономерности, которые невозможно обнаружить традиционными способами. Компании используют математические модели для анализа потребительского поведения, персонализации продаж, планирования ассортимента, оптимизации бизнес-процессов и т. д. Скажем, главная страница крупного интернет-магазина меняется в зависимости от температуры воздуха на улице. Компания выяснила, что чем холоднее, тем чаще люди покупают книги, поэтому отслеживает, из какого города зашел пользователь, какая там сейчас погода, и в зависимости от этого предлагает ему больше или меньше книг на первой странице.
Активнее всего используют сложную аналитику телекоммуникационные компании, банки, страховщики и ритейлеры. По словам младшего партнера консалтинговой компании Bain & Company Ростислава Хоменко, ритейлеры, открывающие "магазины у дома", бьются за лучшие места, и этот процесс растянется еще на 2—3 года. Большие данные помогают им минимизировать ошибки при размещении торговых точек. У сети "Пятерочка" в 2014 году насчитывалось 4789 магазинов, в 2016-м их число практически удвоилось — до 8363. Внедрив геоинформационную систему, компания стала открывать по 5—6 точек в день. Для разработки этой системы "Пятерочка" закупила базы данных по домохозяйствам (количество жителей конкретных населенных пунктов, их доходы, проходимость торговых точек), наличию конкурирующих магазинов, собрала информацию по всем объектам недвижимости, которые она когда-либо оценивала, а также учла расходы и доходы собственных магазинов. Программа позволяет определять оптимальную локацию для нового магазина, необходимую площадь торгового зала, потенциальную выручку торговой точки и т. д. Обнаружив помещение, сдающееся в аренду, сотрудник "Пятерочки" "пробивает" его в системе и моментально получает прогноз по товарообороту. В 85% случаев прогнозы сбываются или результаты превосходят ожидания. В прессе представители компании озвучивали, что за два года потратили на систему около 80 млн рублей.
По словам Ростислава Хоменко, использование больших данных может приносить компании доход в размере 0,5—2% ее выручки. Британская сеть Tesco получает выгоду до 100 млн фунтов стерлингов в год, потому что корректирует ассортимент магазинов в зависимости от прогноза погоды и местных новостей, оптимизирует систему скидок на продукты, у которых истекает срок годности и т. д.
По мнению Хоменко и многих других экспертов, Россия по части использования больших данных и сложной аналитики существенно отстает от США и Европы. У нас еще не так остра конкуренция, чтобы сражаться за считанные проценты от выручки. Однако уже через два-три года компании, которые инвестировали в развитие серьезных аналитических инструментов, получат стратегическое преимущество. Для этого им необходимо выполнить несколько условий.
1. У высшего руководства должно быть видение, зачем компании нужны большие данные и какую выгоду можно из них получить. Без этого невозможно строить аналитическую систему.
2. Данные нужно найти, собрать и инвентаризировать. За годы работы бизнес накапливает много информации, но часто данные дублируются в разных источниках, их придется вычищать и при необходимости дополнять. Этот процесс может занять месяцы. Как правило, компании используют внутренние данные, гораздо реже покупают информацию у сторонних поставщиков. Тем не менее, сегодня десятки провайдеров официально продают обезличенные данные в самых разных сферах. Например, в конце прошлого года Сбербанк объявил, что собирается продавать прогнозные и статистические модели, основанные на обобщенной информации о клиентах.
3. Найти профессионалов, которые умеют работать с большими данными, а таких на сегодняшний день очень мало, и все они на вес золота. По словам Ростислава Хоменко, в США подобные специалисты зарабатывают не менее $200 тыс. в год, а в Москве их зарплата может достигать нескольких миллионов рублей в год. Немного дешевле обходятся специалисты из регионов, но все равно это серьезные суммы. Некоторые компании находят специалистов в Азии, где зарплаты ниже, чем в России. Например, сеть "Метро Кэш энд Керри" использует свой общий центр обслуживания в Индии, где с большими данными работают несколько человек.
4. Инвестировать в хранение, обработку и анализ данных. На российском рынке сегодня представлены десятки компаний, в том числе мировых, предлагающих программное обеспечение и платформы для работы с большими данными. В основном, они задействуют технологии распределенных вычислений и различные алгоритмы машинного обучения. Но несмотря на то, что умные программы способны с большой долей вероятности рассчитать, что будет происходить с бизнесом и с клиентами, ни одна из них не ответит на вопрос "почему?". И здесь не обойтись без человеческого участия, опроса клиентов и т. д.
Мы нашли в России несколько примеров, когда крупные компании внедрили сложную аналитику и успешно используют большие данные для персонализации продаж.
Поход в "Метро"
"Моя мечта — чтобы клиент, получив купон на скидку, воскликнул: “Откуда они узнали, что я как раз завтра и собирался это купить?”" — говорит руководитель департамента по развитию бизнеса сети "Метро Кэш энд Керри" Владислав Тихомиров. Реализовать эту мечту в полной мере пока не удалось, однако компания научилась точечно работать с потребностями клиентов и выстраивать персонализированные коммуникации. Причем из всех подразделений "Метро" именно российская сеть оказалась первопроходцем.
На сегодняшний день компания открыла 89 торговых центров в 50 регионах России, ее основная аудитория — мелкие оптовики, занимающиеся закупками для нужд собственного бизнеса (магазинов, кафе, ресторанов, гостиниц, офисов). Кроме того, представители компаний-клиентов приобретают товары и для личного пользования. Все они предъявляют именные карточки, без которых в сети никого не обслуживают. Только активных пользователей насчитывается несколько миллионов.
Казалось бы, если все клиенты используют карточки и все их транзакции фиксируются, то с точки зрения сбора данных "Метро Кэш энд Керри" находится в более выгодном положении по сравнению с другими российскими ритейлерами. Тем не менее, сеть столкнулась с типичной маркетинговой проблемой — качество и актуальность данных оставляли желать лучшего. "Как это ни парадоксально, еще пять лет назад у нас не было контактов держателей карт. Мы знали почтовый адрес организации, каким бизнесом она занимается, имя и фамилию ее представителя, но лишь у 5% был телефон или электронная почта, и не факт, что правильные", — рассказывает Владислав Тихомиров.
Уточнение данных заняло от полутора до двух лет. Компания перезапустила программу лояльности, и при переходе на новые условия покупатели оставляли контакты. Кроме того, помогли лотереи, розыгрыши призов и специальная акция, когда клиенты оставляли контакты на входе в магазин. Сейчас у "Метро" есть оперативный способ связи с большей частью клиентской базы. Решив одну проблему, компания тут же уперлась в другую — оказалось, что для анализа транзакций по картам, которые производят миллионы клиентов, не хватает производительности серверов. Пришлось закупать новое "железо".
"Метро" регулярно рассылает клиентам бумажные каталоги по почте — по словам Владислава Тихомирова, это дорогой канал, но для формата, в котором работает сеть (у компании не очень высока частота визитов, но самый большой в продуктовом ритейле средний чек), расходы на продвижение окупаются. Чтобы сделать предложения персонализированными и, соответственно, увеличить выручку, компания разработала скидочные купоны. Но как понять, кому из миллионов покупателей стоит их предлагать? У "Метро", как и у каждого ритейлера, есть стратегические сегменты клиентов (всего их шесть), но для персонализации этого недостаточно — нужно строить математические модели.
В качестве персональных предложений компания использует два типа купонов на товары из определенной категории (например, твердые сыры или тихие вина из Франции). Первый тип — это скидки на любимые товары, которые конкретный клиент покупал чаще всего. Второй тип купонов — скидки на категории товаров, которые человек не приобретал, но это делали клиенты, похожие на него. "Похожесть" определял математический алгоритм.
Купоны стали рассылать раз в две недели по электронной почте и СМС, позже раздавали и на кассе. Отдача от первого типа купонов оказалась очень высокой — люди, которые воспользовались персональным предложением, приходили чаще и тратили на 30% больше, чем клиенты, которые такого предложения не получили. Причем покупки были сделаны не только в тех товарных категориях, на которые компания давала скидки. Для чистоты эксперимента купоны также отправили случайно выбранным покупателям, но, по словам Владислава Тихомирова, конверсия в этом случае была меньше, чем в группе с персонализированными рассылками.
Второй тип купонов тоже принес компании рост продаж, однако в данном случае математическая модель требует серьезной доработки. Дело в том, что особенности формата ограничивает "Метро" в использовании данных — значительная часть клиентов приходит за покупками несколько раз в год, а точность предсказательной модели зависит от частоты контакта с клиентом. Кстати, по этой же причине компания предлагает скидки на товарные категории, а не на конкретные товары — не хватает данных для детальных персональных расчетов.
"Метро" собирается и дальше заниматься развитием персонализированных коммуникаций с клиентами. А пока Владислав Тихомиров сформулировал для себя несколько выводов.
1. Результаты маркетингового эксперимента лучше оценивать не сразу, а с течением времени. Дело в том, что покупатели инертны, и стоит учитывать силу их привычек. Например, поначалу отдача от купонных акций в "Метро" была в три-четыре раза ниже, чем сейчас. И если бы компания принимала решение после первых рассылок, эксперимент по работе с данными наверняка бы уже закрыли.
2. Данные о клиентах нужно расширять и углублять — это повысит качество и релевантность персональных предложений. Сегодня компании покупают данные о поведении потребителей в интернете, соцсетях и т. д. Как правило, взамен нужно передать сторонним организациям обезличенные данные о собственных покупателях, однако их "обратная персонализация" с высоким уровем точности не составляет большого труда. В "Метро" не готовы делиться своими данными, пока не будут уверены в безопасном хранении этой информации.
3. Важно получать развернутую информацию о товарах, которые покупают клиенты. Обычно в чеке фиксируются наименование товара, цена и принадлежность к категории, но сведения о том, что продукт, например, низкокалорийный или используется в веганской кухне, может повысить релевантность маркетинговых коммуникаций. Правда, здесь потребности маркетологов сталкиваются с операционными ограничениями — ввод дополнительных данных в информационную систему компании может повлиять на другие процессы. Так что придется балансировать между желанием обогатить базу данных и соблюдением требований эффективности бизнеса.
4. Важна операционная готовность компании к экспериментам. Скажем, чтобы вводить новые механики акций и скидок, нужно сначала обучить персонал — кассиры должны разобраться, как выглядят эти купоны, как их принимать и т. п. В "Метро" все новые маркетинговые проекты начинают с пилотных запусков.
Возможно, со временем математическая модель, основанная на данных клиентов и истории их транзакций, сможет не только анализировать прошлые покупки и подсказывать, что было нужно конкретному клиенту, но и предугадывать его будущие потребности — что ему понадобится завтра. По мнению Владислава Тихомирова, ни одна российская компания пока этого делать не умеет.
Три в одном
В компании "Вымпелком" шутят, что за несколько дней способны предсказать, когда девушка бросит своего молодого человека. И даже могут предложить ей нового бойфренда, идеально подходящего под ее профайл. Все дело в математической модели, основанной на большом количестве поведенческих данных — как часто человек разговаривает по телефону, какую музыку слушает, какие категории товаров покупает с помощью мобильного и т. д. В каждой шутке, как известно, есть доля штуки, но на конец 3 квартала 2016 года база "Вымпелкома" составляла более 58 млн действующих клиентов, и компания постоянно совершенствует свои навыки работы с большими данными. Несколько месяцев назад "Вымпелком" выделил в отдельную структуру блок по развитию нового и цифрового бизнеса, и сейчас здесь работают более 200 человек. Руководитель подразделения Джордж Хелд каждую неделю докладывает генеральному директору, как продвигается работа.
Один из последних проектов — запуск конвергентного продукта "Все в одном" (мобильная связь, домашний интернет и ТВ), который компания начала продавать с марта 2016 года.
Пакетные предложения для физических лиц (интернет, цифровое телевидение и телефония) позволяют операторам "привязать" абонентов, оптимизировать расходы на их поддержку и снизить отток, что очень важно в условиях насыщения рынка. Однако у подобных продуктов невысокая маржа, продавать их сложно, и если неправильно выделить целевую аудиторию, риски очень велики. Продавая агрессивно, без оглядки на интересы конкретного абонента, компания может больше потерять на подключении, чем заработать на этом клиенте. Соответственно, чтобы человек использовал продукт как можно дольше, нужна высокая конверсия, а без сложной аналитики настроить высокотаргетированные продажи невозможно. "Мы начали таргетированные продажи “Все в одном”, когда научились работать с большими данными. Сейчас наши знания о клиенте позволяют сделать ему предложение, которое он с большой вероятностью примет", — рассказывает Джордж Хелд.
Для начала в "Вымпелкоме" провели фокус-группы, чтобы определить, как потенциальные клиенты принимают решение о покупке, что для них важно в конвергентном продукте. На основании опросов компания выделила систему ключевых параметров для анализа (их называют "триггеры"). Например, местоположение дома или офиса клиента, подведен ли к этому адресу ШПД-кабель, какие ТВ-каналы человек смотрит, сколько у него девайсов и т. д.
Для поиска целевой аудитории и расчета математической модели компания задействовала собственные источники данных. Во-первых, информация о клиентах, как люди используют услуги связи. Важны также их финансовые возможности — сколько люди тратят в месяц на оплату связи. Дело в том, что в продукте "Все в одном" домашний интернет и ТВ обходятся абоненту ежемесячно в 1 рубль, однако платеж за мобильную связь составляет от 500 до 1800 рублей в месяц в зависимости от выбранного тарифа. Информацию об абонентах операторы накапливают годами, и ее хранение требует площадей. Например, дата-центр "Вымпелкома" в Ярославле — это огромное здание, заполненное серверами. Данные обычно поступают в неструктурированном виде, а затем для их хранения компания создает определенную инвентаризационную систему.
Во-вторых, база собственных продуктов, синхронизированная с CRM-системой. У "Вымпелкома" есть паспорта всех домов в России, в том числе информация о качестве покрытия в этих домах, есть ли доступ к сетям LTE, нет ли перебоев с электричеством, возникают ли сложности с управляющей компанией или с доступом в здание и т. п. Естественно, предлагать человеку новую услугу бессмысленно, если в его доме плохая связь. В ряде случаев компания даже переставляла базовые станции, чтобы улучшить покрытие в местах большого скопления потенциальных клиентов.
Наконец, третий источник имеет отношение к платным телевизионным каналам — может ли компания продавать к ним доступ на конкретной территории, нет ли юридических сложностей и т. д.
Все данные обрабатывались на платформе Hadoop, причем математическая модель уточняется по мере наращивания продаж и обновления триггеров. Изначально охват предполагал 3—3,5 млн человек. Поскольку продукт "Все в одном" — высокотаргетированный, компания использовала один из самых дорогих каналов связи — звонки из колл-центра с персональными предложениями. Все данные о клиентах стыкуются с CRM-системами, поэтому если представитель целевой аудитории сам обращался в компанию по какому-либо вопросу, ему также предлагали новый продукт. Работа с потенциальными клиентами была построена по принципу кругов по воде — сначала обзванивали тех, кто четко попадал в целевую аудиторию по всем параметрам, затем расширяли список и связывались с остальными. Джордж Хелд не раскрывает показатели конверсии, однако сообщил, что она "очень высокая".
На конец 2016 года "Вымпелком" подключил к пакету "Все в одном" около полумиллиона домохозяйств, и, по словам Джорджа Хелда, это очень хороший результат. Уровень удовлетворенности клиентов составляет 94%, а NPS (Net Promoter Score, или индекс клиентской лояльности) продукта — 65%, что в компании считают очень высоким показателем. Соответственно, отток клиентов, подключивших новый продукт, в два-три раза ниже, чем при использовании широкополосного доступа в интернет, и в четыре-пять раз меньше, чем на обычных мобильных тарифах.
Обувь как приманка
У большинства ритейлеров круг покупателей уже сложился. "Свои" клиенты давно охвачены маркетинговыми предложениями — участвуют в акциях, приходят за новинками, покупают в соцсетях и т. д. Однако время от времени компании стараются расширить этот круг и привлечь людей, которые никогда у них не покупали. Действенный инструмент — предложить им хорошую скидку. Вот только как определить, кому именно направить сообщение, чтобы не тратить лишние деньги и не стрелять из пушки по воробьям?
Обувная сеть Alba продает женскую, мужскую обувь и аксессуары в 40 магазинах в разных городах России, в ее программе лояльности участвуют около 350 тыс. человек. "Нам было интересно привлечь новых покупателей и нарастить выручку, поэтому в конце прошлого года мы решились на эксперимент", — рассказывает директор по маркетингу Alba Наталья Щукина.
Привлечением новой аудитории занялся российский стартап "Сорсдата", который предоставляет торговым сетям услуги по анализу данных и персонализации программ продвижения. Как объясняет генеральный директор "Сорсдата" Дмитрий Малянов, аналитики должны были выбрать из собственной базы покупателей, которые с высокой вероятностью могли стать клиентами в Alba. "Сорсдата" работает, в частности, с клиентской базой родственной компании "Рево" — это микрофинансовая организация, которая предлагает физическим лицам оплату товаров и услуг в рассрочку на три или шесть месяцев. В основном, "Рево" сотрудничает с сетями с невысоким средним чеком в категориях "обувь", "одежда", "детские товары", "продукты питания" (например, "Утконос", "Детский мир", "Монро" и др.). Покупатели ежемесячно расплачиваются в личном кабинете на сайте "Рево", и с их согласия компания включает их контакты в информационную рассылку с предложениями от партнеров. На сегодняшний день с "Рево" покупают около миллиона человек.
Чтобы выбрать из базы потенциальных клиентов Alba, нужно было проанализировать их поведенческие профили и построить модель. Портрет типичного потребителя Alba — женщина от 35 лет и старше, с доходом от 65 тыс. руб. в месяц. Средний чек в сети — около 10 тыс. руб. "Сорсдата" располагала информацией о том, как ведут себя активные покупатели в ее базе. Если имеющихся данных было недостаточно для построения модели, компания докупала информацию у внешних партнеров — это платформы-агрегаторы данных в интернете, которые подключены к максимально возможному числу источников (DoubleData, CleverData и другие).
"Мы получаем от внешних партнеров обезличенную информацию о том, как человек ведет себя в соцсетях", — рассказывает Дмитрий Малянов. Партнеры анализируют открытые профили клиента по типу скоринговой системы. Например, сколько раз человек заходил в свой аккаунт за последний год, сколько у него друзей, куда он ездил, какие фильмы смотрел и пр. Десятки факторов оцениваются по определенному алгоритму, и этот же алгоритм присваивает людям баллы. Покупка данных для формирования профиля покупателя может стоить от 50 копеек до 20 рублей за одного человека.
Собрав необходимые данные, аналитики "Сорсдата" построили предиктивную модель — какова будет вероятность покупки, если послать предложение конкретному клиенту и дать ему различные скидки от Alba. В общей сложности оценивали 15 параметров, каждый из которых имел свою значимость. Если итоговый балл оказывался ниже определенного порога, то вероятность, что данный человек купит обувь, падала. Таким образом, "Сорсдата" выделила группу потенциальных клиентов Alba — 50 тысяч человек. Большей части людей из этой группы отправили СМС-рассылку и предложили им различные скидки на сезонную обувь, а также специальный код, по которому можно отследить, откуда пришел клиент. По словам Дмитрия Малянова, конверсия оказалась довольно высокой — 4%. Как отметила Наталья Щукина, выручка превысила затраты на эксперимент в четыре раза. Старые клиенты сети тоже хорошо отзываются на предложения и скидки (Alba коммуницирует с клиентами два раза в месяц), однако результаты продаж обычно скромнее. В компании рассчитывают, что новые клиенты со временем станут постоянными.
Использование сложной аналитики открывает перед компаниями новые возможности. Глубокая сегментация клиентской базы, поиск неявных закономерностей, которые делают продвижение точечным, персонализация продаж — эти и другие задачи можно решать с помощью анализа больших данных.