О рынке RTB, programmatic-платформе и применении big data в рекламе

Аналитика
Антон Бут, руководитель отдела данных компании Auditorius, занимающейся алгоритмическими закупками и обработкой данных, рассказал редактору Growth Hacks Данилю Хасаншину о технологиях RTB, programmatic-платформе, и о рынке больших данных в рекламной индустрии.

Аналитика: О рынке RTB, programmatic-платформе и применении big data в рекламе
Антон Бут


Даниль Хасаншин: Раньше технологию называли RTB, что вызывало серьезную путаницу, а теперь для простоты используется термин «programmatic», и всем все понятно?

Антон Бут: Programmatic — это подход, концепция, суть которого заключается в автоматизации покупки интернет-рекламы. RTB (Real-Time Bidding) — термин, обозначающий протокол закупки интернет-рекламы по аукционному принципу. То есть покупка может происходить и не по аукционному принципу (например, по фиксированной цене напрямую на площадках), поэтому RTB — один из механизмов реализации programmatic, но сам по себе programmatic гораздо шире. В России этот рынок только развивается, тогда как на Западе он уже есть несколько лет.

Что представляет собой ваша компания, сколько человек в ней работает, и каковы ваши стратегические векторы?

В нашей компании порядка 50 человек, и мы сейчас достаточно быстро растем. Если выделять основные направления, которыми мы занимаемся, то это четыре продукта. Первый продукт можно назвать programmatic — агентство полного цикла: к нам приходят клиенты, мы для них полностью осуществляем programmatic-закупку уже как полноценное решение. Кроме того, мы выполняем агентские задачи: отчеты, договоры, аналитика, коммуникации с клиентами, иногда даже рисуем креативы, занимаемся оптимизацией — полноценный full-service.

Второй продукт — это платформа по обработке больших данных The Big History (tBh), представляющая собой систему глубокого анализа данных о пользователях без привязки к персональным данным. По сути, это анализ больших данных в интересах пользователя. После процедуры обработки данных мы получаем готовые сегменты с интересами пользователей. Всего в нашей таксономии более 170 готовых сегментов аудитории.

Третий проект — собственная programmatic-платформа. Версию для рекламных агентств планируем запустить в мае 2015 года. Это позволит любому агентству самостоятельно управлять programmatic-закупками, а в будущем будет и более простая версия для небольших прямых рекламодателей, которые предпочитают самостоятельно управлять рекламными кампаниями (self-service). Аналогов на российском рынке нет, и продукт уже работает, но находится в тестовом режиме: наши сотрудники осуществляют закупки внутренне, однако пока мы не открыты для рынка.

Помимо наших собственных данных в programmatic-платформе будут доступны готовые данные всех основных поставщиков рынка. Закупку можно будет осуществлять в одном месте, и, что очень важно для многих агентств, здесь же будет представлен весь необходимый интерфейс и статистика. Иными словами, игроку рынка не нужно будет в каждом отдельном месте сводить разную информацию, и будет возможность сразу скачать все необходимые отчеты в удобном формате для внутренних бизнес-процессов.

Аналитика: О рынке RTB, programmatic-платформе и применении big data в рекламе

И четвертый проект, еще на стадии финального формирования как продукта (хотя уже есть клиенты) — это DMP для конечного рекламодателя (Data Management Platform — платформа для сбора и управления большими данными). Платформа позволит централизовано собирать, хранить и анализировать данные из различных разнородных источников как то: внутренние CRM клиентов, данные из социальных сетей и любых внешних онлайн- и офлайн-поставщиков данных. Это позволит бренду собирать данные о своих клиентах в одном месте и использовать для повышения эффективности маркетинговых активностей.

Откуда берутся большие данные? Я знаю, что есть какие-то прямые доступы к тому, что собирает, к примеру, Google. Но чтобы подключиться к этим данным, нужны такие мощности, что всего в мире существует 3-4 компании, которые готовы этот поток данных обрабатывать. Это сырые data. Как их вообще можно обрабатывать, учитывая такие объемы?

Да, источников сырых данных очень много. Мы не используем данные Google, других источников на рынке огромное количество. Фактически любая компания, любой сайт являются источником данных. Data — это история посещений определенных сайтов в интернете, история лайков и поисковых запросов. Эти сведения собираются при помощи плагинов, бесплатных счетчиков, которые ставятся на сайте. Данные могут продаваться поставщиками услуг, которые прямо видят весь трафик.

Поставщики услуг? Кто в данном случае этим занимается?

Например, Московская городская телефонная сеть или любой провайдер услуг. На Западе данные продают фактически все. Начиная от компании Expedia Travel, предоставляющей информацию о том, кто что покупает, кто куда летает, заканчивая страховыми компаниями — что и сколько покупает клиент, его платежеспособность и так далее. Но есть те, кто использует данные только в целях своей компании: «Яндекс», Mail.Ru и Google не торгуют данными.

Но Facebook торгует данными?

Нет, Facebook создал внутрикорпоративную рекламную платформу Atlas, которая, однако, позволяет сторонним сайтам изучать поведение пользователей. Она призвана помочь своему владельцу бороться с монополией компании Google на рынке контекстной рекламы. Но при этом Facebook не делится своими данными.

Как идет работа с поставщиками данных?

Рынок данных появился совсем недавно, еще два года назад такого понятия не существовало. Впервые об этом начали говорить на РИФе, затем появились компании, которые начали позиционировать себя игроками рынка данных. Следует отметить, что он до сих пор находится в стадии формирования, а мы являемся одной из тех компаний, которые формируют спрос на data.

Механизм работы следующий: поставщик предоставляет нам определенное количество данных. Что мы делаем? Мы смотрим, сколько у них данных — 2 или 10 млрд записей. Дальше анализируем, откуда приходят данные, что это за сайты, сколько у них пользователей. То есть мы смотрим на количество данных и охват — это первоочередные задачи. Дальше мы анализируем, насколько данные качественные, и что они могут рассказать о пользователе. Чтобы наши рекламодатели, приходя к нам, смогли выбрать нужную им целевую аудиторию, например, всех автомобилистов России.

А если подробнее о технологии?

Мы programmatic-платформа — мета-DSP (Demand-Side Platform — это технологичная платформа, которая представляет интересы рекламодателя в экосистеме RTB), к которой подключено несколько DSP. И мы работаем над оптимизацией всех данных, включая и то, в какой именно DSP на одной и той же площадке покупать показы креатива.

При покупке сырых данных мы получаем от разных поставщиков историю посещения сайтов, каждый пользователь получает идентификатор (ID). От одного поставщика мы видим, что посетитель заходил на 10 сайтов, еще от одного — на 105, таким образом, о каждом пользователе набираем некий объем информации.

Дальше мы проводим латентно-семантический анализ контента страницы, то есть определяем тематику каждой конкретной страницы. Мы узнаем, что человек посетил некое количество страниц, которые были посвящены определенным тематикам. У нас есть несколько тысяч категорий, одна или несколько из которых может быть присвоена конкретной странице. И вот с этой информацией уже можно работать. Чтобы узнать, насколько площадка и ее данные нам интересны, мы договариваемся о некоем тестовом периоде.

Поставщик не боится, что вы возьмете и присвоите всю базу данных за этот тестовый период?

Нет, у этих данных срок жизни сравнительно небольшой. Вот ты сегодня ходил на сайт про валюту?
Да, потому что это актуально сегодня.
А послезавтра уже нет смысла показывать эти данные, потому что тебя это больше не интересует. Срок актуальности информации зависит от тематики: в случае автомобильной — это несколько месяцев. Но обычно все ограничивается буквально несколькими днями, максимум десятью.

Помимо того, что сами категории очень разнятся, чем меньше времени назад ты ей интересовался, тем более релевантной будет твоя реклама. Поэтому если собирать и хранить долгую информацию, то половина пользователей будет во всех сегментах. Реклама в этом случае становится менее релевантной. Так как людей много, ресурсы и рекламодатели ограничены, то есть необходимость показать рекламное объявление только тем людям, которым это сейчас максимально интересно.

У нас хранятся все данные, но не все мы используем. Смотрим, какой объем data мы получили. Например, 3 млрд записей, оцениваем, сколько нам интересны на самом деле, что может заинтересовать рекламодателя. Мы оцениваем, какие нужны категории и насколько они интересны и ценны. И думаем, хотим мы за это платить или не хотим.

Аналитика: О рынке RTB, programmatic-платформе и применении big data в рекламе

Есть платформа по обработке больших данных (DMP, о которой шла речь выше), сделанная на собственных технологиях, и programmatic-платформа, к которой подключено несколько DSP. Оба этих направления востребованы: с прошлого года бизнес вырос на порядок в плане объемов. И хотя мы только начинаем продавать свои данные на рынке, уже выстроилась очередь компаний, которые находятся в процессе интеграции. Мы понимаем, что есть огромная потребность в качественных данных.

Так, мы уже реализовали проект с гостиничным порталом HRS. Разделив потоки аудитории и разработав для каждого из них отдельные посадочные страницы, мы повысили общий прирост конверсий по итогам двух месяцев работы на 23% и сократили бюджет на продвижение в 2 раза.

Как вы продаете эту идею вашим клиентам?

Мы образовываем рынок. Наши основатели, Геннадий Нагорнов и Валерий Кашин, рассказывают о programmatic. Про термин RTB знают многие — теперь наша задача заключается в том, чтобы рассказать детально, что есть рынок данных, что представляют собой алгоритмические закупки и насколько глубоко можно таргетировать аудиторию.

Как отдельная компания, занимающаяся данными, существует tBh. Часто спрашивают о конфиденциальности данных. Мы не продаем данные клиента — first-party data — о визитах на сайт, действиях пользователя. Они существуют в отдельной базе данных и могут быть использованы только самим клиентом в его рекламных кампаниях. Для формирования аудиторных сегментов используются только данные, которые мы покупаем на легальной основе.

Пишете, что у вас охват 80% аудитории. Почему не меньше и не больше?

Если говорить про охват, 20% — это избыточные данные, о которых я говорил. 80% сполна покрывают все нужды рекламодателей.

Как идет определение более узких данных, например, пола? Так, «Яндекс» использует «Яндекс.Навигатор» диктофон. Какие еще есть варианты, какими вы пользуетесь?

Чтобы разделить аудиторию на категории, существует следующий алгоритм. Берется контрольная группа, про которую знаете, что она состоит, например, из мужчин (они заполнили анкетные данные в некой социальной сети). «Яндекс» получает такую информацию из «Яндекс.Почты»: люди при прохождении регистрации заполняют профиль и указывают пол.

Дальше начинается математика, которой занимаются наши специалисты по данным (data scientists). Изучается история поведения в интернете остальной массы ID: чем ох действия отличаются от поведения отобранной категории мужчин. В итоге у нас появляется некий алгоритм, по которому с некоторой вероятностью от 50 до 90% можно сказать, какого пола пользователь. Его можно применять к более тонким данным профилей, например, профессии или социальному статусу.

Можешь, например, признаки бота назвать какие-то? Как вы их отсекаете?

Количество посещений, время посещения сайта, IP адрес, движения «мышкой». Мы отслеживаем это. Например, используем анализ user agent, с их помощью узнаем, через какое устройство пользователь вышел в интернет. Другой способ — анализ cookies, срок жизни которых у ботов составляет менее суток. Мы фильтруем данные от ботов до того, как сформировать из них сегменты и предоставить их клиенту.

На ЦП есть интересная колонка «Атака ботов». В ней говорилось и о RTB, что это все одна история — заполонение ботами.

Этот текст к RTB не имеет никакого отношения. В статье описывается ситуация, когда идет покупка не по данным, а по местам размещения. Но если ты покупаешь не сайт, а конкретных людей, которые уже «очищены» от ботов, то клиент с ними не столкнется. Можно говорить, что если не хочешь, чтобы твою рекламу показывали боту — используй технологию programmatic и аудиторных закупок.

Источник: siliconrus.com
  • ,
  • avatar
  • 0
  • 1275

0 комментариев

Оставить комментарий

Комментировать при помощи:


Только зарегистрированные и авторизованные пользователи могут оставлять комментарии.