- PVSM.RU - https://www.pvsm.ru -
14 марта 2017 года в лектории BBDO выступил Артур Хачуян, генеральный директор Social Data Hub. Артур рассказал про интеллектуальный мониторинг, построение поведенческих моделей, распознавание фото- и видеоконтента, а также о других инструментах и исследованиях Social Data Hub, которые позволяют таргетировать аудиторию, используя социальные сети и технологии Big Data.
Артур Хачуян (далее – АХ): – Здравствуйте! Всем привет! Меня зовут Артур Хачуян, я руковожу компанией Social Data Hub, и мы занимаемся различным интересным интеллектуальным анализом открытых источников данных, инфополя и делаем всякие интересные исследования и так далее.
И сегодня коллеги из BBDO Group попросили рассказать о современных технологиях анализа больших данных, больших и не очень данных для рекламы: как это применяется, показать несколько интересных примеров. Я надеюсь, вы будете задавать вопросы прям по ходу, потому что я могу начать нудить и не раскрывать сути и так далее, так что не стесняйтесь.
Собственно, основные направления, где-то когда-либо применялись какие-то «околобигдатные» решения», они все понятны – это таргетирование аудитории, анализ, проведение каких-то анализ-маркетинговых исследований. Но всегда интересно, какие дополнительные данные можно найти, какие можно найти дополнительные смыслы после применения анализа.
С чего мы начнём? Самое понятное – это реклама в социальных сетях. Сегодня снял с утра: почему-то «Вконтакте» считает я именно эту рекламу должен видеть… Хорошо это или плохо – это уже второй вопрос. Видим, под категорию призывников я попадаю точно:
Самое первое и интересное, что можно взять как технологическое решение… Первое, что я хотел решить, перед тем как мы начнём, – определиться с терминами: что такое открытые данные и что такое большие данные? Потому что у всех людей своё понимание на этот счёт, и я никому не хочу навязывать свои термины, но… Просто чтобы не было никаких расхождений.
Лично я считаю, открытые данные – все те, до которых я могу дотянуться без какого-либо логина или пароля. Это открытый профиль в социальных сетях, это поисковая выдача, это открытые реестры и т. д. Большие данные, в моём собственном понимании, я вижу так: если это табличка с данными – это миллиард строк, если это какое-то файловое хранилище – это где-то петабайт данных. Остальное в моей терминологии – это не большие данные, а что-то около.
Идём по порядку. Самое первое и интересное, что можно придумать из анализа открытых источников данных – это высокоточное профилирование и скоринг профилей. Что это? Это история, когда по вашему аккаунту в социальной сети можно предсказать не только кто вы, не только ваши интересы.
Но сейчас, объединяя различные источники, можно понять средний уровень вашей зарплаты, сколько стоит ваша квартира, где она находится. И все эти данные можно использовать буквально из подручных средств. Например, если взять ваш аккаунт в социальной сети, посмотреть, скажем, где вы живёте, где вы работаете; понять, в какой секции бизнеса находится компания, в которой вы работаете; взять выгрузку похожих вакансий с HH и «Суперджоба», если вы аналитик, менеджер и т. д.; посмотреть, где вы живёте (базу, скажем ЦИАНа), понять, сколько стоит аренда жилья в этом месте, сколько стоит покупка жилья в этом месте, предсказать примерно, сколько вы зарабатываете. Дальше по вашим соцсетям можно понять, сколько вы путешествуете, где вы находитесь, насколько вы лояльны к работодателю.
Соответственно, из такого огромного количества метрик мы можем сделать всё, что угодно. Мы можем представить вам продукт, который вам интересен. Представляете, интернет-магазин? Вы заходите туда – этот интернет-магазин отлавливает ваш аккаунт в социальной сети и говорит вам: «Маша, ты только что рассталась с парнем, вот тебе такие-то, определённые продукты». Это не ближайшее будущее…
Ответы на вопросы из аудитории:
Это, опять же, анализ постов. В самом простом понимании – это анализ чек-инов и геолокаций в соцсетях, которые не удаляют метаданные jpeg’а (можно по ним что-то разобрать). Но для оставшихся людей – это обычно текстовые трансляции: либо человек «светит» своё местоположение, когда пишет о чём-то, либо он «светит» свой телефон, по которому можно найти какую-нибудь его рекламу на «Авито» или его аккаунт на «Авто.ру». По этим данным можно объединить (например, «Я продаю автомобиль около Маяковской») и примерно предположить это.
Да! Комментируют обычно, типа: «Ответьте мне или киньте смс-ку, позвоните мне на номер. Такое очень часто бывает с людьми, которые что-либо продают, покупают в социальных сетях, с кем-то коммуницируют… Соответственно, по этому номеру потом можно привязать к нему его профиль на ЦИАНе, если он когда-то что-то публиковал, либо, опять же, на «Авито». Это просто самые популярные, топ источников, он дальше будет – это «Авито», ЦИАН и так далее.
Примерный список вещей, которые можно понять с достаточно высокой достоверностью из открытых источников, – он есть. На самом деле есть ещё больше всяких разных метрик; это зависит от заказчика таких исследований. Есть какое-нибудь HR-агентство, которому интересно, ругаешься ли ты матом в социальных сетях или где-то в публичном пространстве. Кому-то интересно, ставишь ли ты лайки под публикациями Навального или, наоборот, под публикациями «Единой России», или какой-то порнографический контент – такие вещи достаточно часто случаются.
Основные из них – это семейные ценности, примерная стоимость квартиры, жилища, поиск автомобиля и так далее. По этому всему людей можно разбить по социальным группам. Это пользователи московского «Тиндера», кто они (по их картинкам, найденным их аккаунтам в «Фейсбуке»); на основании их интересов разбиты по всяким социальным группам:
Если двигаться ближе к рекламе, то мы уже потихоньку ушли от стандартного таргетинга рекламы, когда ты выбираешь в условном «Вконтакте», что тебя интересуют мужчины 18 лет, подписанные на определённые группы. У меня дальше есть такая картинка, сейчас вам покажу:
Суть в том, что большинство текущих сервисов, которые занимаются анализом, в принципе люди, которые занимаются анализом социальных сетей, именно занимаются анализом интересов… Первое, что приходит в голову людям – это про проанализировать топ групп своих подписчиков. Возможно, с кем-то это работает, но лично я считаю, что это кардинально неверно. Почему?
Вот возьмите сейчас свои телефоны, посмотрите на свой топ групп – обязательно там будет более 50% групп, о которых вы уже забыли, это какой-то контент на самом деле нерелевантный для вас. Вы его совсем не потребляете, но тем не менее система будет стрейчить вас по ним: что вы на рецепты подписаны, на какие-то популярные группы. То есть вы нарушите систему, которая анализирует ваш профиль, и ваши интересы будут не оправданны.
Двигаясь дальше… Что там? Мы предполагаем, что делают остальные люди. Самый, на наш взгляд, адекватный способ оценить интересы пользователей – это лайки. Например, во «Вконтакте» нет ленты лайков, и люди думают, что никто не знает о том, чему они ставят лайки. Да, часть лайков введена в «Инстаграме», в «Фейсбуке» мы что-то видим, но большинство контента в определённых группах не транслирует это общей лентой, и люди живут и думают, что никто не узнает, на что они ставят лайк.
И, собрав определённый, интересующий нас контент какого-то содержания, собрав эти посты, собрав эти лайки, потом по этой базе проверив этого человека, мы можем с высокой точностью определить, кто он, какая у него судьба, чем он интересуется. Определить точно в определённую социальную группу и провзаимодействовать с ним.
У меня есть такой пример. Сразу оговорюсь, что у меня примеры околорекламные и околомаркетинговые, потому что, сами понимаете, большинство кейсов защищают NDA и так далее. Но всё-таки будет много чего интересного. Значит, история с этими людьми: это мужчины, которые купили автомобиль в промежутке 2010 по 2015 год. То, как изменилось их социальное поведение в сети, отмечено цветом. Процент девушек в подписчиках изменился, подписался на «пацанские» паблики, нашёл постоянного сексуального партнёра…
Всё это дело разбито по маркам автомобилей и по количеству людей. Отсюда можно сделать много интересных выводов о поведении людей, как это всё работает. Могу сказать, что «Порш Кайенн» и посаженная «Приора» по количеству привлечённой аудитории практически одинаковы. Качество этой аудитории, их поведение разные, но количество примерно одинаковое. Вывод отсюда можно сделать, ближе к вашему рынку, какой угодно. Продаёте вы «Ауди» — делаете слоган «Купи «Ауди» – «уедь» от родителей!» и так далее.
Это да, смешной пример к тому, что поведение людей, основанное на анализе лайков, на основании того из какой группы в какую они переходят, какой они контент анализируют – практически со 100% вероятностью даёт понять, кто вы. Потому что, если вы не обладаете доступом к сетевому трафику, не читаете личные сообщения, лайки всегда подскажут, кто этот человек – беременная женщина, мама, военный, полицейский. А для вас, как для человека, который может размещать рекламу, это большое попадание в цель.
Ответы на вопросы аудитории:
Вот примерный список источников, который можно использовать, который используется для того, чтобы с большой достоверностью определить социальный профиль человека, кто он.
С социальных сетей мы берём профиль, с ЦИАНа – стоимость квартиры примерно, «Хед-Хантер», «Суперджоб» – это средняя зарплата для данного человека. Надеюсь, здесь нет представителей «Хед-Хантера», потому что они считают, что не очень хорошо у них эти данные брать. Тем не менее это средняя зарплата по определённым регионам для определённых типов деятельности по вакансиям.
«Авито», «Авто.ру»: очень часто люди, когда засветили свой телефон, он у них обязательно есть (в большом количестве случаев) хоть что-то на «Авито», либо на «Авто.ру», или ещё на нескольких сайтах, с которых можно понять, кто они. Если по этому телефону продавали коляску или автомобиль… Росстат и ЕГРЮЛ – это всё-таки больше реестры, с помощью которых можно ранжировать компанию-работодателя – по какой-то формуле, по модели, которую может задать любой человек (можно примерно определить деньги этого человека и т. д.).
Плюс, есть такая интересная штука (как вариант, очень смешно в исследовании) – это, опять же, сбор данных с московского «Тиндера» с помощью ботов для этого «Тиндера». Определялось расстояние до людей, а дальше определялось их примерное местоположение.
Задачей этого исследования было определить количество аккаунтов «Тиндера» на территории государственных учреждений – в Думе, прокуратуре и так далее. Но вы себе, как рекламодатель, можете представить как угодно: это может быть, например, «Старбакс» или ещё кто-то… То есть количество людей того же «Тиндера», которые пьют у вас кофе, что-то заказывают, находятся в магазинах. По поводу этого геоположения: так можно поступить с любым сервисом.
Ответ на вопрос из аудитории:
У нас, например, давно-давно был такой кейс (не исследование), когда мы получали от одного из операторов сотовой связи данные о плотности потока, данные о плотности перемещения сотовых точек, и эта вся информация накладывалась на координаты рекламных щитов, находящихся на автомагистралях. И задача сотового оператора – определить, какое примерно количество человек проезжает и потенциально может видеть эту щитовую рекламу.
Если здесь есть специалисты по щитовой рекламе, вы можете сказать: супер-достоверно нельзя понять – кто-то едет, кто-то не посмотрел, кто-то посмотрел… Тем не менее это пример того, как 20 миллиардов полигончиков таких по Москве, на которых есть плотность этих людей в каждый час по определённым маршрутам… Можно посмотреть, мимо чего эти люди проходили в любой момент и примерно оценить пассажиропоток.
Ответ на вопрос из аудитории:
Идём дальше. Моё любимое – распознавание изображений. Здесь будет небольшой кусочек про поиск людей по лицам, но мы в основном эту часть не берём. Мы берём именно распознавание образов и определения, что на этом изображении – марка автомобиля, цвет его и так далее.
У меня есть такой шуточный пример:
Было такое исследование по поиску татуировок в различных социальных сетях. Соответственно, это же можно применить к любому бренду, к любому визуальному образу, практически к любому визуальному образу. Есть те, которые нельзя определить достаточно достоверно (мы их не берём).
Вот моё любимое. Автомобильные бренды достаточно часто обращаются за такой задачей, потому что их задача, например, – найти всех владельцев каких-нибудь BMW X6, понять, кто они, как они между собой связаны, чем они интересуются и так далее. Это к вопросу о том, с какими автомобилями фотографируются люди в социальных сетях.
Здесь вообще не было никакой фильтрации: предмет их, автомобиль не их; просто такая разбивка автомобилей – возраст и так далее. Но визуальное распознавание образов используется достаточно часто: это и поиск беременных женщин, и поиск логотипов брендов в каком-то масс-медиа (кто и что постит).
Самый мой любимый кейс (которым пользуются различные рестораны): какие роллы постят в социальной сети. Смешная штука, но на самом деле это позволяет много чего интересного понять, во-первых, о собственных покупателях: кто к тебе пришёл и почему они это сделали. Потому что не секрет, что в суши-барах большинство людей (не буду говорить «девушек») фоткается, чтобы зачекиниться, сфотографировать что-то и т. д.
Бренд этим может пользоваться. Бренду интересно, какую именно продукцию ему нужно красиво фотографировать и выкладывать, какие люди туда приходили. Такую вещь можно провернуть практически с чем угодно, начиная от еды.
Ответ на вопрос из аудитории:
Опять же, это еда, это могут быть беременные женщины, мужчины (не беременные), автомобили – всё, что угодно.
Как вариант, было такое новогоднее исследование для одного СМИ. Тоже далеко от рекламы, но тем не менее. Это – какую еду люди постили на Новый год:
Оно здесь ещё разбито по возрасту. Можно просмотреть такую корреляцию, что молодые люди еду в основном заказывают, взрослые в основном делают традиционный стол. Шуточная вещь, но, представляя её себе как владелец бренда, вы можете оценить большое количество вещей: кто и как с вашей продукцией обращается, что о ней пишут. Зачастую не всегда люди упоминают сам бренд в тексте, и традиционные мониторинговые системы аналитические не всегда могут понять, найти это упоминание бренда исключительно потому, что в тексте он не упомянут. Или в тексте он написан с ошибками, нет хэш-тегов или что-то угодно.
Фотографии видно. С фотографией можно понять, центральный ли это объект кадра, не центральный объект кадра. Дальше можно посмотреть, что этот человек написал. Но чаще всего это используется как поиск потенциальной аудитории, которая ездила на определённых автомобилях и так далее. А потом мы с этими автомобилями будем делать много чего интересного.
Вот такой вариант применения подсчёта людей тоже был:
Бывает вариант сопоставления людей, когда нужно по каким-то фотографиям найти людей, понять их социальный профиль, кто они. Опять же, возвращаемся к вопросу о том, что если у нас стоит камера в офлайн-магазине, то это достаточно хороший способ понять, кто к вам приходит, кто эти люди, чем они интересуются, что их сподвигло к вам прийти.
Дальше самое интересное: если мы соберём их аккаунты в социальных сетях, поймём, кто эти люди, чем они интересуются, мы сможем (как вариант) сделать бота, похожего на этих людей; этот бот начнёт жить, как эти люди, и анализировать, какую рекламу он видит в различных социальных сетях. Это позволит достаточно точно понять, какие бренды на этого человека ориентированы. Это тоже достаточно частая история, когда необходимо не просто проанализировать, кто этот человек и какие у него интересы, а ещё и какую рекламу на него потенциально конкуренты ваши или другие заинтересованные люди таргетировать.
Следующая штука интересная: это анализ взаимосвязей между людьми. Сам, собственно, анализ связей в сети, эти сетевые графы – в этом нет вообще ни капли, ничего нового, это всем известно.
Но применение к рекламным задачам – это самое интересное. Это поиск людей, которые задают тренды, это поиск людей, которые распространяют информацию по определённым критериям внутри этой сети. Скажем, нас интересуют те же владельцы определённой модели БМВ. Собрав их всех вместе, мы можем найти тех, кто держит у себя в руках общественное мнение. Это необязательно блогеры автомобильные и так далее. Обычно это простые товарищи, которые сидят в различных пабликах, интересуются каким-то контентом и могут за очень короткий промежуток времени завлечь в эту зону ответственности, в зону интереса ваш бренд или кого-то интересующего для вас.
Здесь есть такой пример. Есть у нас потенциальные какие-то люди, связи между людьми. Здесь оранжевые – это люди, мелкие точки – это общие группы, общие друзья.
Если собрать все эти связи между ними, можно очень чётко посмотреть, что есть люди, у которых между собой есть большое количество общих групп, общих друзей, они там находятся между собой… А если эту же визуализацию разбить на группы по интересам, по контенту, который они распространяют, насколько они взаимодействуют друг с другом… Вот здесь можно посмотреть, что предыдущая картинка стала вот таким образом:
Здесь чётко выделились цветом группы. В данном случае это взяты студенты нашей магистратуры в Высшей школе экономики. Здесь видно, что фиолетовые / синие – это те, кто любят Transparency International, «Открытую Россию», паблики Ходорковского. Снизу слева – зелёные, те, кто любит «Единую Россию».
Можно посмотреть, что предыдущая картинка была вот такая (это просто связи между людьми), а стала чётко разграниченной. То есть все люди всегда связаны между собой, у них есть одинаковые интересы, они дружат друг с другом. Сверху одни, снизу другие, там ещё какие-то товарищи. И если каждый из этих маленьких подграфов отдельно провизуализировать с другими параметрами и посмотреть скорость распространения контента (грубо говоря, кто там что репостит), можно найти в каждой части одного-двух человек, которые всегда держат в руках общественное мнение, провзаимодействовав с которым, попросив отправить пост какой-то или ещё-что – можно получить отклик всей этой интересной аудитории.
У меня есть ещё один такой пример. Тоже граф: это сотрудники BBDO Group, найденные в соцсетях как пример. Выглядит как неинтересное, большое, зелёное, связи между ними…
Но у меня есть вариант, где между ними уже построены группы. Потом, если кому-нибудь будет интересно, есть интерактивная версия – можно покликать, посмотреть.
Сверху справа – те, кто любит Путина. Вот здесь фиолетовые – это дизайнеры; те, кто увлекается дизайном, чем-то таким интересным и так далее. Здесь белые штуки – это руководящий состав (видимо, я так понял); это люди, которые никак, в общем, не связаны, но работают примерно на одинаковых позициях. Остальное – это их общие группы, связи и так далее.
Берём этих людей и находим – дальше рекламное агентство, рекламная компания решает сама: она может денег дать этому человеку, чтобы он как-то провзаимодействовал с этим контентом, ещё что-то, или направить на них свою определённую рекламную кампанию. Тоже достаточно часто применяется, особенно сейчас, потому что все бренды хотят работать с блогерами, хотят, чтобы продвигали их контент, а рекламные агентства не очень хотят контактировать (ну, бывает такое).
И реальный выход из этой ситуации – найти людей, которые не блогеры, не бьюти-блогеры, а например, какие-то реальные существа, которые взаимодействуют с этим брендом, могут в каком-нибудь убогом своём паблике «Мэйл.ру Ответы» написать, получить определённое количество просмотров. Эти люди, которые постоянно интересуются контентом этого человека, они всё это дело распространят, и бренд получит свою вовлечённость.
Второй вариант, как использовать подобную технологию сейчас, достаточно актуальный – это поиск ботов, моё любимое. Это и репутационный риск для ваших конкурентов, и возможность отсеять от рекламной кампании нерелевантных людей, и всё, что угодно (и удаление комментариев, и поиск связей между людьми). У меня есть такой пример, он тоже есть большой интерактивный – его можно подвигать. Это связи людей, которые писали комментарии в сообществе «Лентач».
Такой пример – для того, чтобы вы понимали, насколько хорошо и просто видно ботов; и для этого не нужно обладать каким-то техническими знаниями. Значит, «Лентач» выпустил пост о расследовании ФБК про Дмитрия Медведева, и определённые люди стали писать комментарии. Мы собрали всех людей, которые писали комментарии – эти люди зелёные. Сейчас подвину:
Люди – это зелёные (которые писали комментарии). Они есть здесь, они есть здесь. Голубые точки между ними – это их общие группы, жёлтые – общие подписчики, друзья и так далее. Вот основная масса людей связана между собой. Потому что, какая бы ни была теория трёх, четырёх, пяти рукопожатий, все люди связаны между собой в социальных сетях. Нет людей, которые отделены друг от друга. Даже мои друзья-социофобы, которые используют «Вконтакте» исключительно для просмотра видео, всё равно на какие-то одинаковые с нами паблики подписаны.
Основная масса людей (вот она, здесь) связаны между собой. Но есть такая маленькая группка товарищей, которая находится в друзьях исключительно друг у друга. Вот они, зелёненькие, вот их общие друзья и группы. Они даже отдельно здесь отвалились:
И по счастливой случайности именно эти люди именно под этим постом писали: «У Навального нет доказательств» и так далее, писали одинаковые комментарии. Выводы делать я, конечно, не берусь. Но тем не менее, у меня был другой пост в «Фейсбуке», когда были дебаты Лебедева и Навального, я точно так же анализировал комментарии: там получилось, что все люди, которые написали «Лебедев – говно», они не заходили в соцсети последние четыре месяца, не подписаны ни на один из пабликов, внезапно зашли именно в этот пост, написали именно этот комментарий и ушли. Выводы, опять, отсюда делать нельзя, но кто-то из команды Навального мне написал коммент, что ботов они не используют. Ну и ладно!
Ближе к рекламе, ближе к бренду. Боты сейчас есть у всех! Они есть и у нас, есть и у конкурентов, ещё у кого-то. Их надо выкидывать либо оставлять, чтобы они хорошо жили; на основании таких данных (указывает на предыдущий слайд) доводить их до совершенства, чтобы они выглядели как реальные люди и только тогда ими пользоваться. Хотя пользоваться ботами плохо! Тем не менее достаточно частая история…
В автоматическом режиме такая вещь позволяет отфильтровать из своего анализа людей нерелевантных для анализа, людей, которые не должны попасть в выборку, не должны попасть в это исследование. Очень часто используется. Опять же, не все владельцы автомобилей действительно являются владельцами автомобилей. Иногда интересны только люди, у которых есть потенциально автомобиль, которые сидят в каких-то группах, с кем-то общаются, у них там есть определённая аудитория.
Следующее, что у меня есть, тоже моё любимое. Это анализ фактов и мнений.
Упоминание о своём бренде в различных источниках сейчас умеют делать все. В этом нет никакого секрета. И тональность вроде все умеют считать… Хотя лично я считаю, что сама по себе метрика тональности не очень интересная, потому что, когда ты приходишь и говоришь клиенту, – «Мужик, у тебя 37% нейтрала, – и он такой говорит, – «Ничего себе! Круто!» Поэтому интереснее было бы двинуться чуть дальше: от оценки тональности до оценки мнений того, что о вашем продукте говорят.
И это тоже очень интересная вещь, потому что… Я лично считаю, что нейтральных сообщений в принципе быть не может, потому что, если человек что-то пишет в публичном пространстве, это сообщение по-любому как-то окрашено. Вот я лично никогда не видел нейтрального сообщения с упоминанием какого-то бренда. Обычно это какая-то грязь.
Если возьмём большое количество этих сообщений (их может быть миллионов, 10 миллионов), выделим из каждого сообщения главную мысль, объединим их, мы можем понять достаточно достоверно, что люди говорят об этом бренде, что они считают. «Мне не нравится упаковка», «Мне не нравится консистенция» и так далее.
Смешной пример у меня есть такой: это инфографика о том, что бы сделали пользователи социальных сетей с компанией «Трансаэро» после её банкротства.
Там есть много интересных примеров: сжечь, убить, выслать в Европу, были даже 2%, которые написали – «Отправить их в Сирию на военные действия». Двигаясь от смешной штуки, это может быть любой бренд практически – начиная от моих любимых собачьих кормов, заканчивая какими-нибудь автомобилями. Кому не нравится упаковка, кому не нравятся реальные вещи – с этим всегда можно работать, с этим всегда можно считаться. Есть большое количество примеров, когда люди чуть ли не производство своей продукции меняли, потому что в соцсетях писали, что чупа-чупс недостаточно круглый или он недостаточно сладкий.
Есть ещё такой смешной пример. Догадайтесь, какие комментарии и про кого?
Почему-то сейчас именно анализ мнений, анализ фактов, выделяемых из сообщений, не очень используется, не очень широко распространён. Хотя эта технология не суперсекретная, в этом вообще практически нет никакого ноу-хау, потому что из комментариев людей выделить подлежащее, сказуемое и сгруппировать их – для этого не нужно быть гением компьютерной лингвистики. Это сделать не так сложно. Но я надеюсь, что в ближайшие пару лет люди начнут это использовать, потому что… Будет классно – это такой автоматический фидбек! Знаешь всегда, что про тебя говорят. Ну, вы поняли, что это про президента США сделано.
Ответ на вопрос из аудитории:
На самом деле у меня есть много разных интересных примеров политиканских про Трампа и про всех остальных, но решили их сюда не приводить. Но политиканский пример есть один.
Это выборы в Госдуму. Когда были? В прошлом году? Почти полтора года назад.
Здесь люди, у которых удалось определить их точное местоположение, вплоть до определённой геоточки, чтобы понять, в какой они избирательный УИК попадают. А дальше из этих людей взяты только те, которые высказали своё определённое мнение, за кого они пойдут голосовать.
С точки зрения политтехнологий, это не очень правильно, потому что всё это дело нужно нормировать на плотность населения и так далее. Тем не менее синие здесь собираются голосовать сами знаете за кого, красные – за оппозиционных товарищей, которых было, кстати, не так много.
Я лично считаю, что Big Data до политтехнологий ещё очень нескоро дойдёт, но, как вариант, кандидат – тоже бренд. И это тоже в какой-то степени анализ фактов и мнений о своём бренде, и достаточно интересная вещь, потому что можно в реальном времени понимать, кто там про что делает. Я вот знаю несколько кейсов у BBC, когда они в режиме реального времени в какой-то трансляции мониторили соцсети: отклик такой-то, люди пишут про это, задавай такой-то вопрос – и это классно! Я думаю, что будет очень скоро применяться, потому что интересно всем.
Дальше у меня моделирование позиций брендов. Маленькая такая, короткая штука о том, как с помощью различных метрик (не лайков подписчиков в соцсетях, а с помощью комплексных метрик, интереса к контенту, времени, проведённого за получением метрик) можно ранжировать бренды.
У меня пример есть по «фарме» по определённой. Здесь маленькие кругляшки внутренние, яркие – это количество текстового контента, который создаёт сам бренд, большой кругляшок – это количество фото- и видеоконтента, который создаёт сам бренд.
Близость к центру показывает, насколько этот контент интересен аудитории. Там большая модель, есть куча всяких параметров: лайки, репосты, время отклика, кто там поделился в среднем… Здесь можно посмотреть: есть замечательный «Кагоцел», который вбухивает огромное количество денег в создание собственного контента, и они за счёт этого находятся достаточно близко к центру. А есть товарищи, которые тоже свой контент создают, но он аудитории неинтересен. Такой, не очень адекватный пример, потому что все эти аккаунты практически мёртвые.
К сожалению, остальные… из того, что показать… Вот, есть ещё русские рэперы, как вариант, из реальных компаний.
В чём плюс? В том, что компания может в такую модель заложить практически всё, что угодно, начиная от средней зарплаты подписчиков, которые сидят у тебя в бренде; любую модель, какая им нравится. Потому что каждое рекламное агентство собственные метрики считает по-разному, бренды собственные метрики считают по-разному.
Тут тоже есть такой – Баста, которые генерит большое количество контента, но при этом находится на периферии, потому что этот контент, видимо, не очень интересен аудитории. Опять же, судить я не берусь. Но тем не менее есть Егор Крид, который, по данным социальных сетей, вообще чуть ли не лучший исполнитель современности, а публикует при этом только свои личные фотографии. Тем не менее у него большое количество подписчиков: их где-то около миллиона человек. Я не помню точное количество; помню, что процент вовлечённости этих людей гораздо выше 85%, то есть на миллион подписчиков он получает 850 тысяч откликов этих реальных людей – это реальное сумасшествие. Это так.
Ответы на вопросы аудитории:
Теперь самое интересное. У меня с примерами всё, потому что неинтересно долго говорить одному. И я надеюсь, что вы сейчас будете задавать вопросы, и мы дальше, собственно, от темы к теме двинемся, потому что у меня такие примеры того, как технологии могут использоваться и так далее…
Ответы на вопросы аудитории:
Глобальная задача тут была – построить модель, для того чтобы понять, когда человек потенциально захочет заинтересовать твоим брендом, чтобы ему рекламу дать не после того, как он что-то купил (как это происходит сейчас), а рекламу ему дать «в прогноз» того, когда это всё это произойдёт. С таким «околоказино» было интересно; там получился достаточно интересный процент этих людей – почему: кто-то внезапно повышение получал, кто ещё-то что-то – интересные такие инсайты. А вот с какими-то магазинами, с ритейлом, с магазином каких-нибудь таблеток, мне кажется, будет не очень правильно.
Есть русскоязычный «Фейсбук». Где-то сейчас 60-80% — «Одноклассников», через пару месяцев мы их доберём, наверное, всех до конца. Русский «Инстаграм». Для всех этих соцсетей есть группы, люди, связи между ними и текст.
И пару раз – личные истории, когда чьи-то фотографии в открытом доступе опубликовали. Необходимо было связи найти и т. д. К сожалению, очень жалко, но в суде мы свидетельствовать не можем, потому что наша база юридически неликвидная.
Но для «Фейсбука» используются «куки» купленные. Мы сами с «куками» не работаем, но было несколько историй, когда рекламодатель сам давал каких-то людей, мы с ними взаимодействовали – у них есть сети вот эти вот, с тизерной, не тизерной рекламой, эти «куки». Привязать можно – не вопрос! Но я не очень люблю эти штуки, потому что считаю, что это не очень достоверно. Это чисто на мой взгляд, это как TNS, которая «тречит» телевизоры – непонятно, смотришь ты этот телевизор, не смотришь, посуду ты моешь, пока у тебя телевизор работает… И здесь то же самое: я очень часто что-то гуглю в интернете, но это не значит, что я хочу это купить.
С «Авито» и «Авто.ру» обычно берутся дополнительные параметры, если человек засветил телефон. С «Авито» можно посмотреть, какие вещи человек продаёт – дорогие, недорогие, б/у, не б/у. С «Авто.ру» можно посмотреть, есть ли у него автомобиль – владеет он, не владеет. Это где-то менее 20% людей, которые случайно где-то уронили свой телефон, и их аккаунт можно с этими данными перевязать.
Я не могу точно сказать, когда был ноль. Мы из компании в компанию переходили – всё это долгие такие истории. Но могу сказать, что ВК, «Фейсбук», «Инстаграм» и «Твиттер» — всё это дело (люди, группы и связи между ними) с текстом и контентом – это на самом деле не так много данных, вряд ли там даже петабайт набрался. Я думаю, что это гигабайт 700, наверное, 800.
Но наше законодательство в сфере открытых данных весьма расплывчатое.
У нас нет чёткого понимания, что такое открытые данные, что такое персональные – есть этот 152-й ФЗ, но всё равно… Они считают как? Вот, если у меня в одной базе есть ваше имя и ваш телефон, в другой базе у меня есть ваш телефон и ваш e-mail, в третьей есть, скажем, ваш e-mail и ваш автомобиль; всё это – вроде как не персональные данные. Если это всё вместе соединить, вроде как по закону это станет персональными данными.
Мы обходим это двумя способами. Первый – это ставим клиенту сервера с софтом, и тогда эти данные не выходят за его территорию, и тогда клиент несёт ответственность за распространение этих персональных данных, не персональных данных и так далее. Либо второй вариант: если это какая-то история, где придётся судиться с соцсетью или ещё что-то…
У нас было такое исследование, когда мы собирали (был праймериз «Единой России») для «Лайфньюс» аккаунты этих товарищей и смотрели, какое они порно лайкают. Смешная штука была, но тем не менее. Мы продаём это как наше собственное, личное мнение, не раскрывая юридически в документах, что мы анализировали – ЕГРЮЛ, зарплату, социальные сети; продаём экспертное мнение, а там уже в кулуарах человеку объясняем, что мы анализировали и как.
Было несколько историй, но они были связаны с какими-то публичными коммерческими проектами. Например, у нас есть свободные некоммерческий проект для тех, кто катается на лонгбордах (такие доски длинные): задача была собирать публикации людей – когда кто-то постит «Я поехал в парк Горького кататься». И вот он должен попасть на карту, и люди вокруг него могут увидеть, что кто-то рядом с ним. ВК очень долго бодалась с нами на эту тему, потому что им не нравилось, что мы без разрешения людей публикуем эту информацию. Но до суда тогда дело не дошло, потому что мы внутри нескольких крупных сообществ в правила дописали, что данные могут использоваться сторонними, агентствами, компаниями, анализы и т. д. Конечно, не особо этично было, но тем не менее.
Есть у нас, скажем, клиент, который продаёт интернет-телевидение. Вот у них кто-то купил подписку на эти «Игры престолов», и задача – из их CRM найти этих людей в социальных сетях, а потом найти потенциальных из их ареала влияния. Я просто к тому, что у них есть, скажем, имя, фамилия и e-mail… И дальше очень сложно поэтому что-то сделать. По e-mail’у можно найти примерно в большинстве случаев людей.
Ко мне еженедельно точно обязательно кто-нибудь приходит и говорит: «Вот, у меня там у друга фотографии вылили в паблик какой-то анонимный! Помоги!» Кстати, никогда не публикуйте ничего в анонимные паблики.
Спасибо, что остаётесь с нами. Вам нравятся наши статьи? Хотите видеть больше интересных материалов? Поддержите нас, оформив заказ или порекомендовав знакомым, облачные VPS для разработчиков от $4.99 [1], уникальный аналог entry-level серверов, который был придуман нами для Вас: Вся правда о VPS (KVM) E5-2697 v3 (6 Cores) 10GB DDR4 480GB SSD 1Gbps от $19 или как правильно делить сервер? [2] (доступны варианты с RAID1 и RAID10, до 24 ядер и до 40GB DDR4).
Dell R730xd в 2 раза дешевле в дата-центре Equinix Tier IV в Амстердаме? Только у нас 2 х Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 ТВ от $199 [3] в Нидерландах! Dell R420 — 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB — от $99! Читайте о том Как построить инфраструктуру корп. класса c применением серверов Dell R730xd Е5-2650 v4 стоимостью 9000 евро за копейки? [4]
Автор: ua-hosting.company
Источник [5]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/kontekstnaya-reklama/341778
Ссылки в тексте:
[1] облачные VPS для разработчиков от $4.99: https://ua-hosting.company/cloudvps/nl
[2] Вся правда о VPS (KVM) E5-2697 v3 (6 Cores) 10GB DDR4 480GB SSD 1Gbps от $19 или как правильно делить сервер?: https://habr.com/company/ua-hosting/blog/347386/
[3] 2 х Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 ТВ от $199: https://ua-hosting.company/serversnl
[4] Как построить инфраструктуру корп. класса c применением серверов Dell R730xd Е5-2650 v4 стоимостью 9000 евро за копейки?: https://habr.com/company/ua-hosting/blog/329618/
[5] Источник: https://habr.com/ru/post/482648/?utm_source=habrahabr&utm_medium=rss&utm_campaign=482648
Нажмите здесь для печати.