Технологии правят… информацией. Технологическая пицца

в 11:29, , рубрики: big data, Блог компании PalitrumLab, информационная среда, разработка, социальные сети, метки: , ,

Всё лучшее, зачастую, случается внезапно. Редко когда тщательно спланированная вечеринка может сравниться с внезапным визитом друзей, а блюдо, приготовленное точно по рецепту, с импровизацией мастера. В нашей команде этот феномен тоже имеет место быть: мы не задумывались о «рецептах», когда за пару недель реализовывали Media Monitor, который, как иногда случается в разработке нишевых B2B продуктов, оказался на удивление востребованным.

Технологии правят… информацией. Технологическая пицца

MeMo (Media Monitor) оказался настолько полезным для «жертв информационного общества», что несколько коллег из команды теперь используют его в «личных корыстных» информационных целях, а все видевшие его информационщики, медийщики и (зачастую вынужденные) потребители больших информационных потоков убежденно просят дать попользоваться.

Технологии правят… информацией. Технологическая пицца

Но речь пойдёт о МеМо не как о продукте, а как о примере вечной диалектики материализма. В частности, о законе перехода количества в качество: информационная революция, взрывной рост генерируемого контента неизбежно должен был привести к изменению парадигмы управления (персональными, корпоративными) информационными потоками.
15 лет назад «интернетчикам» хватало каталога «Ау!» и «Желтых страниц Интернета», а теперь и помощь Google/Яндекс, с результатом «нашлось 10 млн документов», не всегда помощь.

Осознав востребованность для информационщиков продукта, первоначально воспринимаемого нами как «побочного», мы начали искать причины кумулятивного позитивного эффекта сложения нескольких технологий.
К какому выводу пока (все меняется в динамике, может завтра появится еще что-то) мы пришли с точки зрения потребностей «информационного потребителя»:

1. Новая информация нужна прямо сейчас;
2. Источники должны быть доверительными (авторитетными);
3. Источников должно быть много (сотни, тысячи);
4. Материалов должно быть немного (только самые релевантные/актуальные);
5. Имеются свои собственные корпоративные информационные потоки;
6. Многоязычная информация (разные страны);
7. Персональный отбор источников (все мы человеки, «на вкус и цвет...»);
8. Автоматический разбор материалов по тематическим «полочкам»;
9. Легко настраиваемый сюжетный/ситуационный/событийный набор инструментов (возможность за пару минут создать собственную инфо-полочку, например, для чтения материалов по Формуле-1 в Монако – создаем один раз необходимые настройки и читаем, пока идет событие).

Согласитесь — ничего экстраординарного, все и так давно понятно. Фактически, речь идет о персональном «ларьке с прессой» (кстати, в нашей команде есть «динозавры», которые реализовывали проекты типа «Персональная газета» еще в прошлом тысячелетии).

Итак, если бы мы делали все изначально планово, то ставили бы задачу примерно следующим образом — на входе:

• В мире очень много информации;
• Требуется небольшой набор параметров фильтрации;
• Ограниченный набор тематических рубрик (закон устойчивости любой информационной корпоративной структуры);
• Нужно иметь возможность организовать бесконечный набор сюжетов, включая новые (типа Челябинский метеорит);
• И обязательно учесть… человеческий фактор восприятия информационных потоков.

В реалиях все строилось совсем не так, и скорее было похоже на готовку пиццы для вдруг организовавшейся тусовки: бросаем на тесто все, что есть в холодильнике:

• Тестом (от слова «тесто», а не «тест») выступает наша любимая Платформа, о который мы уже писали в блоге;
• Для доверия к продуктам возьмем только крупные СМИ, агентства и сайты госструктур;
• Иностранщину нашинкуем модулем определения языков;
• Добавим домашний сыр корпоративного изготовления;
• Поперчим экспресс- и эксперт-аккаунтами соцмедиа;
• Поставим на быстрый огонь распределенной системы сбора данных;
• Разложим на тематические тарелки авто классификацией;
• А выбор масла и тертого сыра оставим на усмотрение потребителя.

Итог: все довольны — информационный голод подавлен насыщенными современными технологическими OBD-решениями.

Можно ли было приготовить «информационную пиццу» на имеющихся тогда технологических возможностях, скажем, год-два назад? — Теоретически «да», практически — это был бы совсем не тот продукт, который подошел бы в 2013 году, когда информационные потоки выросли в 1.5 раза (дальше — больше), а информационные «войны» теперь длятся всего несколько минут (вспомните, например, 3-х минутное «ранение Обамы», обрушившее фондовые рынки, или 4-х минутный военный переворот в Катаре).

Несколько ингредиентов из нашего продуктового холодильника не вошли в рецепт для МеМо (во всяком случае пока), но мы надеемся, что в Рецепт-2014 они обязательно попадут — поскольку и скоростное авто определения тональности, и NER, и геолоцирование и тренды уже успешно применяются в различных проектах.

P.S.: Мы любим наших друзей и партнеров и с удовольствием отдаем им должное: отцом-вдохновителем MeMo можно считать Павла Ч., много лет успешно работающего в крупных информационных издательствах и агентствах.
Конечно, у нас уже были заделы для выборок подписок источников для Персонального Медиа(Инфо)-Центра, мы расширили количество определяемых языков до 30, наш АК (АвтоКлассификатор текстов) уже отделял Спорт от Шоу-бизнеса, но именно Павел, вобрав в свой открытый ум множество различных составляющих, четко очертил потребность своих коллег в конкретном продукте. Дальше было дело техники (и технологии, и лингвистики, и хайлоада), а это уже наш конек.

Придумывайте новые рецепты, чтобы было не только питательно и полезно, но и приятно :)

Автор: CvetKomm

Источник

Поделиться

* - обязательные к заполнению поля