- PVSM.RU - https://www.pvsm.ru -

Что такое Business Intelligence

Существует огромное количество терминов: аналитика, data mining, анализ данных, business intelligence и разница между ними не всегда столь очевидна даже для людей, которые с этим связаны. Сегодня мы расскажем о том, что же такое Business Intelligence (BI) доступным и понятным языком. Тема безусловна огромна и её не покрыть лишь одной короткой статьей, но наша задача — помочь сделать первый шаг и заинтересовать читателя темой. Заинтересованный же читатель также найдет исчерпывающий список для дальнейших шагов.

Структура статьи

  1. Зачем всё это нужно: из жизни аналитика [1]
  2. В чем задача: проблема на уровне компании [2]
  3. Обобщаем задачу: всё это звенья одной цепи [3]
  4. Большая инфографика [4]
  5. С чем можно поэкспериментировать [5]
  6. Что почитать? Must read по Business Intelligence [6]

Зачем всё это нужно: из жизни аналитика

(кликабельно)
Что такое Business Intelligence - 1 [7]

Представим, нами (неким аналитиком Петровичем у поставщика Цветочек) стоит задача оценить продажи ряда магазинов (куда мы поставляем товар) и каждый магазин ведет свой учет проданных товаров. Реальность такова, что формы учета будут заполнены не пойми как и не пойми кем, то есть у них будет разная структура и разный формат хранения (некоторая форма таблиц). Схематично эта задача изображена на схеме выше.

Казалось бы задача несложная и поэтому рассмотрим лобовое решение: пусть у нас есть N таблиц и нам нужно их собрать вместе в одну таблицу, тогда напишем N скриптов, которые преобразуют эти таблицы и один сборщик, который собирает их вместе.

Минусы такого подхода:

  • необходимо поддерживать N скриптов одновременно (где N в порядках тысяч);
  • при изменении структуры отчетов магазинов во времени (например, в магазине появился новый сотрудник) необходимо искать и переписывать отдельные скрипты;
  • при появлении нового магазина, необходимо писать новый скрипт;
  • при изменении нашей отчетности (поставщика Цветочек), необходимо вносить изменения во все скрипты;
  • сложная отладка и поддержка, так как магазины не уведомляют об изменении структуры и не следуют никаким спецификациям.

Если мы поднимемся на уровень целой организации, то увидим, что проблем даже больше.

В чем задача: проблема на уровне компании

(кликабельно)
Что такое Business Intelligence - 2 [8]

Производитель Цветочек на самом деле работает не напрямую с магазинами, а через некоторых посредников. Посредники посещают магазины и непосредственно своими действиями пытаются стимулировать продажи. Соответственно, они являются материально заинтересованными лицами и информацию, которую они выдают, приходится перепроверять.

Принципиально, задача выглядит схожим образом: пусть у нас есть N магазинов и K дистрибьюторов, можем ли агрегировать данные магазинов и сравнить их с результатами дистрибьюторов? (У всех данные имеют разную структуру и формат.)

Здесь помимо таблиц, мы уже можем столкнуться с целым зоопарком форматов, к которым добавляются отчеты дистрибьюторов. Как правило задача характеризуется очень низким качеством данных, в том числе дублированием, несогласованностью и ошибками. На основе полученных результатов и сравнения данных, отдел по закупкам принимает решения о том сколько, кому и почем чего отгружать. То есть решение этой задачи непосредственно влияет на финансовые показатели компании, что безусловно важно.

Рассмотрим несколько вариантов решения на уровне компании:

  • самописное решение: компании производителю будет необходимо нанять специалиста не по профилю компании и критичное ПО будет зависеть от данного специалиста. Если он уйдет, то компания будет вынуждена срочно искать замену, которая сможет поддерживать ПО и качество будет напрямую зависеть от нанятого специалиста;
  • закупить ПО у третьей стороны, тут три ключевых фактора: цена, качество и время интеграции. Как правило цена и время интеграции слишком высоки для среднего производителя, и в том числе требует существенных временных затрат сотрудников. Выбор поставщика также не тривиален;
  • SaaS решения: методология еще нова для рынка и многие компании скептически относятся к подобным сервисам.

В целом если мы говорим о небольшом или среднем производителе, то с точки зрения времени интеграции, цены и качества решения сервис выглядит оптимальным вариантом, так как ценообразование динамическое и интеграция минимальна через веб. Как правило плюсом корпоративного ПО является настраиваемость и касмтомизированность (каждый бизнес считает себя уникальным), но описанная задача достаточно типична и стандартна для достаточно широкого круга компаний. Безусловно, нет единого решения для всех, но для каждого в отдельности его можно найти.

Подробнее на тему здесь [9].

Сам процесс на уровне компании выглядит схожим образом: консолидируется данные, определенным образом трансформируются (агрегируются) и загружаются в систему для анализа.
(кликабельно)
Что такое Business Intelligence - 3 [10]

Обобщаем задачу: всё это звенья одной цепи

(кликабельно)
Что такое Business Intelligence - 4 [11]

В чём же разница между аналитикой, data mining и business intelligence (BI)? Первые включают в себя комплекс методов для анализа уже чистых данных, а на практике очистка и преобразование данных в удобный для анализа формат — важный и неотъемлемый процесс. Так же помимо работы с преобразованием и консолидацией данных, основная задача BI — это принятие решений для бизнеса.

Большая инфографика

В схематичной и немного упрощенной форме описывается задача консолидации данных. Если нет возможности заниматься изучением темы в деталях, то эта инфографика даёт хорошее первое приближение проблемы и возможных методов решения. (кликабельно; взято отсюда [12])
Что такое Business Intelligence - 5 [13]

С чем можно поэкспериментировать

(кликабельно)
Что такое Business Intelligence - 6 [14]

Сервис бесплатен и доступен через веб — ссылка [15].

Что почитать? Must read по Business Intelligence

Автор: varagian

Источник [20]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/data-mining/88160

Ссылки в тексте:

[1] Зачем всё это нужно: из жизни аналитика: http://habrahabr.ru/post/250875#intro_example

[2] В чем задача: проблема на уровне компании: http://habrahabr.ru/post/250875#problem_example

[3] Обобщаем задачу: всё это звенья одной цепи: http://habrahabr.ru/post/250875#general_problem

[4] Большая инфографика: http://habrahabr.ru/post/250875#rabbit_infographics

[5] С чем можно поэкспериментировать: http://habrahabr.ru/post/250875#rabbit_link

[6] Что почитать? Must read по Business Intelligence: http://habrahabr.ru/post/250875#literature

[7] Image: http://habrastorage.org/files/780/f2e/151/780f2e151ac743178c618dc7440ab351.png

[8] Image: http://habrastorage.org/files/e84/d66/2da/e84d662da7ee47bfb41e8d2957fe34d7.png

[9] здесь: https://prezi.com/ipkzyc0gxhu7/navicon-etl-rabbit-internal/

[10] Image: http://habrastorage.org/files/540/da0/0b0/540da00b0e5644ff94ae33e61e66eebc.png

[11] Image: http://habrastorage.org/files/960/f7e/628/960f7e6285a24e2b9d229d4c6fc6a7ba.png

[12] отсюда: http://www.cnews.ru/reviews/?2014/12/03/590397

[13] Image: http://filearchive.cnews.ru/img/forum/2014/12/10/rabbit_infografika_2.png

[14] Image: http://habrastorage.org/files/fcc/875/a0b/fcc875a0b6c8433e84da47c6d919a0e6.png

[15] ссылка: http://www.etlrabbit.ru

[16] Karl Wiegers and Joy Beatty. Software Requirements: http://www.amazon.com/Software-Requirements-Edition-Developer-Practices/dp/0735679665

[17] Паклин, Орешков. Бизнес-Аналитика : http://www.ozon.ru/context/detail/id/17982821/

[18] Питер Маерс: http://mvp.mdm/en-us/MVP/Peter%20Myers-38775

[19] видео-выступления: https://channel9.msdn.com/Events/Speakers/Peter-Myers

[20] Источник: http://habrahabr.ru/post/250875/