- PVSM.RU - https://www.pvsm.ru -
Существует огромное количество терминов: аналитика, data mining, анализ данных, business intelligence и разница между ними не всегда столь очевидна даже для людей, которые с этим связаны. Сегодня мы расскажем о том, что же такое Business Intelligence (BI) доступным и понятным языком. Тема безусловна огромна и её не покрыть лишь одной короткой статьей, но наша задача — помочь сделать первый шаг и заинтересовать читателя темой. Заинтересованный же читатель также найдет исчерпывающий список для дальнейших шагов.
Структура статьи
Представим, нами (неким аналитиком Петровичем у поставщика Цветочек) стоит задача оценить продажи ряда магазинов (куда мы поставляем товар) и каждый магазин ведет свой учет проданных товаров. Реальность такова, что формы учета будут заполнены не пойми как и не пойми кем, то есть у них будет разная структура и разный формат хранения (некоторая форма таблиц). Схематично эта задача изображена на схеме выше.
Казалось бы задача несложная и поэтому рассмотрим лобовое решение: пусть у нас есть N таблиц и нам нужно их собрать вместе в одну таблицу, тогда напишем N скриптов, которые преобразуют эти таблицы и один сборщик, который собирает их вместе.
Минусы такого подхода:
Если мы поднимемся на уровень целой организации, то увидим, что проблем даже больше.
Производитель Цветочек на самом деле работает не напрямую с магазинами, а через некоторых посредников. Посредники посещают магазины и непосредственно своими действиями пытаются стимулировать продажи. Соответственно, они являются материально заинтересованными лицами и информацию, которую они выдают, приходится перепроверять.
Принципиально, задача выглядит схожим образом: пусть у нас есть N магазинов и K дистрибьюторов, можем ли агрегировать данные магазинов и сравнить их с результатами дистрибьюторов? (У всех данные имеют разную структуру и формат.)
Здесь помимо таблиц, мы уже можем столкнуться с целым зоопарком форматов, к которым добавляются отчеты дистрибьюторов. Как правило задача характеризуется очень низким качеством данных, в том числе дублированием, несогласованностью и ошибками. На основе полученных результатов и сравнения данных, отдел по закупкам принимает решения о том сколько, кому и почем чего отгружать. То есть решение этой задачи непосредственно влияет на финансовые показатели компании, что безусловно важно.
Рассмотрим несколько вариантов решения на уровне компании:
В целом если мы говорим о небольшом или среднем производителе, то с точки зрения времени интеграции, цены и качества решения сервис выглядит оптимальным вариантом, так как ценообразование динамическое и интеграция минимальна через веб. Как правило плюсом корпоративного ПО является настраиваемость и касмтомизированность (каждый бизнес считает себя уникальным), но описанная задача достаточно типична и стандартна для достаточно широкого круга компаний. Безусловно, нет единого решения для всех, но для каждого в отдельности его можно найти.
Подробнее на тему здесь [9].
Сам процесс на уровне компании выглядит схожим образом: консолидируется данные, определенным образом трансформируются (агрегируются) и загружаются в систему для анализа.
(кликабельно)
[10]
В чём же разница между аналитикой, data mining и business intelligence (BI)? Первые включают в себя комплекс методов для анализа уже чистых данных, а на практике очистка и преобразование данных в удобный для анализа формат — важный и неотъемлемый процесс. Так же помимо работы с преобразованием и консолидацией данных, основная задача BI — это принятие решений для бизнеса.
В схематичной и немного упрощенной форме описывается задача консолидации данных. Если нет возможности заниматься изучением темы в деталях, то эта инфографика даёт хорошее первое приближение проблемы и возможных методов решения. (кликабельно; взято отсюда [12])
[13]
Сервис бесплатен и доступен через веб — ссылка [15].
Автор: varagian
Источник [20]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/data-mining/88160
Ссылки в тексте:
[1] Зачем всё это нужно: из жизни аналитика: http://habrahabr.ru/post/250875#intro_example
[2] В чем задача: проблема на уровне компании: http://habrahabr.ru/post/250875#problem_example
[3] Обобщаем задачу: всё это звенья одной цепи: http://habrahabr.ru/post/250875#general_problem
[4] Большая инфографика: http://habrahabr.ru/post/250875#rabbit_infographics
[5] С чем можно поэкспериментировать: http://habrahabr.ru/post/250875#rabbit_link
[6] Что почитать? Must read по Business Intelligence: http://habrahabr.ru/post/250875#literature
[7] Image: http://habrastorage.org/files/780/f2e/151/780f2e151ac743178c618dc7440ab351.png
[8] Image: http://habrastorage.org/files/e84/d66/2da/e84d662da7ee47bfb41e8d2957fe34d7.png
[9] здесь: https://prezi.com/ipkzyc0gxhu7/navicon-etl-rabbit-internal/
[10] Image: http://habrastorage.org/files/540/da0/0b0/540da00b0e5644ff94ae33e61e66eebc.png
[11] Image: http://habrastorage.org/files/960/f7e/628/960f7e6285a24e2b9d229d4c6fc6a7ba.png
[12] отсюда: http://www.cnews.ru/reviews/?2014/12/03/590397
[13] Image: http://filearchive.cnews.ru/img/forum/2014/12/10/rabbit_infografika_2.png
[14] Image: http://habrastorage.org/files/fcc/875/a0b/fcc875a0b6c8433e84da47c6d919a0e6.png
[15] ссылка: http://www.etlrabbit.ru
[16] Karl Wiegers and Joy Beatty. Software Requirements: http://www.amazon.com/Software-Requirements-Edition-Developer-Practices/dp/0735679665
[17] Паклин, Орешков. Бизнес-Аналитика : http://www.ozon.ru/context/detail/id/17982821/
[18] Питер Маерс: http://mvp.mdm/en-us/MVP/Peter%20Myers-38775
[19] видео-выступления: https://channel9.msdn.com/Events/Speakers/Peter-Myers
[20] Источник: http://habrahabr.ru/post/250875/
Нажмите здесь для печати.