Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.
Читать полностью »
Рубрика «data mining» - 80
Обзор наиболее интересных материалов по анализу данных и машинному обучению №22 (10 — 16 ноября 2014)
2014-11-16 в 14:32, admin, рубрики: big data, data mining, data science, data science digest, machine learning, высокая производительностьОбзор наиболее интересных материалов по анализу данных и машинному обучению №21 (3 — 9 ноября 2014)
2014-11-09 в 15:29, admin, рубрики: big data, data mining, data science, data science digest, machine learning, высокая производительность
Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.
Читать полностью »
Обзор наиболее интересных материалов по анализу данных и машинному обучению №20 (27 октября — 2 ноября 2014)
2014-11-03 в 13:31, admin, рубрики: big data, data mining, data science, data science digest, machine learning, высокая производительность
Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.
Читать полностью »
Разбитие текста на предложения лингво-независимым методом на примере библиотеки AIF
2014-11-01 в 14:09, admin, рубрики: data mining, java, natural language processing В прошлой статье мы уже рассказывали о новой NLP библиотеке. Однако тогда мы рассказали «обовсем» и не о чем конкретном. Сегодня мы поговорим о теоретических аспектах разбития предложения на токены лингво-независимыми алгоритмами. Теоретические выкладки будут подкреплены практической реализацией в библиотеке AIF. Поехали…
Читать полностью »
Парные товары. Размещения товаров в торговом зале
2014-10-28 в 11:15, admin, рубрики: big data, data analysis, data mining, fmcg, retail, Алгоритмы, маркетинг, маркетинговый анализ, математика, продажи, ритейл, статистика
Привет!
В этом небольшом и простом кейсе мы расскажем, что такое парные товары, и как с помощью ассоциативных взаимосвязей увеличить доходность бизнеса.
Итак, Пары — это товары, часто покупаемые вместе. В паре один товар является ключевым (якорным), а второй — сопутствующим. И выявляем мы парные взаимосвязи товара при помощи алгоритма APRIORI.
Читать полностью »
Обзор наиболее интересных материалов по анализу данных и машинному обучению №19 (20 — 26 октября 2014)
2014-10-26 в 15:43, admin, рубрики: big data, data mining, data science, data science digest, machine learning, высокая производительность
Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.
Читать полностью »
Как колебания в продажах влияют на оборот?
2014-10-24 в 9:03, admin, рубрики: big data, data mining, fmcg, retail, Алгоритмы, математика, продажи, ритейл, статистика
Данная публикация — это реальный кейс, в котором мы расскажем, как найти товары и категории с большими колебаниями продаж, и как колебания продаж влияют на поведение клиентов.
Производя анализ данных для торговой сети, мы столкнулись с проблемой: при почти равных количествах продаж в день в двух магазинах сети, оборот в одном магазине «Shop1» увеличивался, а в магазине «Shop2» — снижался.
Читать полностью »
Марковские случайные поля
2014-10-23 в 7:20, admin, рубрики: CRF (Conditional Random Fields), data mining Статья посвящена описанию метода CRF (Conditional Random Fields), являющимся разновидностью метода Марковских случайных полей (Markov random field). Данный метод нашел широкое применение в различных областях ИИ, в частности, его успешно используют в задачах распознавания речи и образов, обработки текстовой информации, а также и в других предметных областях: биоинформатики, компьютерной графики и пр.
Читать полностью »
Как заставить данные говорить
2014-10-23 в 7:03, admin, рубрики: data mining, анализ данных, веб-аналитикаКак только Google Analytics или Яндекс.Метрика публикуют новость о новом отчёте, метрике или обновлении интерфейса и всё сообщество ликует, я испытываю лёгкое головокружение. Но не от радости. Для меня это сигнал о том, что в ближайшее время вместо того, чтобы работать над качеством продукта, мы начнем изучать системы аналитики. Погоня за количеством данных вытеснила стремление к качеству анализа на задворки потребностей. Точность стала важнее тренда, а на сайтах теперь стоят по 3-5 счётчиков от разных систем аналитики.
Данных много не бывает? Ещё как бывает. Вспомните про парадокс данных, который отлично сформулировал Авинаш Кошик. Недостаток данных не позволяет принимать решения, но и изобилие не даёт представление о том, что происходит.
Так не пора ли приступить к поискам ответов? Я расскажу об универсальном методе, который помогает мне делать выводы, а еще приносит огромное удовольствие в работе с информацией. Чтобы далекие от интернет-маркетинга и веб-аналитики пользователи не заскучали, для примера я взяла тему из нашей с вами повседневной реальности.
Обзор наиболее интересных материалов по анализу данных и машинному обучению №18 (13 — 19 октября 2014)
2014-10-19 в 13:01, admin, рубрики: big data, data mining, data science, data science digest, machine learning, высокая производительность
Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.
Читать полностью »