- PVSM.RU - https://www.pvsm.ru -

Дайджест статей по анализу данных №3 (09.06.2014 —22.06.2014)

Дайджест статей по анализу данных №3 (09.06.2014 —22.06.2014)
Добрый день, уважаемые читатели.
Пролетели 2 недели и пришло время нашей подборки материалов по анализу данных. Сегодняшний дайджест получился большим, и признаюсь често сам осилил не все, что в него попало. Но так как на вкус и цвет товарище нет, то я решил выложить всю подборку.
Итак, из сегодняшней подборки вы узнаете о том как использовать хранилища данных различных типов в одном проекте, посмотрите какими большими данными может обладать бизнес и как их анализ может ему помочь. Также в нашей подборке будет статья посвященная алгоритму FTCA, а также будет материал про сравнени различных алгоритмов машинного обучения.

Теория

Литература

Практика использования различных инструментов

Обучающие видео

Разные статьи по теме

Автор: kuznetsovin

Источник [72]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/analiz-danny-h/62983

Ссылки в тексте:

[1] Распознавание текста в ABBYY FineReader: http://habrahabr.ru/company/abbyy/blog/225215/

[2] Большие данные это вся информация, которая измеряется и изменяется во времени: http://www.mapr.com/blog/big-data-everything-quantified-and-tracked-what-means-you#.U5aOxXJ_t2k

[3] Описательная, предписывающая и прогнозная аналитика: http://www.datascienceassn.org/content/descriptive-predictive-prescriptive-analytics

[4] Разные подходы к использованию вероятностей и различие результата: http://jakevdp.github.io/blog/2014/06/06/frequentism-and-bayesianism-2-when-results-differ/

[5] 4 примера характеристик больших данных: http://www.mapr.com/blog/four-examples-characterizations-discovery-big-data#.U5aSh3J_t2l

[6] Моделируем хранилище данных: http://www.datasciencecentral.com/profiles/blogs/modelling-a-data-warehouse

[7] Часы для аналитиков: http://www.exploringdatascience.com/the-data-science-clock/

[8] Кластеризация клиентов в телекоме: http://ucanalytics.com/blogs/customer-segmentation/

[9] Первый закон анализа данных: http://www.kdnuggets.com/2014/06/first-law-data-science-correlation-causation.html

[10] Врожденная предвзятость больших данных: http://boingboing.net/2014/06/09/inherent-biases-warp-big-data.html

[11] Как заработать на машинном обучении: http://machinelearningmastery.com/machine-learning-for-money/

[12] Распознавание автомобильных номеров в деталях: http://habrahabr.ru/company/recognitor/blog/225913/

[13] Машинное обучение это весело: https://medium.com/code-poet/machine-learning-is-fun-80ea3ec3c471

[14] 10 ошибок, которые могут поставить под угрозу вашу базу данных: http://blog.mongodb.org/post/87691901392/mongodb-security-part-ii-10-mistakes-that-can

[15] 5 ошибок в больших данных о которых вы знаете: http://www.iqubemarketing.com/5-big-data-mistakes-making/

[16] Что такое цифровой маркетинг?: http://www.kunocreative.com/blog/bid/90693/What-is-Digital-Marketing-Depends-on-Whom-You-Ask

[17] 10 инструментов для анализа данных : http://www.kdnuggets.com/2014/06/top-10-data-analysis-tools-business.html

[18] Облачные вычисления: http://www.analyticbridge.com/profiles/blogs/cloud-computing?xg_source=activity

[19] Эффективная обработка больших данных на ежедневной основе: http://phys.org/news/2014-06-efficient-big-daily-routine-basis.html

[20] 70 сайтов репозиториев с наборами данных для анализа: http://www.bigdata-madesimple.com/70-websites-to-get-large-data-repositories-for-free/

[21] 9 секретов которые вы должны знать в области статистики: http://www.statslife.org.uk/opinion/1564-nine-secrets-you-should-have-been-taught-as-part-of-your-undergraduate-statistics

[22] Используем внешние данные: http://loyalty360.org/loyalty-today/article/using-external-data

[23] Про котиков, собак, машинное обучение и deep learning: http://habrahabr.ru/post/226347/

[24] Глубокое обучение с помощью нейронных сетей. Руководство для начинающих.: http://visualstudiomagazine.com/articles/2014/06/01/deep-neural-networks.aspx

[25] Наивный Байес и Логистическая регрессия: http://deblivingdata.net/discriminative-vs-generative-models/

[26] Разработка архитектуры системы машинного обучения для расчета рисков: http://nerds.airbnb.com/architecting-machine-learning-system-risk/

[27] Иерархическая Распознавание: http://www.kennybastani.com/2014/06/hierchical-pattern-recognition.html

[28] Алгоритм кластеризации FTCA: http://cssanalytics.wordpress.com/2013/11/26/fast-threshold-clustering-algorithm-ftca/

[29] Вероятностные модели: сэмплирование: http://habrahabr.ru/company/surfingbird/blog/226677/

[30] Решение задачи линейной регрессии с помощью быстрого преобразования Хафа: http://habrahabr.ru/post/226935/

[31] Data Analytics with R: A hands-on approach: http://www.amazon.com/gp/product/1941773001/ref=as_li_tl?camp=1789&creative=390957&creativeASIN=1941773001&ie=UTF8&linkCode=as2&linkId=H3ANX46Y4WYN5HUZ&tag=nosqlweekly-20

[32] Understanding Machine Learning: From Theory to Algorithms: http://www.amazon.com/gp/product/1107057132?ie=UTF8&tag=searchbyisbn&linkCode=am2&camp=1789&creative=9325&creativeASIN=1107057132

[33] Analytics Across the Enterprise: http://www.analyticbridge.com/group/books/forum/topics/book-analytics-across-the-enterprise

[34] Journal of the Association for Information Science and Technology: http://onlinelibrary.wiley.com/doi/10.1002/asi.2014.65.issue-7/issuetoc?campaign=woletoc

[35] Three Big Data Blueprints: http://www.ctovision.com/2014/06/white-paper-three-big-data-blueprints/

[36] Подборка интересных книг по анализу данных: http://www.analyticbridge.com/group/books/forum/topics/a-few-more-data-science-books-yarn-r-cassandra-analytics

[37] Филогенез в R и Python: http://www.r-bloggers.com/phylogenies-in-r-and-python/

[38] Сравнение алгоритмов классификации с Python и Plotly: http://nbviewer.ipython.org/github/etpinard/plotly-misc-nbs/blob/etienne/ml-classifier-comp/ml-classifier-comp.ipynb

[39] DLib: библиотека для машинного обучения: http://www.kdnuggets.com/2014/06/dlib-library-machine-learning.html

[40] Введение в использование TVI : http://www.r-bloggers.com/a-positive-batting-average-trend-follower-introducing-trend-vigor/

[41] Визуализация автобусных остановок с помощью R: http://www.r-bloggers.com/visualizing-bus-stops-with-rcharts/

[42] Django и большие данные. Часть 1 — Первичные ключи: http://www.intellovations.com/2013/04/17/django-and-big-data-part-1-primary-keys/

[43] Анализ криминальной статистики ФРБ с Glue и plotly: http://nbviewer.ipython.org/github/ChrisBeaumont/crime/blob/master/glue_plotly_fbi.ipynb

[44] YaC/m 2014: методы обработки данных в электронной торговле: http://www.searchengines.ru/articles/yac_m_2014_meto.html

[45] Почему сайты не подсказывают клиенту то, что ему реально нужно: http://hbr-russia.ru/upravlenie/upravlenie-innovatsiyami/p13886/

[46] Как визуализация данных может помочь в рентгенологии: http://n2value.com/blog/what-big-data-visualization-analytics-can-learn-from-radiology/

[47] Самообслуживание BI — новая демократия в аналитике: http://customerthink.com/business-intelligence-self-service-the-new-democracy-of-analytics/

[48] Используем машинное обучения для решения своих проблем: http://machinelearningmastery.com/work-on-machine-learning-problems-that-matter-to-you/

[49] Что лучше интуиция или анализ?: http://www.informationweek.com/big-data/big-data-analytics/big-data-debate-do-analytics-trump-intuition/d/d-id/1269193

[50] Семантический анализ, как помощник построения точных моделей: http://searchcio.techtarget.com/opinion/Add-semantic-analysis-to-ward-off-big-data-bad-analytics-syndrome

[51] Предписывающая аналитика: то, что доктор прописал: http://searchcio.techtarget.com/opinion/Prescriptive-analysis-Just-what-the-doctor-ordered

[52] Большие эффекты от больших данных: http://www.sas.com/en_us/insights/articles/big-data/big-effects-big-data.html

[53] Облако и большие данные не представляют угрозы для хранилищ данных: http://getpocket.com/a/read/636730655

[54] Подборка интересных статей из мира больших данных: http://www.datasciencecentral.com/profiles/blogs/another-set-of-great-articles-and-resources-mostly-external

[55] Как пересекающиеся области помогают организация сформировать инновации: http://www.datasciencecentral.com/profiles/blogs/how-cross-pollination-helps-organizations-to-ideate-innovate

[56] Отойти от глубокого обучения и получить некий прогноз: http://www.pyimagesearch.com/2014/06/09/get-deep-learning-bandwagon-get-perspective/

[57] IBM Watson: где и как сейчас используются возможности суперкомпьютера?: http://habrahabr.ru/company/ibm/blog/225771/

[58] Разрабатываем успешную стратегию использования больших данных в бизнесе: http://data-informed.com/develop-successful-big-data-strategy-business/

[59] Почему текстовая аналитика так важна для поиска: http://www.predictiveanalyticsworld.com/patimes/text-analytics-important-search/

[60] Большие данные в спорте: http://smartdatacollective.com/bernardmarr/200446/big-data-and-analytics-sports-game-changer

[61] Как аналитика поможет ИТ-директору стать более клиентоориентированным: http://spotfire.tibco.com/blog/?p=23510

[62] 5 ключевых задач больших данных в банковском секторе: http://www.datasciencecentral.com/profiles/blogs/5-key-big-data-challenges-in-banking-industry

[63] Что такое большие данные и когда они превратятся в умные данные : http://ieet.org/index.php/IEET/more/swan20140612

[64] Как я начал работать с машинным обучением: http://machinelearningmastery.com/how-i-got-started-in-machine-learning/

[65] Бизнес и Большие данные: лаборатория FABERNOVEL: http://habrahabr.ru/company/fabernovel/blog/226389/

[66] В Россию пришли большие данные. Первые проекты: http://source.cnews.ru/reviews/index.shtml?2014%2F06%2F11%2F575622_1

[67] Как большие данные повышают эффективность аналитики в банках: http://www.cloudcomputing-news.net/news/2014/jun/16/big-data-set-to-boost-the-effectiveness-of-analytics-in-banking/

[68] Кто использует ваши данные: http://newsoffice.mit.edu/2014/whos-using-your-data-httpa-0613

[69] Как большие данные могут применяться при найме персонала: http://mashable.com/2014/06/11/big-data-recruiting/

[70] Как малые предприятия могут использовать возможности больших данных: http://www.fourcornerstone.com/blog/small-businesses-harness-power-big-data/

[71] Использование разных хранилищ данных: http://www.dbms2.com/2014/06/18/using-multiple-data-stores/

[72] Источник: http://habrahabr.ru/post/227135/