- PVSM.RU - https://www.pvsm.ru -

Обзор наиболее интересных материалов по анализу данных и машинному обучению №26 (8 — 14 декабря 2014)

Обзор наиболее интересных материалов по анализу данных и машинному обучению №26 (8 — 14 декабря 2014) - 1
Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.

Общее

Теория и алгоритмы машинного обучения, примеры кода

Соревнования по машинному обучению

  • RU Для новичков Введение в анализ тональности текста от Kaggle [33] — на сайте Kaggle началось новое достаточно интересное соревнование по машинному обучению, которое посвящено анализу тональности текста (Sentiment analysis) и в данном соревновании особенно привлекает то, что к нему прилагается четыре урока с описанием основных моментов работы NLP и Sentiment analysis.

Онлайн-курсы, обучающие материалы и литература

Видеоматериалы

Data engineering

Обзоры

Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №25 (1 — 7 декабря 2014) [53]

Автор: moat

Источник [54]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/data-mining/77156

Ссылки в тексте:

[1] Яндекс открывает новое направление своей деятельности — Yandex Data Factory: http://habrahabr.ru/company/yandex/blog/245393/

[2] Как мы делали полярный график в DevExtreme: http://habrahabr.ru/company/devexpress/blog/244359/

[3] Зарплата и инструменты специалистов по анализу данных по результатам опроса от O'Reilly: http://blog.revolutionanalytics.com/2014/12/oreilly-data-scientist-salary-and-tools-survey-november-2014.html

[4] Почему R сложен для изучения?: http://r4stats.com/articles/why-r-is-hard-to-learn/

[5] В каких сферах применяется Data Science: http://www.kdnuggets.com/2014/12/where-analytics-data-mining-data-science-applied.html

[6] Прогноз на 2015 для Data Science от Data Science Central: http://www.datasciencecentral.com/profiles/blogs/10-data-science-predictions-for-2015

[7] Прогноз на 2015 для Data Science от KDnuggets.com: http://www.kdnuggets.com/2014/12/2015-predictions-data-scientists.html

[8] Прогнозы в сфере аналитики на 2015 год от International Institute of Analytics (IIA): http://www.kdnuggets.com/2014/12/iia-2015-analytics-predictions.html

[9] Большой список публичных наборов данных: https://github.com/caesar0301/awesome-public-datasets

[10] Словарь Big Data: http://www.datasciencecentral.com/profiles/blogs/big-data-the-key-vocabulary-everyone-should-understand

[11] Мифы Big Data: http://techcrunch.com/2014/12/06/lies-damn-lies-and-the-myth-of-following-the-data/

[12] 5 основных тенденций Big Data в 2014 году: http://www.informationweek.com/big-data/software-platforms/top-5-big-data-trends-of-2014/a/d-id/1317939

[13] Прогнозы рынка аналитики Big Data на 2015 год от Forbes: http://www.forbes.com/sites/gilpress/2014/12/11/6-predictions-for-the-125-billion-big-data-analytics-market-in-2015/

[14] Все что вам необходимо знать для того, чтобы стать аналитиком: http://www.analyticsvidhya.com/blog/2014/12/start-career-analytics-industry/

[15] Как используется качество контента при ранжировании Bing: http://blogs.bing.com/search-quality-insights/2014/12/08/the-role-of-content-quality-in-bing-ranking/

[16] Интересные статьи от Vincent Granville: http://www.analyticbridge.com/profiles/blogs/great-friday-reading

[17] Интересные статьи от Vincent Granville: http://www.analyticbridge.com/profiles/blogs/nice-reading-for-your-sunday

[18] Руководство хакера по нейронным сетям. Схемы реальных значений. Схемы с несколькими логическими элементами: http://habrahabr.ru/company/paysto/blog/245403/

[19] Сравнение скорости построения линейных моделей в R и Eviews: http://habrahabr.ru/post/245641/

[20] Детекторы углов: http://habrahabr.ru/post/244541/

[21] Data Science без использования статистики не только возможен, но и желателен: http://www.datasciencecentral.com/profiles/blogs/data-science-without-statistics-is-possible-even-desirable

[22] Используйте Random Forest: тестирование 179 классификаторов на 121 наборе данных: http://machinelearningmastery.com/use-random-forest-testing-179-classifiers-121-datasets/

[23] Сравнение бустрэпа и перекрестных проверок: http://appliedpredictivemodeling.com/blog/2014/11/27/08ks7leh0zof45zpf5vqe56d1sahb0

[24] 3 вопроса, на которые необходимо ответить перед выбором алгоритма машинного обучения: http://www.analyticbridge.com/profiles/blogs/wait-why-are-you-using-that-algorithm

[25] 12 советов по алгоритму наивного байесовский классификатора: http://machinelearningmastery.com/better-naive-bayes/

[26] Наивный байесовский классификатор с нуля на Python: http://machinelearningmastery.com/naive-bayes-classifier-scratch-python/

[27] Наивный Байес с помощью Python: http://blog.yhathq.com/posts/naive-bayes-in-python.html

[28] Deeppy: библиотека Deep Learning для Python: https://github.com/andersbll/deeppy

[29] Ask a Data Scientist: искажающие факторы (Confounding Variables): http://insidebigdata.com/2014/12/10/ask-data-scientist-confounding-variables/

[30] Использование Apache Hadoop для предсказания задержек авиарейсов (часть 2): http://hortonworks.com/blog/data-science-hadoop-spark-scala-part-2/

[31] Пример использования Spark (1): найти человека с похожим списком связей: http://www.sasanalysis.com/2014/12/spark-practice-1-find-stranger-that.html

[32] Пример использования Spark (2): текстовый поиск с помощью SQL: http://www.sasanalysis.com/2014/12/spark-practice-2-query-text-using-sql.html

[33] Введение в анализ тональности текста от Kaggle: http://igorsubbotin.blogspot.ru/2014/12/introduction-to-nlp-and-sentiment-analysis-on-kaggle.html

[34] Методическое пособие «Статистический анализ и визуализация данных с помощью R»: http://r-analytics.blogspot.ru/2014/12/r.html#.VI1wH3s_xoM

[35] Анонс нового онлайн-курса «Statistical Learning» от Stanford University: http://igorsubbotin.blogspot.ru/2014/12/stanford-online-course-on-statistical-learning.html

[36] Материалы с AMP Camp 5: http://ampcamp.berkeley.edu/5/#

[37] Введение в анализ данных: http://f.briatte.org/teaching/ida/index.html

[38] Серия вебинаров по RStudio: основные интсрумента Data Science в R: http://rdatamining.wordpress.com/2014/12/10/recordings-of-rstudio-webinar-series-on-essential-tools-for-data-science-with-r/

[39] Hadoop для сетевых инженеров: http://habrahabr.ru/company/cisco/blog/245339/

[40] Time Series, метрики и статистика: знакомство с InfluxDB: http://habrahabr.ru/company/selectel/blog/245515/

[41] 5 правил организации данных: http://www.datasciencecentral.com/profiles/blogs/5-basic-rules-of-data-organization

[42] 5 основных проблем измерения производительности Big Data систем: http://blog.cloudera.com/blog/2014/12/5-pitfalls-of-benchmarking-big-data-systems/

[43] Сборник полезных советов по Cloudera Impala: http://blog.cloudera.com/blog/2014/12/the-impala-cookbook/

[44] Интересное из мира R (1-7 декабря 2014 г.): http://r-analytics.blogspot.ru/2014/12/r-1-7-2014.html#.VIwPyXuxWB0

[45] Лучшие материалы за неделю от KDnuggets.com (30 ноября — 6 декабря): http://www.kdnuggets.com/2014/12/top-news-week-nov-30.html

[46] Еженедельный дайджест от DataScienceCentral (15 декабря): http://www.datasciencecentral.com/profiles/blogs/weekly-digest-december-15

[47] Лучшие ресурсы за неделю от Data Elixir (№13): http://dataelixir.com/issues/13

[48] Еженедельный сборник лучших материалов от R1Soft (12 декабря): http://www.r1soft.com/blog/this-week-in-data-december-12-2014

[49] Наиболее интересные материалы от Freakonometrics №191: http://freakonometrics.hypotheses.org/18202

[50] Наиболее интересные материалы от Freakonometrics №192: http://freakonometrics.hypotheses.org/18230

[51] Наиболее интересные материалы по High Scalability (12 декабря): http://highscalability.com/blog/2014/12/12/stuff-the-internet-says-on-scalability-for-december-12th-201.html

[52] Этот месяц в экосистеме Hadoop (ноябрь 2014): http://blog.cloudera.com/blog/2014/12/this-month-in-the-ecosystem-november-2014/

[53] Обзор наиболее интересных материалов по анализу данных и машинному обучению №25 (1 — 7 декабря 2014): http://habrahabr.ru/post/245195/

[54] Источник: http://habrahabr.ru/post/245795/