- PVSM.RU - https://www.pvsm.ru -
Данный выпуск дайджеста наиболее интересных материалов, посвященных теме анализа данных содержит достаточно много статей, которые рассматривают теоретические аспекты вопросов, связанных с Data Science. Есть несколько статей, которые будут интересны новичкам. Также представлены ссылки на серию интересных статей о работе со схемами данных в MongoDb. Есть несколько ссылок на материалы, в которых рассматривается важная проблема переобучения (overfitting) в процессе машинного обучения. Некоторые статьи посвящены литературе, рекомендуемой к прочтению для тех кому интересна тема анализа данных.
Автор: moat
Источник [22]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/data-mining/62647
Ссылки в тексте:
[1] Список литературы на лето: http://www.datasciencecentral.com/profiles/blogs/data-science-summer-reading-list-2014
[2] Введение в Deep Neural Networks: http://visualstudiomagazine.com/articles/2014/06/01/deep-neural-networks.aspx
[3] Сборник статей и ресурсов по анализу данных: http://www.datasciencecentral.com/profiles/blogs/another-set-of-great-articles-and-resources-mostly-external
[4] Еще один сборник статей и ресурсов по анализу данных: http://www.datasciencecentral.com/profiles/blogs/comprehensive-list-of-data-science-resources
[5] Постер Big Data: http://www.kdnuggets.com/2014/06/huge-big-data-poster.html
[6] Как стать Data Scientist: http://treycausey.com/getting_started.html
[7] Стоит ли заниматься статистикой и машинным обучением?: http://andrewgelman.com/2014/06/14/hes-great-math-wants-statistics-machine-learning/
[8] Схемы данных в MongoDb (часть 1): http://blog.mongodb.org/post/87200945828/6-rules-of-thumb-for-mongodb-schema-design-part-1
[9] Схемы данных в MongoDb (часть 2): http://blog.mongodb.org/post/87892923503/6-rules-of-thumb-for-mongodb-schema-design-part-2
[10] Схемы данных в MongoDb (часть 3): http://blog.mongodb.org/post/88473035333/6-rules-of-thumb-for-mongodb-schema-design-part-3
[11] Введение в Random Forest: http://www.analyticsvidhya.com/blog/2014/06/introduction-random-forest-simplified/
[12] Data Shinobi 2 — Дерево Data Shinobi: http://www.datasciencecentral.com/profiles/blogs/data-shinobi-2-the-tree-of-the-data-shinobi
[13] Обзор алгоритмов машинного обучения: http://www.datasciencecentral.com/profiles/blogs/a-tour-of-machine-learning-algorithms
[14] 100+ интересных наборов данных: http://www.datasciencecentral.com/profiles/blogs/100-interesting-data-sets-for-statistics
[15] О проклятии размерности: http://www.datasciencecentral.com/profiles/blogs/about-the-curse-of-dimensionality
[16] Почему переобучение опаснее низкой точности предсказания (часть 1): http://smartdatacollective.com/deanabbott/202916/why-overfitting-more-dangerous-just-poor-accuracy-part-i
[17] Почему переобучение опаснее низкой точности предсказания (часть 2): http://smartdatacollective.com/deanabbott/202911/why-overfitting-more-dangerous-just-poor-accuracy-part-ii
[18] Список полезных к прочтению книг для специалиста по анализу данных: http://www.analyticsvidhya.com/blog/2014/06/books-data-scientists-or-aspiring-ones/
[19] Классификация тональности текста (Sentiment classification): http://inside-bigdata.com/2014/06/12/data-science-101-sentiment-classification-facebook/
[20] Основы Hadoop для новичков: http://www.techtalkshub.com/hadoop-just-basics-big-data-rookies/
[21] Обработка естественного языка при помощи методики Deep Learning: http://techtalks.tv/talks/deep-learning-for-nlp-without-magic-part-1/58414/
[22] Источник: http://habrahabr.ru/post/226641/
Нажмите здесь для печати.