- PVSM.RU - https://www.pvsm.ru -

Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения. В данном выпуске достаточно много интересных материалов для новичков. Присутствует пара интересных видеоматериалов. Есть материалы по теме Data Engineering. Как обычно некоторые количество статей посвящено примерам кода, связанного с анализом данных и машинным обучением. И уже традиционно несколько статей посвящено теме участия в соревнованиях по машинному обучению.
Книга по Deep Learning от MIT [1]
Обработка данных с помощью R [2]
Трудный путь изучения машинного обучения — история о пони [3]
Что такое R [4]
Что компаниям нужно знать о Big Data [5]
Руководство по анализу неструктурированных текстовых данных [6]
Анализ данных с Mario Garzia из Microsoft [7]
5 преимуществ участия в соревнованиях по машинному обучению [8]
Визуализация временных рядов с помощью библиотеки googleVis [9]
Microsoft Azure DocumentDB [10]
Применение машинного обучения для трейдинга (часть 1) [11]
Улучшение производительности запросов в Apache Hive при помощи партиционирования [12]
Анонсирован новый онлайн-курс на Coursera от Stanford University — Mining Massive Datasets [13]
Быстрый HDF5 с Pandas [14]
Интересные ресурсы по Deep Learning [15]
Это не NoSQL против RDBMS, это ACID+Foreign Keys против Eventual Consistency [16]
Пример решения задачи на Kaggle [17]
Визуализация работы логистической регрессии [18]
Машинное обучение и компьютерное зрение (часть 2) [19]Вторая часть серии статей от Microsoft Technet Machine Learning Blog, посвященная использованию машинного обучения при решении вопросов распознавания образов и применения технологий компьютерного зрения. Статья небольшая и написана простым языком, без погружения в детали данной достаточно сложной темы.
Экосистема Hadoop [20]
Что такое Big Data? [21]
Использование expression в R [22]
Блок-схема машинного обучения с учителем (Supervised learning) [23]
21 отличный график [24]
Как удачно выступать в соревнованиях на Kaggle [25]
Анонс Capstone project в специализации по анализу данных от Coursera [26]
Sybil: система масштабирования машинного обучения в Google [27]
Четыре основных языка для анализа данных [28]
Математика для машинного обучения [29]
Куда устанавливаются библиотеки в RStudio [30]
44 статьи по анализу данных [31]Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №9 (11 — 18 августа 2014) [32]
Автор: moat
Источник [33]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/data-mining/68225
Ссылки в тексте:
[1] Книга по Deep Learning от MIT: http://www.iro.umontreal.ca/~bengioy/DLbook/#
[2] Обработка данных с помощью R: http://cran.r-project.org/doc/contrib/de_Jonge+van_der_Loo-Introduction_to_data_cleaning_with_R.pdf
[3] Трудный путь изучения машинного обучения — история о пони: http://igorsubbotin.blogspot.ru/2014/08/machine-learning-the-hard-way.html
[4] Что такое R: http://machinelearningmastery.com/what-is-r/
[5] Что компаниям нужно знать о Big Data: http://smartdatacollective.com/andyambrosius/227786/data-science-what-companies-need-know
[6] Руководство по анализу неструктурированных текстовых данных: http://www.analyticsvidhya.com/blog/2014/08/step-step-guide-extract-inforation-free-text-unstructured-data/
[7] Анализ данных с Mario Garzia из Microsoft: http://blogs.technet.com/b/machinelearning/archive/2014/08/19/exploration-data-science-with-mario-garzia.aspx
[8] 5 преимуществ участия в соревнованиях по машинному обучению: http://machinelearningmastery.com/5-benefits-of-competitive-machine-learning/
[9] Визуализация временных рядов с помощью библиотеки googleVis: http://igorsubbotin.blogspot.ru/2014/08/googlevis-time-series.html
[10] Microsoft Azure DocumentDB: http://gigaom.com/2014/08/21/microsoft-unveils-documentdb-a-nosql-database-built-for-azure/
[11] Применение машинного обучения для трейдинга (часть 1): http://habrahabr.ru/post/234303/
[12] Улучшение производительности запросов в Apache Hive при помощи партиционирования: http://blog.cloudera.com/blog/2014/08/improving-query-performance-using-partitioning-in-apache-hive/
[13] Анонсирован новый онлайн-курс на Coursera от Stanford University — Mining Massive Datasets: http://igorsubbotin.blogspot.ru/2014/08/coursera-stanford-university-mining.html
[14] Быстрый HDF5 с Pandas: http://python.dzone.com/articles/quick-hdf5-pandas
[15] Интересные ресурсы по Deep Learning: http://www.kdnuggets.com/2014/08/deep-learning-important-resources-learning-understanding.html
[16] Это не NoSQL против RDBMS, это ACID+Foreign Keys против Eventual Consistency: http://java.dzone.com/articles/its-not-nosql-versus-rdbms-its
[17] Пример решения задачи на Kaggle: http://blog.graphlab.com/using-gradient-boosted-trees-to-predict-bike-sharing-demand
[18] Визуализация работы логистической регрессии: http://igorsubbotin.blogspot.ru/2014/08/logistic-regression-animated.html
[19] Машинное обучение и компьютерное зрение (часть 2): http://blogs.technet.com/b/machinelearning/archive/2014/08/20/machine-learning-meet-computer-vision-part-2.aspx
[20] Экосистема Hadoop: http://java.dzone.com/articles/hadoop-101-explanation-hadoop
[21] Что такое Big Data?: http://www.bigdata-startups.com/simplest-explanation-of-big-data/
[22] Использование expression в R: http://oddhypothesis.blogspot.ru/2014/08/optimizing-with-r-expressions.html
[23] Блок-схема машинного обучения с учителем (Supervised learning): http://igorsubbotin.blogspot.ru/2014/08/supervised-learning-flowchart.html
[24] 21 отличный график: http://www.datasciencecentral.com/profiles/blogs/12-great-charts
[25] Как удачно выступать в соревнованиях на Kaggle: http://machinelearningmastery.com/master-kaggle-by-competing-consistently/
[26] Анонс Capstone project в специализации по анализу данных от Coursera: http://www.statsblogs.com/2014/08/19/swiftkey-and-johns-hopkins-partner-for-data-science-specialization-capstone/
[27] Sybil: система масштабирования машинного обучения в Google: http://igorsubbotin.blogspot.ru/2014/08/sibyl-system-large-scale-machine-learning-google.html
[28] Четыре основных языка для анализа данных: http://www.kdnuggets.com/2014/08/four-main-languages-analytics-data-mining-data-science.html
[29] Математика для машинного обучения: http://fastml.com/math-for-machine-learning/
[30] Куда устанавливаются библиотеки в RStudio: http://java.dzone.com/articles/where-does-r-studio-install
[31] 44 статьи по анализу данных: http://www.datasciencecentral.com/profiles/blogs/selection-of-articles-and-resources-from-leading-and-influential
[32] Обзор наиболее интересных материалов по анализу данных и машинному обучению №9 (11 — 18 августа 2014): http://habrahabr.ru/post/233681/
[33] Источник: http://habrahabr.ru/post/234459/
Нажмите здесь для печати.