- PVSM.RU - https://www.pvsm.ru -

Обзор наиболее интересных материалов по анализу данных и машинному обучению №32 (19 — 25 января 2015)

Обзор наиболее интересных материалов по анализу данных и машинному обучению №32 (19 — 25 января 2015) - 1
Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.

Общее

Теория и алгоритмы машинного обучения, примеры кода

Соревнования по машинному обучению

Онлайн-курсы, обучающие материалы и литература

Видеоматериалы

  • EN Видеолекции Для новичков Теория Введение в Random Forest от Dr. Nando de Freitas [34] — в данном посте представлена лекция по популярному алгоритму машинного обучения Random Forest от Dr. Nando de Freitas (Adjunct Professor at UBC Computer Science, Full-time Professor at Oxford).

Data engineering

Обзоры

Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №31 (12 — 18 января 2015) [44]

Автор: moat

Источник [45]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/data-mining/80604

Ссылки в тексте:

[1] Визуализация многомерных данных с помощью диаграмм Эндрюса: http://habrahabr.ru/post/248623/

[2] Microsoft покупает компанию Revolution Analytics: http://blog.revolutionanalytics.com/2015/01/revolution-acquired.html

[3] Лучшие презентации SlideShare по теме Big Data: http://www.kdnuggets.com/2015/01/top-slideshare-presentations-big-data-updated.html

[4] 15 отличных визуализаций данных: http://blog.udacity.com/2015/01/15-data-visualizations-will-blow-mind.html

[5] Исследователи показали сеть машинного обучения для групп распределенных устройств: https://gigaom.com/2015/01/22/researchers-show-a-machine-learning-network-for-connected-devices/

[6] Компьютеры учатся как лечить рак и диабет, играя в Atari и покер: http://fivethirtyeight.com/features/computers-are-learning-how-to-treat-cancer-and-diabetes-by-playing-poker-and-atari/

[7] История развития алгоритмов компьютерного зрения за последние 20 лет: http://quantombone.blogspot.ru/2015/01/from-feature-descriptors-to-deep.html

[8] Пострение рекомендательной системы (часть 1): https://dataaspirant.wordpress.com/2015/01/24/recommendation-engine-part-1/

[9] Несколько слов об искуственных нейронных сетях и Deep Learning: http://analyticsbot.ml/2015/01/artifical-neural-networks-and-deep-learning/

[10] Пострение масштабируемых алгоритмов машинного обучения: http://radar.oreilly.com/2015/01/building-and-deploying-large-scale-machine-learning-pipelines.html

[11] Введение в scikit-learn: http://igorsubbotin.blogspot.ru/2015/01/intro-to-scikit-learn.html

[12] Data tidying: Подготовка наборов данных для анализа на конкретных примерах: http://habrahabr.ru/post/248741/

[13] Визуализация работы Deep Learning: http://colah.github.io/posts/2015-01-Visualizing-Representations/

[14] Кластеризация методом k-средних: за все нужно платить: http://varianceexplained.org/r/kmeans-free-lunch/

[15] Немного о сверточных нейронных сетях: https://shapeofdata.wordpress.com/2015/01/24/convolutional-neural-networks/

[16] Глубокое погружение в рекурентные нейронные сети: http://nikhilbuduma.com/2015/01/11/a-deep-dive-into-recurrent-neural-networks/

[17] Краткий обзор алгоритма Kernel PCA: http://blog.shriphani.com/2015/01/20/the-kernel-pca/

[18] Машинное обучение для распознавания лиц: http://efavdb.com/machine-learning-for-facial-recognition-3/

[19] Анализ текста для новичков: Классификация документов: http://www.kdnuggets.com/2015/01/text-analysis-101-document-classification.html

[20] Обучение сверточной нейронной сети игре Go: http://arxiv.org/abs/1412.3409

[21] Эффективность работы модели (часть 2): http://www.analyticsvidhya.com/blog/2015/01/model-perform-part-2/

[22] Введение в caretEnsemble: http://cran.r-project.org/web/packages/caretEnsemble/vignettes/caretEnsemble-intro.html

[23] О деревьях принятия решений простым языком: http://www.analyticsvidhya.com/blog/2015/01/decision-tree-algorithms-simplified/

[24] Анализ данных на Python: http://nbviewer.ipython.org/github/Syrios12/learningwithdata/blob/master/Python_For_Data_Mining.ipynb

[25] Jetpack: инструменты машинного обучения в Docker: https://github.com/StartupML/jetpack

[26] Основные ошибки разработчиков при использовании Python для анализа больших данных: https://www.airpair.com/python/posts/top-mistakes-python-big-data-analytics

[27] Пример использования Random Forest и бустинга с помощью MLlib: http://databricks.com/blog/2015/01/21/random-forests-and-boosting-in-mllib.html

[28] Набор полезных приемов для Pandas: http://nbviewer.ipython.org/github/rasbt/python_reference/blob/master/tutorials/things_in_pandas.ipynb

[29] Как начать работу в Kaggle: руководство для новичков в Data Science: http://habrahabr.ru/post/248395/

[30] Новое соревнование по машинному обучению «How much did it rain?»: http://igorsubbotin.blogspot.ru/2015/01/how-much-did-it-rain-competion-on-kaggle.html

[31] Начало онлайн-курса Mining Massive Datasets от Stanford University: http://igorsubbotin.blogspot.ru/2015/01/coursera-stanford-university-mining-31jan15.html

[32] Обзор книги: Advanced Analytics with Apache Spark: http://blog.cloudera.com/blog/2015/01/advanced-analytics-with-apache-spark-the-book/

[33] Бесплатная электронная книга: H2O and R: http://h2o.gitbooks.io/h2o-and-r/

[34] Введение в Random Forest от Dr. Nando de Freitas: http://igorsubbotin.blogspot.ru/2015/01/intro-to-random-forest-from-nando-de-freitas.html

[35] Surus: новый проект с открытым исходным кодом для анализа данных в Hadoop от компании Netflix: https://gigaom.com/2015/01/21/netflix-is-open-sourcing-tools-for-analyzing-data-in-hadoop/

[36] Интересное из мира R (19-25 января 2015 г.): http://r-analytics.blogspot.ru/2015/01/r-19-25-2015.html#.VMTgSi4_xoM

[37] Еженедельный дайджест от DataScienceCentral (26 января): http://www.datasciencecentral.com/profiles/blogs/weekly-digest-january-26

[38] Дайджест лучших ресурсов от DataScienceCentral (23 января): http://www.datasciencecentral.com/profiles/blogs/51-new-external-resources-and-articles-about-data-science-big

[39] Лучшие материалы за неделю от KDnuggets.com (11 — 17 января): http://www.kdnuggets.com/2015/01/top-news-week-jan-11.html

[40] Новости Data Science от MyDataMine.com (22 января): http://mydatamine.com/2015/01/data-science-news-22-jan-2015/

[41] Лучшие ресурсы за неделю от Data Elixir (№19): http://dataelixir.com/issues/19

[42] Еженедельный сборник лучших материалов от R1Soft (23 января): http://www.r1soft.com/blog/this-week-in-data-january-23-2015

[43] Наиболее интересные материалы по High Scalability (23 января): http://highscalability.com/blog/2015/1/23/stuff-the-internet-says-on-scalability-for-january-23rd-2015.html

[44] Обзор наиболее интересных материалов по анализу данных и машинному обучению №31 (12 — 18 января 2015): http://habrahabr.ru/post/248165/

[45] Источник: http://habrahabr.ru/post/248793/