- PVSM.RU - https://www.pvsm.ru -

Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.
5 трендов в области анализа и обработки данных в 2015 году [1]
Примеры работы генетического алгоритма [2] — встретил два очень наглядных примера работы генетических алгоритмов с достаточно большим количеством настраиваемых параметров.
Отличная коллекция различных наборов данных [3] — коллекция различных наборов данных от Sebastian Raschka.
NASA будет прибегать к помощи машинного обучения при изучении звезд [4]
Развитие Deep Learning в Google Search [5] — очень интересная статья под названием «Google Search Wiil Be Your Next Brain» из серии статей о развитии поисковой системы в компании Google. В этой статье речь пойдет о появлении и развитии в компании методик Deep Learning, покупке компании DeepMind, развитии проекта Google Brain и технологий искусственного интеллекта.
Интервью с Demis Hassabis [6] — продолжение предыдущей статьи, интервью с Demis Hassabis — основателем компании DeepMind, которую компания Google купила за 400 млн. долларов.
Инструменты с открытым исходным кодом от Facebook для более эффективного использования методик Deep Learning [7]
В Baidu построили суперкомпьютер для Deep Learning [8]
Как проводить собеседование на позицию Data Scientist [9]
Talking Machines: Эпизод 2: Интервью с Ilya Sutskever [10] — второй эпизод «Talking Machines», в данном случае это интервью с Ilya Sutskever — одним из членов команды Google Research.
8 тенденций Big Data в 2015 году по версии DataFloq [11]
R не теряет своей актуальности [12] — немного размышлений о популярности языка программирования R и о том, что он не теряет своей популярности, а даже наоборот.
Python против R: что изучать в первую очередь? [13] — в продолжение темы обсуждения языков программирования для анализа данных — неплохое сравнение от автора блога Udacity двух популярных языков, которые используются для анализа данных в настоящее время и очевидный, как мне кажется, вывод в конце.
5 провалов 2014 года в области работы с данными [14]
10 экспертов из области Big Data, о которых стоит знать [15]
12 лучших историй прошлого года в области Big Data [16]
Свои Яндекс-Новости с преферансом и куртизанками [17]
Событийная аналитика [18]
Введение в машинное обучение с помощью Python и Scikit-Learn [19]
Искусство Feauture Engineering в машинном обучении [20]
Метод главных компонент за 3 простых шага [21] — очередная отличная статья от Sebastian Raschka. В данном случае он расскажет про основы метода главных компонент (Principal Component Analysis).
Что такое Deep Learning? [22] — неплохая статья вводного уровня, объясняющая так быстро набирающий сейчас популярность метод машинного обучения Deep Learning.
Краткий обзор Deep Learning [23]
Геометрия классификаторов [24] — в данной статье развивается тема достаточно популярного исследования “Do we Need Hundreds of Classifiers to Solve Real World Classification Problems?” с примерами кода на языке программирования Python.
Примеры Deep Learning на Python [25]
Балансировка нагрузки с помощью RStudio Server Pro [26]
Использование библиотеки microbenchmark для сравнения времени выполнения различных выражений в R [27]
Запуск R в параллельном режиме (простой способ) [28]
О деревьях принятия решений простым языком [29]
Эффективность работы модели (часть 1) [30] — автор блога Analytics Vydhya поможет разобрать с тем, насколько эффективна ваша предсказательная модель и расскажет о возможных способах измерения эффективности работы модели.
Фундаментальные методы Data Science: Классификация, регрессия и сравнение схожести [31]
Пример визуализации расширенного фильтра Калмана при помощи R [32] — продолжение статьи «Пример визуализации фильтра Калмана при помощи R» из прошлого обзора, в данном случае представлен пример визуализации расширенного фильтра Калмана (EKF, Extended Kalman filter) при помощи языка программирования R.
Пример кода: R: тотальная векторизация [33]
Соревнование по машинному обучению «National Data Science Bowl» [34] — не так давно на Kaggle началось новое соревнование по машинному обучению «National Data Science Bowl».
Результаты соревнования «Angry Birds AI Competiton» [35]
Соревнование по машинному обучению: ChaLearn Automatic Machine Learning Challenge (AutoML) [36]
Big Data for Business [37] — новый платный курс по теме Big Data на русском языке с возможностью обучения как оффлайн, так и онлайн. Длительность обучения 3 месяца. Занятия 3 раза в неделю по 3 часа. Сертификат в конце обучения.
Очередная сессия «Machine Learning» от Andrew Ng [38] — 19 января начинается очередная сессия самого, пожалуй, популярного на данный момент онлайн-курса по машинному обучению.
Стартует курс «Statistical Learning» [39] — 19 января на сайте Stanford Online стартует интересный курс по машинному обучению под названием «Statistical Learning».
Начало курса «Statistics and R for the Life Sciences» [40] — 19 января начинается интересный курс под названием «Statistics and R for the Life Sciences» от Harvard University на edX.
Бесплатная электронная книга: «Rabbit. Introduction to R» [41] — неплохая книга по основам R, которая является сопровождением к онлайн-курсу «Introduction to R».
Big Data на вашем компьютере: Установка Hadoop-кластера [42]
Повышение эффективности сортировки в Apache Spark [43]
Как развернуть кластер Hadoop [44]
Пример персонализации с использованием Apache Cassandra в компании Spotify [45]
Интересное из мира R (12-18 января 2015 г.) [46]
Еженедельный дайджест от DataScienceCentral (19 января) [47]
Лучшие материалы за неделю от KDnuggets.com (4 — 10 января) [48]
Новости Data Science от MyDataMine.com (14 января) [49]
Новости Big Data от MyDataMine.com (16 января) [50]
7 популярных статей от Vincent Granville [51]
Еженедельный сборник лучших материалов от R1Soft (16 января) [52]
Лучшие ресурсы за неделю от Data Elixir (№18) [53]
Наиболее интересные материалы от Freakonometrics №203 [54]
Наиболее интересные материалы по High Scalability (16 января) [55]Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №30 (5 — 11 января 2015) [56]
Автор: moat
Источник [57]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/data-mining/79913
Ссылки в тексте:
[1] 5 трендов в области анализа и обработки данных в 2015 году: http://habrahabr.ru/post/247609/
[2] Примеры работы генетического алгоритма: http://igorsubbotin.blogspot.ru/2015/01/genetic-algorithm-walkers-and-cars.html
[3] Отличная коллекция различных наборов данных: http://igorsubbotin.blogspot.ru/2015/01/data-sets-collection-from-sebastian-raschka.html
[4] NASA будет прибегать к помощи машинного обучения при изучении звезд: http://www.dataversity.net/nasa-turns-machine-learning-identify-stars-faster/
[5] Развитие Deep Learning в Google Search: https://medium.com/backchannel/google-search-will-be-your-next-brain-5207c26e4523
[6] Интервью с Demis Hassabis: https://medium.com/backchannel/the-deep-mind-of-demis-hassabis-156112890d8a
[7] Инструменты с открытым исходным кодом от Facebook для более эффективного использования методик Deep Learning: https://gigaom.com/2015/01/16/facebook-open-sources-tools-for-bigger-faster-deep-learning-models/
[8] В Baidu построили суперкомпьютер для Deep Learning: https://gigaom.com/2015/01/14/baidu-has-built-a-supercomputer-for-deep-learning/
[9] Как проводить собеседование на позицию Data Scientist: http://www.kdnuggets.com/2015/01/how-to-interview-data-scientist.html
[10] Talking Machines: Эпизод 2: Интервью с Ilya Sutskever: http://www.thetalkingmachines.com/blog/2015/1/15/machine-learning-and-magical-thinking
[11] 8 тенденций Big Data в 2015 году по версии DataFloq: https://datafloq.com/read/8-trends-in-big-data-for-2015/695
[12] R не теряет своей актуальности: http://www.revolutionanalytics.com/r-is-still-hot
[13] Python против R: что изучать в первую очередь?: http://blog.udacity.com/2015/01/python-vs-r-learn-first.html
[14] 5 провалов 2014 года в области работы с данными: https://datafloq.com/read/5-data-fails-in-2014/692
[15] 10 экспертов из области Big Data, о которых стоит знать: http://www.kdnuggets.com/2015/01/10-industry-big-data-experts-to-know.html
[16] 12 лучших историй прошлого года в области Big Data: http://smartdatacollective.com/bernardmarr/291466/12-unmissable-big-data-stories-past-year?utm_source=feedly&utm_reader=feedly&utm_medium=feed&utm_campaign=Smart+Data+Collective+%28all+posts%29
[17] Свои Яндекс-Новости с преферансом и куртизанками: http://learndata.ru/news-aggregation-yandex/
[18] Событийная аналитика: http://learndata.ru/event-analytics/
[19] Введение в машинное обучение с помощью Python и Scikit-Learn: http://habrahabr.ru/post/247751/
[20] Искусство Feauture Engineering в машинном обучении: http://habrahabr.ru/post/248129/
[21] Метод главных компонент за 3 простых шага: http://sebastianraschka.com/Articles/2015_pca_in_3_steps.html
[22] Что такое Deep Learning?: http://simonwinder.com/2015/01/what-is-deep-learning/
[23] Краткий обзор Deep Learning: http://yyue.blogspot.ca/2015/01/a-brief-overview-of-deep-learning.html
[24] Геометрия классификаторов: http://www.win-vector.com/blog/2014/12/the-geometry-of-classifiers/
[25] Примеры Deep Learning на Python: https://github.com/lisa-lab/DeepLearningTutorials
[26] Балансировка нагрузки с помощью RStudio Server Pro: http://blog.rstudio.org/2015/01/13/balancing-the-load-whats-new-in-rstudio-server-pro/
[27] Использование библиотеки microbenchmark для сравнения времени выполнения различных выражений в R: http://gettinggeneticsdone.blogspot.ru/2015/01/microbenchmark-package-r-compare-runtime-r-expressions.html
[28] Запуск R в параллельном режиме (простой способ): http://blog.yhathq.com/posts/running-r-in-parallel.html
[29] О деревьях принятия решений простым языком: http://www.analyticsvidhya.com/blog/2015/01/decision-tree-simplified/
[30] Эффективность работы модели (часть 1): http://www.analyticsvidhya.com/blog/2015/01/model-performance-metrics-classification/
[31] Фундаментальные методы Data Science: Классификация, регрессия и сравнение схожести: http://www.kdnuggets.com/2015/01/fundamental-methods-data-science-classification-regression-similarity-matching.html
[32] Пример визуализации расширенного фильтра Калмана при помощи R: http://www.magesblog.com/2015/01/extended-kalman-filter-example-in-r.html
[33] Пример кода: R: тотальная векторизация: http://www.markhneedham.com/blog/2014/12/22/r-vectorising-all-the-things/
[34] Соревнование по машинному обучению «National Data Science Bowl»: http://igorsubbotin.blogspot.ru/2015/01/national-data-science-bowl-on-kaggle.html
[35] Результаты соревнования «Angry Birds AI Competiton»: http://igorsubbotin.blogspot.ru/2015/01/angry-bird-competition-results.html
[36] Соревнование по машинному обучению: ChaLearn Automatic Machine Learning Challenge (AutoML): https://www.codalab.org/competitions/2321
[37] Big Data for Business: http://newprolab.com/bigdata/
[38] Очередная сессия «Machine Learning» от Andrew Ng: http://igorsubbotin.blogspot.ru/2015/01/mooc-19jan-andrew-ng-machine-learning.html
[39] Стартует курс «Statistical Learning»: http://igorsubbotin.blogspot.ru/2015/01/start-of-stanford-online-course-on-statistical-learning.html
[40] Начало курса «Statistics and R for the Life Sciences»: http://igorsubbotin.blogspot.ru/2015/01/start-of-statistics-and-r-for-life-sciences-from-edx-and-harvardx.html
[41] Бесплатная электронная книга: «Rabbit. Introduction to R»: http://www.quantide.com/R/rabbit-another-introduction-to-r-2/
[42] Big Data на вашем компьютере: Установка Hadoop-кластера: http://zaleslaw.blogspot.ru/2015/01/installing-hadoop-cluster-multi-node.html
[43] Повышение эффективности сортировки в Apache Spark: http://blog.cloudera.com/blog/2015/01/improving-sort-performance-in-apache-spark-its-a-double/
[44] Как развернуть кластер Hadoop: http://blog.cloudera.com/blog/2015/01/how-to-deploy-apache-hadoop-clusters-like-a-boss/
[45] Пример персонализации с использованием Apache Cassandra в компании Spotify: http://planetcassandra.org/blog/personalization-at-spotify-using-apache-cassandra/
[46] Интересное из мира R (12-18 января 2015 г.): http://r-analytics.blogspot.ru/2015/01/r-12-18-2015.html#.VLusfy4_xoM
[47] Еженедельный дайджест от DataScienceCentral (19 января): http://www.datasciencecentral.com/profiles/blogs/weekly-digest-january-19
[48] Лучшие материалы за неделю от KDnuggets.com (4 — 10 января): http://www.kdnuggets.com/2015/01/top-news-week-jan-4.html
[49] Новости Data Science от MyDataMine.com (14 января): http://mydatamine.com/2015/01/data-science-news-14-jan-2015/
[50] Новости Big Data от MyDataMine.com (16 января): http://mydatamine.com/2015/01/big-data-news-16-jan-2015/
[51] 7 популярных статей от Vincent Granville: http://www.analyticbridge.com/profiles/blogs/seven-recent-and-popular-data-science-articles
[52] Еженедельный сборник лучших материалов от R1Soft (16 января): http://www.r1soft.com/blog/this-week-in-data-january-16-2015
[53] Лучшие ресурсы за неделю от Data Elixir (№18): http://dataelixir.com/issues/18
[54] Наиболее интересные материалы от Freakonometrics №203: http://freakonometrics.hypotheses.org/18814
[55] Наиболее интересные материалы по High Scalability (16 января): http://highscalability.com/blog/2015/1/16/stuff-the-internet-says-on-scalability-for-january-16th-2015.html
[56] Обзор наиболее интересных материалов по анализу данных и машинному обучению №30 (5 — 11 января 2015): http://habrahabr.ru/post/247587/
[57] Источник: http://habrahabr.ru/post/248165/
Нажмите здесь для печати.