- PVSM.RU - https://www.pvsm.ru -

Обзор наиболее интересных материалов по анализу данных и машинному обучению №28 (22 — 28 декабря 2014)

Обзор наиболее интересных материалов по анализу данных и машинному обучению №28 (22 — 28 декабря 2014) - 1
Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.

Общее

Теория и алгоритмы машинного обучения, примеры кода

Соревнования по машинному обучению

  • EN Для новичков Python Как подходить к решению проблем на Kaggle [29] — набор простых советов от автора блога Analytics Vidhya, которые помогут стать успешным участником соревнований по машинному обучению на Kaggle.
  • EN Интервью с Yann LeCun: сверточные сети и CIFAR-10 [30] — интересное интервью с Yann LeCunn (Director of AI Research, Professor at New York University), посвященное вопросам использования сверточных сетей и обсуждению недавно завершившегося соревнования по машинному обучению CIFAR-10 на Kaggle, которое было посвящено вопросам распознавания изображений.
  • EN R Анализ данных Kaggle с помощью R [31] — интересный анализ данных соревнований по машинному обучению на Kaggle, проведенный с помощью языка программирования R.

Онлайн-курсы, обучающие материалы и литература

Видеоматериалы

Data engineering

Обзоры

Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №27 (15 — 21 декабря 2014) [45]

Автор: moat

Источник [46]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/data-mining/78312

Ссылки в тексте:

[1] Пять наиболее важных событий в мире R по итогам 2014 г.: http://r-analytics.blogspot.ru/2014/12/r-2014.html#.VJ8U8__TQA

[2] Как Deep Learning может в будущем быть использован в различных сферах жизнедеятельности: http://www.dataversity.net/deep-learning-get-familiar-widespread-industry-impact/

[3] Список ресурсов по машинному обучению: http://www.startup.ml/resources

[4] Анонс Spark Packages: http://databricks.com/blog/2014/12/22/announcing-spark-packages.html

[5] Интерактивная трехмерная визуализация различных наборов данных в браузере с помощью data-projector: http://fastml.com/interactive-in-browser-3d-visualization-of-datasets/

[6] Прогнозы на 2015 год: что случится с Big Data и Data Science?: http://www.kdnuggets.com/2014/12/2015-predictions-big-data-data-science.html

[7] 7 лучших ресурсов 2014 года по Big Data от SmartData Collective: http://smartdatacollective.com/tamaradull/286336/my-7-big-data-favorites-2014

[8] 8 предсказаний по теме Big Data на 2015 год от SmartData Collective: http://smartdatacollective.com/bernardmarr/288376/my-8-big-data-predictions-2015

[9] 4 шага к успеху в области Big Data в 2015 году: http://www.techradar.com/news/internet/data-centre/four-steps-for-success-with-big-data-in-2015-1277562

[10] 10 лучших статей 2014 года по теме Data Science с блога Analytics Vidhya: http://www.analyticsvidhya.com/blog/2014/12/top-10-articles-2014/

[11] Руководство хакера по нейронным сетям. Глава 2: Машинное обучение. Бинарная классификация: http://habrahabr.ru/company/paysto/blog/246523/

[12] Руководство хакера по нейронным сетям. Глава 2: Машинное обучение. Обучение сети на основе метода опорных векторов (SVM): http://habrahabr.ru/company/paysto/blog/246849/

[13] Обзор алгоритмов сжатия графов: http://habrahabr.ru/post/246325/

[14] InterSystems iKnow. Загружаем данные из Вконтакте: http://habrahabr.ru/company/intersystems/blog/246719/

[15] Линейная алгебра в машинном обучении: http://machinelearningmastery.com/linear-algebra-machine-learning/

[16] Сбор и анализ данных бейсбольной статистики с помощью R: http://blog.yhathq.com/posts/scraping-and-analyzing-baseball-data-with-r.html

[17] Деревья принятия решений: наращивание и отсечение ветвей: http://www.ams.org/samplings/feature-column/fc-2014-12

[18] Использование метода опорных компонент (Principal Component Analysis) при работе с изображениями: http://alstatr.blogspot.ru/2014/12/principal-component-analysis-on-imaging.html

[19] Распознавание рукописных цифр с помощью R (часть 1): http://www.flaviobarros.net/2014/12/22/handwritten-digit-recognition-part1/

[20] Сравнение работы с Dataframe в Python, R и Julia: http://ajkl.github.io/Dataframes/

[21] Пример создания предсказательных моделей с помощью библиотеки caret: http://www.analyticsvidhya.com/blog/2014/12/caret-package-stop-solution-building-predictive-models/

[22] Расширенная версия шпаргалки по scikit-learn: https://medium.com/@chris_bour/an-extended-version-of-the-scikit-learn-cheat-sheet-5f46efc6cbb

[23] Набор для машинного обучения: http://www.machinelearningsalon.org/download.html

[24] Визуализация данных с помощью GAE Python, D3.js и Google BigQuery (часть 1): http://code.tutsplus.com/tutorials/data-visualization-app-using-gae-python-d3js-and-google-bigquery--cms-22175

[25] Визуализация данных с помощью GAE Python, D3.js и Google BigQuery (часть 2): http://code.tutsplus.com/tutorials/data-visualization-app-using-gae-python-d3js-and-google-bigquery-part-2--cms-22467

[26] Визуализация данных с помощью GAE Python, D3.js и Google BigQuery (часть 3): http://code.tutsplus.com/tutorials/data-visualization-app-using-gae-python-d3js-and-google-bigquery-part-3--cms-22629

[27] Пример использования Spark (часть 3): очистка и сортировка номеров Social Security: http://www.sasanalysis.com/2014/12/spark-practice-3-clean-and-sort-social.html

[28] Пример кода: применение функции к каждой строке в data.frame: http://www.markhneedham.com/blog/2014/12/04/r-applying-a-function-to-every-row-of-a-data-frame/

[29] Как подходить к решению проблем на Kaggle: http://www.analyticsvidhya.com/blog/2014/12/framework-kaggle-competition/

[30] Интервью с Yann LeCun: сверточные сети и CIFAR-10: http://blog.kaggle.com/2014/12/22/convolutional-nets-and-cifar-10-an-interview-with-yan-lecun/

[31] Анализ данных Kaggle с помощью R: http://notesofdabbler.wordpress.com/2014/12/23/explore-kaggle-competition-data-with-r/

[32] Анонс нового онлайн-курса «Statistics and R for the Life Sciences»: http://igorsubbotin.blogspot.ru/2014/12/statistics-and-r-for-life-sciences-from-edx-and-harvardx.html

[33] Материалы курса «Convex Optimization» от Carnegie Mellon University: http://www.stat.cmu.edu/~ryantibs/convexopt/

[34] Набор лекций с курса «Principles of Distributed Computing» (ETH Zürich): http://dcg.ethz.ch/lectures/podc_allstars/

[35] Основные ловушки проектов машинного обучения: http://machinelearningmastery.com/common-pitfalls-machine-learning-projects/

[36] Машинное обучение с помощью статистических и казуальных методов: http://machinelearningmastery.com/machine-learning-statistical-causal-methods/

[37] Azure Data Factory Preview: http://habrahabr.ru/post/110751/

[38] Дайджест лучших ресурсов от DataScienceCentral (29 декабря): http://www.datasciencecentral.com/profiles/blogs/weekly-digest-december-29

[39] Лучшие материалы за неделю от KDnuggets.com (14 — 20 декабря): http://www.kdnuggets.com/2014/12/top-news-week-dec-14.html

[40] Еженедельный сборник лучших материалов от R1Soft (26 декабря): http://www.r1soft.com/blog/this-week-in-data-december-26-2014

[41] Лучшие ресурсы за неделю от Data Elixir (№15): http://dataelixir.com/issues/15

[42] Наиболее интересные материалы от Freakonometrics №195: http://freakonometrics.hypotheses.org/18360

[43] Наиболее интересные материалы от Freakonometrics №196: http://freakonometrics.hypotheses.org/18400

[44] Наиболее интересные материалы от Freakonometrics №197: http://freakonometrics.hypotheses.org/18484

[45] Обзор наиболее интересных материалов по анализу данных и машинному обучению №27 (15 — 21 декабря 2014): http://habrahabr.ru/post/246405/

[46] Источник: http://habrahabr.ru/post/246939/