- PVSM.RU - https://www.pvsm.ru -

Обзор наиболее интересных материалов по анализу данных и машинному обучению №5 (7 — 21 июля 2014)

Представляю очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения (в том числе Deep Learning). Как всегда есть материалы по алгоритмам машинного обучения. Несколько практических статей по популярному пакету для машинного обучения Scikit-Learn для Python. Есть статьи, посвященные практическому применению языка R. Некоторое количество материалов посвящено теме Data Engineering. Присутствуют интересные статьи про популярные проекты 'Google Brain' и 'Project Adam'.

Материалы по анализу данных и машинному обучению

Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №4 (23 июня — 7 июля 2014) [40]

Автор: moat

Источник [41]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/data-mining/65498

Ссылки в тексте:

[1] Про Google Brain: http://www.wired.com/2014/07/google_brain/

[2] Система искусственного интеллекта от Microsoft 'Project Adam': http://www.wired.com/2014/07/microsoft-adam/

[3] Машинное обучение — микроскоп современного ученого. Зачем ЦЕРНу технологии Яндекса: http://habrahabr.ru/company/yandex/blog/230367/

[4] Логарифмическое преобразование положительных и отрицательных значений: http://www.statsblogs.com/2014/07/14/a-log-transformation-of-positive-and-negative-values/

[5] Earl Hathaway рассказывает о технике машинного обучения Distributed GBM (видео): http://igorsubbotin.blogspot.ru/2014/07/machine-learning-distributed-gbm.html

[6] 7 вариантов использования Hadoop в банковской сфере: http://smartdatacollective.com/michelenemschoff/212561/banking-hadoop-7-use-cases-hadoop-finance

[7] Стартап Clarify: http://www.wired.com/2014/07/clarifai/

[8] Оценка финансовых рисков с помощью Apache Spark: http://blog.cloudera.com/blog/2014/07/estimating-financial-risk-with-apache-spark/

[9] Соглашения об именовании в языке R: http://www.r-bloggers.com/consistent-naming-conventions-in-r/

[10] Подстройка параметров алгоритма с помощью Python Scikit-Learn: http://machinelearningmastery.com/how-to-tune-algorithm-parameters-with-scikit-learn/

[11] Список ресурсов по NoSQL, Big Data и Machine Learning: http://www.datasciencecentral.com/profiles/blogs/great-list-of-resources-nosql-big-data-ml-and-much-more-posted-on

[12] Машинное обучение с использованием Java: http://machinelearningmastery.com/java-machine-learning/

[13] Введение в Microsft Azure Machine Learning: https://projectbotticelli.com/knowledge/brief-introduction-to-microsoft-azure-ml

[14] Самообучаемые компьютеры от Darpa: http://www.wired.com/2013/03/darpa-machine-learning-2/all/1

[15] Популярные Data Science микроблогеры: http://www.datasciencecentral.com/profiles/blogs/the-fastest-growing-data-science-big-data-profiles-on-twitter

[16] 15 бесплатных книг по машинному обучению: http://electronicsforu.com/electronicsforu/circuitarchives/view_article.asp?sno=1621&article_id=12580&id=12580&page=1#.U8PfhRbxWqk

[17] 8 блогов по анализу данных: https://www.dataorigami.net/blogs/great-data-blogs

[18] Список ресурсов по машинному обучению: http://datascience101.wordpress.com/2014/07/16/huge-list-of-big-data-technologies/

[19] 10 советов по Deep Learning: http://www.lauradhamilton.com/10-tips-for-better-deep-learning-models

[20] Основы анализа данных при помощи Python: библиотеки и структуры данных: http://www.analyticsvidhya.com/blog/2014/07/baby-steps-libraries-data-structure/

[21] Deep Learning и обработка естественного языка: http://colah.github.io/posts/2014-07-NLP-RNNs-Representations/

[22] Про размер выборки: http://jvns.ca/blog/2014/07/11/fun-with-stats-how-big-of-a-sample-size-do-i-need/

[23] О масштабировании признаков и нормализации в машинном обучении: http://sebastianraschka.com/Articles/2014_about_feature_scaling.html#about-min-max-scaling

[24] Векторы в R: http://www.r-bloggers.com/r-notes-vectors/

[25] Приключения вокруг feature learning: http://karpathy.github.io/2014/07/03/feature-learning-escapades/

[26] Подготовка данных с помощью Python Scikit-Learn: http://machinelearningmastery.com/rescaling-data-for-machine-learning-in-python-with-scikit-learn/

[27] Процесс Feature Selection при помощи Python Scikit-Learn: http://machinelearningmastery.com/feature-selection-in-python-with-scikit-learn/

[28] Использование машинного обучения для повышения эффективности работы дата-центров в Google: http://www.techrepublic.com/article/google-leverages-machine-learning-to-keep-its-data-centers-energy-efficient/

[29] Рейтинг языка R: http://www.r-bloggers.com/ieee-ranks-r-9-amongst-all-languages/

[30] Загрузка данных при помощи Scikit-Learn: http://machinelearningmastery.com/how-to-load-data-in-python-with-scikit-learn/

[31] Зависимости популярных библиотек R: http://blog.revolutionanalytics.com/2014/07/dependencies-of-popular-r-packages.html

[32] Обработка временных рядов с помощью Apache Crunch: http://blog.cloudera.com/blog/2014/07/how-to-build-advanced-time-series-pipelines-in-apache-crunch/

[33] Предсказание победителя ЧМ по футболу 2014 с помощью R: http://www.analyticsvidhya.com/blog/2014/07/world-cheering-2014-fifa-wc-winner-twitter/

[34] 3 вещи, которые помогут улучшить ваш код на R: http://www.r-bloggers.com/3-ways-that-functions-can-improve-your-r-code/

[35] Data Scientist и Data Engineer: http://datascience101.wordpress.com/2014/07/08/data-scientist-vs-data-engineer/

[36] Быстрая функция для 2x2 таблиц на языке R: http://www.r-bloggers.com/sometimes-table-is-not-the-answer-a-faster-2x2-table/

[37] HDFS и MapReduce простым языком: http://pythonformachinelearning.wordpress.com/2014/07/08/hdfs-and-mapreduce-a-non-programmers-guide-about-big-data/

[38] Интервью на позицию специалиста по анализу данных: http://www.analyticsvidhya.com/blog/2014/07/definitive-guide-prepare-analytics-interview/

[39] Data Origami: скринкасты по тематике Data Science: http://machinelearningmastery.com/data-science-screencasts-a-data-origami-review/

[40] Обзор наиболее интересных материалов по анализу данных и машинному обучению №4 (23 июня — 7 июля 2014): http://habrahabr.ru/post/228989/

[41] Источник: http://habrahabr.ru/post/230561/