- PVSM.RU - https://www.pvsm.ru -

Обзор наиболее интересных материалов по анализу данных и машинному обучению №21 (3 — 9 ноября 2014)

Обзор наиболее интересных материалов по анализу данных и машинному обучению №21 (3 — 9 ноября 2014)
Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.

Общее

Теория и алгоритмы машинного обучения, примеры кода

Соревнования по машинному обучению

Онлайн-курсы, обучающие материалы и литература

  • EN Сайт «Mining of Massive Datasets» [23]
    На данном сайте можно найти ссылки на книгу по данной теме и ссылки на различные онлайн-курсы.

Видеоматериалы

Data engineering

Обзоры

Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №20 (27 октября — 2 ноября 2014) [45]

Автор: moat

Источник [46]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/data-mining/73929

Ссылки в тексте:

[1] Машинное обучение как сервис — бесплатно и в облаке: http://habrahabr.ru/company/microsoft/blog/242561/

[2] Microsoft Azure ❤ Big Data: http://habrahabr.ru/post/242403/

[3] Как мы делали аналитику для высоконагруженного сайта: http://habrahabr.ru/post/242369/

[4] DeepMind создаёт компьютер, повторяющий человеческую кратковременную память: http://geektimes.ru/post/241124/

[5] 3 вопроса, на которые необходимо ответить при выборе программы Data Science: http://www.mastersindatascience.org/blog/questions-before-choosing-data-science-program/

[6] 22 совета по теме Data Science: http://www.datasciencecentral.com/profiles/blogs/22-tips-for-better-data-science

[7] Гибкость модели данных: http://cloudvane.com/2014/11/05/big-data-101-data-agility/

[8] Открытые проблемы по теме работы с данными в Facebook: https://research.facebook.com/blog/1522692927972019/facebook-s-top-open-data-problems/

[9] 10 рекомендаций при реализации принципов Big Data: http://bigdataanalyticsnews.com/top-10-big-data-implementation-best-practices/

[10] Запуск R в облаке Azure ML: http://blog.revolutionanalytics.com/2014/11/r-on-azure-ml.html

[11] Как взять под контроль огромный список алгоритмов машинного обучения: http://machinelearningmastery.com/create-lists-of-machine-learning-algorithms/

[12] Hello World машинного обучения: http://machinelearningmastery.com/hello-world-of-applied-machine-learning/

[13] Кластеризация и модель распределенных вычислений: http://grigory.us/blog/mapreduce-clustering/

[14] Обнаружение выбросов — использование машинного обучения для обнаружения аномалий при анализе временных рядов: http://blogs.technet.com/b/machinelearning/archive/2014/11/05/anomaly-detection-using-machine-learning-to-detect-abnormalities-in-time-series-data.aspx

[15] Анализ покрытия кода R юнит тестами: http://www.r-statistics.com/2014/11/analyzing-coverage-of-r-unit-tests-in-packages-the-testcoverage-package/

[16] Анализ тональности текста твитов с помощью ALYIEN Text Analysis API: http://blog.aylien.com/post/101940755203/sentiment-analysis-of-tweets-with-aylien-text-analysis

[17] Введение в нейронные сети: http://www.rzagabe.com/artificial-neural-network-introduction/

[18] Интуиция регуляризованной логистической регрессии: http://kldavenport.com/regularized-logistic-regression-intuition/

[19] Введение в метод главных компонент: http://www.lauradhamilton.com/introduction-to-principal-component-analysis-pca

[20] О важной роли базового результата: http://machinelearningmastery.com/how-to-get-baseline-results-and-why-they-matter/

[21] Первое место: The Hunt for Prohibited Content: http://blog.kaggle.com/2014/11/03/1st-place-the-hunt-for-prohibited-content/

[22] Второе место: The Hunt for Prohibited Content: http://blog.kaggle.com/2014/11/03/2nd-place-the-hunt-for-prohibited-content/

[23] Сайт «Mining of Massive Datasets»: http://mmds.org/

[24] Hadley Wickham: введение в dplyr (часть 1): http://igorsubbotin.blogspot.ru/2014/11/hadley-wickhams-dplyr-tutorial-1.html

[25] Hadley Wickham: введение в dplyr (часть 2): http://igorsubbotin.blogspot.ru/2014/11/hadley-wickhams-dplyr-tutorial-2.html

[26] HighLoad++ 2014: Устройство современного распределенного Object Storage на примере LeoFS (Александр Чистяков, Git in Sky) : http://igorsubbotin.blogspot.ru/2014/11/leofs-from-alexander-chistyakov-at-highload2014.html

[27] HighLoad++ 2014: Sharding: patterns and antipatterns (Константин Осипов, Алексей Рыбак): http://igorsubbotin.blogspot.ru/2014/11/sharding-patterns-and-antipatterns-at-highload2014.html

[28] Использование Apache Spark и Neo4j для анализа больших графов: http://www.kennybastani.com/2014/11/using-apache-spark-and-neo4j-for-big.html

[29] Netflix Dynomite — как сделать нераспределенные базы данных распределенными: http://techblog.netflix.com/2014/11/introducing-dynomite.html

[30] Flafka: Apache Flume и Apache Kafka для обработки событий: http://blog.cloudera.com/blog/2014/11/flafka-apache-flume-meets-apache-kafka-for-event-processing/

[31] NoSQL в мире Hadoop: http://blog.cloudera.com/blog/2014/11/nosql-in-a-hadoop-world-2/

[32] Работа с сессиями со скоростью близкой к режиму реального времени с помощью Spark Streaming и Apache Hadoop: http://blog.cloudera.com/blog/2014/11/how-to-do-near-real-time-sessionization-with-spark-streaming-and-apache-hadoop/

[33] Три совета по моделированию данных в документо-ориентированных БД (часть 1): http://java.dzone.com/articles/three-things-know-about

[34] 10 советов по моделированию данных в мире реляционных и NoSQL хранилищ: http://www.dataversity.net/10-tips-data-modeling-hybrid-nosqlrelational-world/

[35] Введение в Hadoop MapReduce: http://blog.eviac.net/2014/11/getting-started-with-hadoop-mapreduce.html

[36] Лучшие ресурсы за неделю от Data Elixir: http://dataelixir.com/issues/9

[37] Еженедельный дайджест от DataScienceCentral: http://www.datasciencecentral.com/profiles/blogs/weekly-digest-november-10

[38] Дайджест лучших ресурсов от DataScienceCentral: http://www.datasciencecentral.com/profiles/blogs/new-batch-of-articles

[39] 10 лучших материалов недели: http://datasciencereport.com/2014/11/03/data-science-report-top-articles-videos-jobs-in-data-science-big-data-analytics/

[40] Лучшие материалы за неделю (26 октября — 1 ноября): http://www.kdnuggets.com/2014/11/top-news-week-oct-26.html

[41] Новости Data Mining: http://mydatamine.com/data-mining-news-november-5-2014/

[42] Наиболее интересные материалы от Freakonometrics №181: http://freakonometrics.hypotheses.org/17814

[43] Наиболее интересные материалы от Freakonometrics №180: http://freakonometrics.hypotheses.org/17716

[44] Наиболее интересные материалы по High Scalability: http://highscalability.com/blog/2014/11/7/stuff-the-internet-says-on-scalability-for-november-7th-2014.html

[45] Обзор наиболее интересных материалов по анализу данных и машинному обучению №20 (27 октября — 2 ноября 2014): http://habrahabr.ru/post/242237/

[46] Источник: http://habrahabr.ru/post/242687/