- PVSM.RU - https://www.pvsm.ru -

Обзор наиболее интересных материалов по анализу данных и машинному обучению №19 (20 — 26 октября 2014)

Обзор наиболее интересных материалов по анализу данных и машинному обучению №19 (20 — 26 октября 2014)
Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.

Общее

Теория и алгоритмы машинного обучения, примеры кода

Соревнования по машинному обучению

Онлайн-курсы, обучающие материалы и литература

Видеоматериалы

Data engineering

Обзоры

Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №18 (13 — 19 октября 2014) [53]

Автор: moat

Источник [54]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/data-mining/72742

Ссылки в тексте:

[1] IBM анонсирует новые проекты внедрения технологий Watson и открытие штаб-квартиры Watson Group в Нью-Йорке: http://habrahabr.ru/company/ibm/blog/241363/

[2] Итоги Russian AI Cup 2014: http://habrahabr.ru/company/mailru/blog/240975/

[3] Как заставить данные говорить: http://habrahabr.ru/post/241315/

[4] Роль больших данных в частных расследованиях и анализе: http://habrahabr.ru/company/asus/blog/240877/

[5] На Яндекс.Картах теперь можно создавать тепловые карты: http://habrahabr.ru/company/yandex/blog/241361/

[6] Конференция HDConf: фото-видео-слайд отчет: http://habrahabr.ru/post/241349/

[7] 50+ библиотек для распознавания лиц: http://blog.mashape.com/list-of-50-face-detection-recognition-apis/

[8] Введение в Big Data в финансовой сфере (часть 5): http://inside-bigdata.com/2014/10/20/big-data-finance-security-regulatory-compliance-considerations/

[9] Популярные вопросы на собеседовании на должность аналитика (часть 2): http://www.analyticsvidhya.com/blog/2014/10/commonly-asked-interview-puzzles-part-ii/

[10] Новая библиотека для машинного обучения на Java: http://blog.datumbox.com/new-open-source-machine-learning-framework-written-in-java/

[11] Ученые из MIT могут предсказать стоимость биткоина: http://newsoffice.mit.edu/2014/mit-computer-scientists-can-predict-price-bitcoin#.VEadQI474jk

[12] Введение в In-Memory Computing (часть 4): http://inside-bigdata.com/2014/10/16/memory-computing-performance-benchmark/

[13] Введение в In-Memory Computing (часть 5): http://inside-bigdata.com/2014/10/23/gridgain-memory-data-fabric/

[14] SQL или NoSQL?: http://www.dataversity.net/sql-nosql-still-database-question/

[15] Информационный поиск с помощью Apache Lucene и Tika (часть 1): http://java.dzone.com/articles/understanding-information

[16] Информационный поиск с помощью Apache Lucene и Tika (часть 1): http://java.dzone.com/articles/understanding-information-1

[17] Информационный поиск с помощью Apache Lucene и Tika (часть 1): http://java.dzone.com/articles/understanding-information-2

[18] 15 неустаревающих статей по Data Science: http://www.datasciencecentral.com/profiles/blogs/15-timeless-data-science-articles

[19] Закон Бенфорда и распределения под него попадающие: http://habrahabr.ru/post/240853/

[20] Марковские случайные поля: http://habrahabr.ru/post/241317/

[21] Как осваивать алгоритмы машинного обучения: http://machinelearningmastery.com/how-to-study-machine-learning-algorithms/

[22] Нелинейная регрессия: http://sam-koblenski.blogspot.de/2014/10/everyday-statistics-for-programmers_21.html

[23] Первый взгляд на Distributed R: http://blog.revolutionanalytics.com/2014/10/a-first-look-at-distributed-r.html

[24] Как MKL позволяет повысить скорость работы Revolution R Open: http://blog.revolutionanalytics.com/2014/10/revolution-r-open-mkl.html

[25] Анализ текста с помощью RapidMiner (часть 1): http://blog.aylien.com/post/98466399268/analyzing-text-in-rapidminer-part-1

[26] Анализ текста с помощью RapidMiner (часть 2): http://blog.aylien.com/post/99049262213/analyzing-text-in-rapidminer-part-2-rotten-tomatoes

[27] Введение в нейронные сети (часть 2): http://www.analyticsvidhya.com/blog/2014/10/ann-work-simplified/

[28] Что такое Data-хакатон?: http://igorsubbotin.blogspot.ru/2014/10/what-is-a-data-hackathon-like.html

[29] Как выбрать модель для финальной оценки в соревновании на Kaggle: http://www.chioka.in/how-to-select-your-final-models-in-a-kaggle-competitio/

[30] Советы по выбору модели в соревнованиях по машинному обучению: http://machinelearningmastery.com/model-selection-tips-from-competitive-machine-learning/

[31] Онлайн-курс «Визуализация данных. Основы»: http://habrahabr.ru/company/datalaboratory/blog/241069/

[32] Новые курсы по Big Data от MIT на edX: http://igorsubbotin.blogspot.ru/2014/10/mooc-mit-new-bigdata.html

[33] 3 отличных бесплатных книги по теме Data Science: http://101.datascience.community/2014/10/23/3-great-data-science-books-you-can-read-now-for-free/

[34] Книга «Data Fluency»: http://www.juiceanalytics.com/writing/data-fluency

[35] Книги «Foundations of Signal Processing» и «Fourier and Wavelet Signal Processing»: http://nuit-blanche.blogspot.ru/2014/10/books-foundations-of-signal-processing.html

[36] Масштабирование алгоритмов нечеткого поиска: http://igorsubbotin.blogspot.ru/2014/10/fuzzy-matching-at-scale.html

[37] Использование Apache Spark для работы с данными: http://igorsubbotin.blogspot.ru/2014/10/video-all-about-apache-spark.html

[38] Microsoft DocumentDB: статья первая, введение: http://habrahabr.ru/company/microsoft/blog/240955/

[39] Microsoft DocumentDB: статья вторая, ресурсы и концепции: http://habrahabr.ru/company/microsoft/blog/241307/

[40] Kylin от eBay: http://cloudcelebrity.wordpress.com/2014/10/21/open-source-distributed-analytics-engine-with-sql-interface-and-olap-on-hadoop-by-ebay-kylin/

[41] Hadoop в корпоративном секторе: http://siliconangle.com/blog/2014/10/24/hows-hadoop-doing-in-the-enterprise-infographic/

[42] Нагрузочное тестирование Apache Kafka на AWS: http://grey-boundary.com/load-testing-apache-kafka-on-aws/

[43] Ловушки шардирования (часть 2): http://blog.mongodb.org/post/99486531903/sharding-pitfalls-part-ii-running-a-sharded-cluster

[44] Ловушки шардирования (часть 3): http://blog.mongodb.org/post/100676030403/sharding-pitfalls-part-iii-chunk-balancing-and

[45] Еженедельный дайджест от DataScienceCentral: http://www.datasciencecentral.com/profiles/blogs/weekly-digest-october-27

[46] Лучшие материалы за неделю (12 — 18 октября): http://www.kdnuggets.com/2014/10/top-news-week-oct-12.html

[47] Новости Data Mining: http://mydatamine.com/data-mining-news-october-22-2014/

[48] Наиболее интересные материалы от Freakonometrics №177: http://freakonometrics.hypotheses.org/17587

[49] Наиболее интересные материалы от Freakonometrics №176: http://freakonometrics.hypotheses.org/17525

[50] Наиболее интересные материалы от Freakonometrics №175: http://freakonometrics.hypotheses.org/17406

[51] Наиболее интересные материалы по High Scalability: http://highscalability.com/blog/2014/10/24/stuff-the-internet-says-on-scalability-for-october-24th-2014.html

[52] Лучшие материалы: NoSQL Zone (17 — 24 октября): http://architects.dzone.com/articles/best-week-oct-17-nosql-zone

[53] Обзор наиболее интересных материалов по анализу данных и машинному обучению №18 (13 — 19 октября 2014): http://habrahabr.ru/post/240835/

[54] Источник: http://habrahabr.ru/post/241527/