- PVSM.RU - https://www.pvsm.ru -

Обзор наиболее интересных материалов по анализу данных и машинному обучению №24 (24 — 30 ноября 2014)

Обзор наиболее интересных материалов по анализу данных и машинному обучению №24 (24 — 30 ноября 2014) - 1
Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.

Общее

Теория и алгоритмы машинного обучения, примеры кода

Соревнования по машинному обучению

Онлайн-курсы, обучающие материалы и литература

Видеоматериалы

  • EN Видеолекции О понимании [36] — замечательное видео с TED — Сюзан Этлиджер: Как быть с большими данными? Нетривиальный вопрос о работе с большими массивами данных их обработкой и последующей интерпретацией.

Data engineering

Обзоры

Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №23 (17 — 23 ноября 2014) [50]

Автор: moat

Источник [51]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/data-mining/75907

Ссылки в тексте:

[1] Интересное из мира R (17-23 ноября 2014): http://r-analytics.blogspot.ru/2014/11/r-17-23-2014.html#.VHmgZMlA_FI

[2] Анализ тональности текста с помощью Azure Machine Learning: http://habrahabr.ru/post/243705/

[3] Делимся опытом: особенности подготовки русскоязычных текстовых документов к анализу в среде R: http://r-analytics.blogspot.ru/2014/11/r.html#.VHmgZclA_FI

[4] И ещё раз про распознавание номеров: http://habrahabr.ru/company/recognitor/blog/243919/

[5] Адаптивное обучение, или несколько слов о Knewton: http://habrahabr.ru/company/npl/blog/244539/

[6] Netflix: 10 уроков, полученных при построении систем машинного обучения: http://igorsubbotin.blogspot.ru/2014/11/netflix-10-lessons-learned-from-building-ml-systems.html

[7] Как правильно формировать успешные Data Science команды: http://machinelearningmastery.com/data-science-skills-simple-method-can-use-evaluate-use-results-build-amazing-data-science-teams/

[8] Как стать Data Scientist за 4 шага: http://www.datasciencecentral.com/profiles/blogs/4-easy-steps-to-becoming-a-data-scientist

[9] Показывайте хорошие результаты, чтобы получить работу в области машинного обучения: http://machinelearningmastery.com/get-dream-job-machine-learning-delivering-results/

[10] Библиотека graph-tool для Python: http://graph-tool.skewed.de/

[11] Владимир Вапник теперь работает в команде Facebook: http://venturebeat.com/2014/11/25/facebooks-ai-team-hires-vladimir-vapnik-father-of-the-popular-support-vector-machine-algorithm/

[12] 4 интересных статьи от Vincent Granville: http://www.analyticbridge.com/profiles/blogs/four-articles-for-thanksgiving-reading

[13] Будущее Big Data: http://smartdatacollective.com/tracey-wallace/281741/future-big-data-visualized-infographic

[14] Andrew Ng о Deep Learning и инновациях в Кремниевой долине: http://blogs.wsj.com/digits/2014/11/21/baidus-andrew-ng-on-deep-learning-and-innovation-in-silicon-valley/

[15] 5 вещей, о которых должен знать каждый лидер Data Science команды: http://www.analyticsvidhya.com/blog/2014/11/data-science-manager-lead-team/

[16] Самые популярные презентации со Slideshare по теме Data Science: http://www.kdnuggets.com/2014/11/most-popular-slideshare-presentations-data-science.html

[17] 3 основные ошибки компаний при работе с Big Data и способы их избежать: http://www.forbes.com/sites/theyec/2014/11/24/3-major-mistakes-companies-make-with-big-data-and-how-to-fix-them/

[18] Самые популярные презентации со Slideshare по теме Big Data: http://www.kdnuggets.com/2014/11/most-popular-slideshare-presentations-big-data.html

[19] 6 советов, которые помогут найти работу в области Big Data: https://datafloq.com/read/6-tips-for-landing-a-job-in-the-big-data-industry/521

[20] Основные тренды Big Data в 2015 году: http://www.kdnuggets.com/2014/11/big-data-top-trends-2015.html

[21] 4 вещи о Big Data, которые необходимо знать стартапам: http://www.informationweek.com/big-data/big-data-analytics/4-big-data-essentials-for-startups/d/d-id/1317701

[22] Распознаем штрихкоды на изображениях с помощью Python и OpenCV: http://habrahabr.ru/company/enterra/blog/244163/

[23] Реализация распределенной Deep Learning сети с помощью Apache Spark: http://www.datasciencecentral.com/profiles/blogs/implementing-a-distributed-deep-learning-network-over-spark

[24] Факторизация матриц на Python: http://www.quuxlabs.com/blog/2010/09/matrix-factorization-a-simple-tutorial-and-implementation-in-python/#references

[25] Интерпретация коэффициентов линейной регрессии в R: https://biologyforfun.wordpress.com/2014/11/23/interpreting-regression-coefficient-in-r/

[26] Ask a Data Scientist: Data Leakage: http://insidebigdata.com/2014/11/26/ask-data-scientist-data-leakage/

[27] Предсказание курса акций с помощью машинного обучения и больших данных: http://eugenezhulenev.com/blog/2014/11/14/stock-price-prediction-with-big-data-and-machine-learning/

[28] Пример кода: Визуализация распределения данных с помощью Python: http://nbviewer.ipython.org/github/mwaskom/seaborn/blob/master/examples/plotting_distributions.ipynb

[29] Пример кода: логистическая регрессия в SAS и R: https://chemicalstatistician.wordpress.com/2014/11/24/performing-logistic-regression-in-r-and-sas/

[30] Параметры веб-сервиса Azure ML: http://blogs.technet.com/b/machinelearning/archive/2014/11/25/azureml-web-service-parameters.aspx

[31] Новые соревнования по машинному обучению: http://igorsubbotin.blogspot.ru/2014/11/new-machine-learning-competitions.html

[32] Анонс нового онлайн-курс «Convolutional Neural Networks for Visual Recognition»: http://igorsubbotin.blogspot.ru/2014/11/stanford-cs231n-convolutional-neural-networks.html

[33] Мастер-класс по Deep Learning: http://igorsubbotin.blogspot.ru/2014/11/deep-learning-master-class.html

[34] Обзор книги «Predictive Analytics with Microsoft Azure Machine Learning»: http://marktab.net/datamining/2014/11/23/purchase-review-predictive-analytics-microsoft-azure-machine-learning/

[35] Обзор книги «R Object-oriented Programming»: http://r-video-tutorial.blogspot.ru/2014/11/r-object-oriented-programming-book.html

[36] О понимании: http://statanalys.blogspot.ru/2014/11/blog-post.html

[37] Gobblin: новый фреймворк для работы с Big Data от LinkedIn: http://engineering.linkedin.com/data-ingestion/gobblin-big-data-ease

[38] BigBench: замеры производительности работы Big Data систем: http://blog.cloudera.com/blog/2014/11/bigbench-toward-an-industry-standard-benchmark-for-big-data-analytics/

[39] Введение в Spark Streaming: http://horicky.blogspot.ru/2014/11/spark-streaming.html

[40] Проблемы Big Data: производительность хранилища данных: http://cloudvane.com/2014/11/26/big-data-challenges-storage-performance/

[41] 5 ошибок при построении архитектуры данных, которых стоит избегать: http://www.dataversity.net/5-data-architecture-mistakes-avoid/

[42] MongoDB, Cassandra и HBase — 3 NoSQL базы данных, за которыми стоит следить: http://www.infoworld.com/article/2848722/nosql/mongodb-cassandra-hbase-three-nosql-databases-to-watch.html

[43] Виды баз данных и их эволюция: http://www.analyticsvidhya.com/blog/2014/11/types-databases-evolution/

[44] Еженедельный дайджест от DataScienceCentral (1 декабря): http://www.datasciencecentral.com/profiles/blogs/weekly-digest-december-1

[45] Лучшие материалы за неделю от KDnuggets.com (16 — 22 ноября): http://www.kdnuggets.com/2014/11/top-news-week-nov-16.html

[46] Лучшие ресурсы за неделю от Data Elixir (№12): http://dataelixir.com/issues/12

[47] Наиболее интересные материалы от Freakonometrics №188: http://freakonometrics.hypotheses.org/18085

[48] Наиболее интересные материалы от Freakonometrics №187: http://freakonometrics.hypotheses.org/18052

[49] Еженедельный сборник лучших материалов от R1Soft (29 ноября): http://www.r1soft.com/blog/this-week-in-data-november-29-2014

[50] Обзор наиболее интересных материалов по анализу данных и машинному обучению №23 (17 — 23 ноября 2014): http://habrahabr.ru/post/243967/

[51] Источник: http://habrahabr.ru/post/244579/