- PVSM.RU - https://www.pvsm.ru -

Обзор наиболее интересных материалов по анализу данных и машинному обучению №17 (6 — 12 октября 2014)

Обзор наиболее интересных материалов по анализу данных и машинному обучению №17 (6 — 12 октября 2014)
Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.

Общее

Теория и алгоритмы машинного обучения, примеры кода

  • EN Для новичков R Работа с Data Frame в R [13]
    Неплохая статья о манипуляциях с объектами Data Frame в языке программирования R от базовых до использования библиотеки dplyr.
  • EN Для новичков Введение в Feature Selection [14]
    Очередная интересная и полезная статья от автора блога MachineLearningMastery, в данном случае речь пойдет о таком важном шаге в процессе машинного обучения как Feature Selection.
  • EN Для новичков Теория Введение в метод k ближайших соседей [15]
    Достаточно простое описание метода k ближайщих соседей с блога Analytics Vidhya.

Соревнования по машинному обучению

Онлайн-курсы, обучающие материалы и литература

Видеоматериалы

Data engineering

Обзоры

Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №16 (29 сентября — 5 октября 2014) [46]

Автор: moat

Источник [47]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/data-mining/71440

Ссылки в тексте:

[1] Дата-майнинг делает научные открытия: http://habrahabr.ru/post/240067/

[2] Простой способ оценки понятности текста на русском языке: http://habrahabr.ru/post/239511/

[3] 16 вариантов развития своих навыков в Data Science: http://machinelearningmastery.com/16-options-to-get-started-and-make-progress-in-machine-learning-and-data-science/

[4] Введение в Big Data в финансовой сфере (часть 3): http://inside-bigdata.com/2014/10/06/credit-scoring-back-tradingtesting/

[5] Как начать карьеру аналитика: http://www.analyticsvidhya.com/blog/2014/10/learning-path-resources-start-analytics/

[6] Введение в In-Memory Computing (часть 3): http://inside-bigdata.com/2014/10/09/types-memory-computing

[7] Роль Julia в Data Science: http://radar.oreilly.com/2013/10/julias-role-in-data-science.html

[8] 7 вещей о Big Data, о которых вы должны помнить: http://bigdataanalyticsnews.com/7-things-must-know-big-data-adoption/

[9] Azure ML помогает CMU использовать электроэнергию более эффективно: http://blogs.technet.com/b/machinelearning/archive/2014/10/08/azure-ml-is-helping-cmu-become-more-energy-efficient.aspx

[10] Почему R лучше Excel для анализа данных: http://fantasyfootballanalytics.net/2014/01/why-r-is-better-than-excel.html

[11] Microsoft Prediction Lab: http://blogs.technet.com/b/machinelearning/archive/2014/10/08/make-your-predictions-about-upcoming-events-at-microsoft-prediction-lab.aspx

[12] 200 лучших блогеров DataScienceCentral: http://www.datasciencecentral.com/profiles/blogs/200-top-bloggers-on-data-science-central

[13] Работа с Data Frame в R: http://biologyforfun.wordpress.com/2014/10/11/dataframe-manipulation-in-r-from-basics-to-dplyr/

[14] Введение в Feature Selection: http://machinelearningmastery.com/an-introduction-to-feature-selection/

[15] Введение в метод k ближайших соседей: http://www.analyticsvidhya.com/blog/2014/10/introduction-k-neighbours-algorithm-clustering/

[16] Конкурс Avito.ru-2014: распознавание контактной информации на изображениях: http://igorsubbotin.blogspot.ru/2014/10/avito-contact-info-image-recognition-competition.html

[17] Соревнование по машинному обучению «Tradeshift Text Classification»: http://igorsubbotin.blogspot.ru/2014/10/kaggle-tradeshift-text-classification.html

[18] Стартовал онлайн-курс «Social Network Analysis»: http://igorsubbotin.blogspot.ru/2014/10/social-network-analysis.html

[19] Бесплатная книга «DBA's Guide to NoSQL»: http://igorsubbotin.blogspot.ru/2014/10/free-nosql-for-dbas-book-available-now.html

[20] Обзор книги «Modern Optimization with R»: http://www.kdnuggets.com/2014/10/book-modern-optimization-with-r.html

[21] Анонс второго издания книги «Doing Bayesian Data Analysis»: http://doingbayesiandataanalysis.blogspot.ru/2014/10/2nd-edition-of-doing-bayesian-data.html

[22] Обзор книги «Monte Carlo simulation and resampling methods for social science»: http://xianblog.wordpress.com/2014/10/06/monte-carlo-simulation-and-resampling-methods-for-social-science-book-review/

[23] Обзор книги «Analytics in a Big Data World»: http://www.dataminingblog.com/data-mining-book-review-analytics-in-a-big-data-world/

[24] Материалы со встречи «Moscow Cassandra Meetup at Yandex»: http://igorsubbotin.blogspot.ru/2014/10/moscow-cassandra-meetup-at-yandex.html

[25] Ruslan Salakhutdinov о Deep Learning на конференции KDD 2014: http://igorsubbotin.blogspot.ru/2014/10/video-ruslan-salakhutdinov-kdd-14-deep-learning.html

[26] Системы хранения данных: как выбирать?!: http://habrahabr.ru/company/parallels/blog/239381/

[27] Встреча «PostgreSQL в Avito.ru»: http://igorsubbotin.blogspot.ru/2014/10/meetup-postgresql-avito-ru.html

[28] Apache Spark побил предыдущий рекорд по скорости сортировки большого объема данных: http://databricks.com/blog/2014/10/10/spark-breaks-previous-large-scale-sort-record.html

[29] 7 самых популярных API в области Big Data (часть 1): http://natishalom.typepad.com/nati_shaloms_blog/2014/10/the-seven-most-popular-apis-in-big-data-part-1.html

[30] 7 самых популярных API в области Big Data (часть 2): http://natishalom.typepad.com/nati_shaloms_blog/2014/10/the-seven-most-popular-apis-in-big-data-part-2.html

[31] История Apache Storm: http://nathanmarz.com/blog/history-of-apache-storm-and-lessons-learned.html?utm_source=NoSQL+Weekly+Newsletter&utm_campaign=6494d7996b-NoSQL_Weekly_Issue_202_October_9_2014&utm_medium=email&utm_term=0_2f0470315b-6494d7996b-288623537

[32] Как выбрать хранилище данных: http://www.datanami.com/2014/10/06/selecting-right-database-right-job/

[33] Сервис «Cloudera Live»: http://blog.cloudera.com/blog/2014/10/the-definitive-getting-started-tutorial-for-apache-hadoop-your-own-demo-cluster/

[34] Что такое Write Concern в MongoDB?: http://java.dzone.com/articles/what-write-concern-mongodb

[35] Анонс Couchbase Server 3.0: http://blog.couchbase.com/announcing-release-couchbase-server-30-0

[36] Новости Data Mining: http://mydatamine.com/data-mining-news-october-8-2014/

[37] Еженедельный дайджест от DataScienceCentral: http://www.datasciencecentral.com/profiles/blogs/weekly-digest-october-13

[38] Дайджест лучших ресурсов от DataScienceCentral: http://www.datasciencecentral.com/profiles/blogs/new-batch-of-selected-resources-and-articles-october-7

[39] Лучшие материалы за неделю (28 сентября — 4 октября): http://www.kdnuggets.com/2014/10/top-news-week-sep-28.html

[40] Лучшие материалы за сентябрь: http://www.kdnuggets.com/2014/10/top-news-2014-sep.html

[41] 10 лучших материалов недели: http://datasciencereport.com/2014/10/05/our-top-10-data-scienceanalytics-jobs-articles-for-this-week/

[42] Наиболее интересные материалы от Freakonometrics №172: http://freakonometrics.hypotheses.org/17285

[43] Наиболее интересные материалы от Freakonometrics №171: http://freakonometrics.hypotheses.org/17237

[44] Наиболее интересные материалы по High Scalability: http://highscalability.com/blog/2014/10/10/stuff-the-internet-says-on-scalability-for-october-10th-2014.html

[45] Лучшие материалы: NoSQL Zone (3 — 9 октября): http://java.dzone.com/articles/best-week-oct-3-nosql-zone

[46] Обзор наиболее интересных материалов по анализу данных и машинному обучению №16 (29 сентября — 5 октября 2014): http://habrahabr.ru/post/239247/

[47] Источник: http://habrahabr.ru/post/240139/