- PVSM.RU - https://www.pvsm.ru -

Обзор наиболее интересных материалов по анализу данных и машинному обучению №16 (29 сентября — 05 октября 2014)

Обзор наиболее интересных материалов по анализу данных и машинному обучению №16 (29 сентября — 05 октября 2014)
Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.

Общее

Теория и алгоритмы машинного обучения, примеры кода

Соревнования по машинному обучению

  • EN Интервью с Diogo Ferreira [18]
    Полезное интервью на блоге MachineLearningMastery с успешным участником соревнований по машинному обучению Diogo Ferreira.
  • EN R Простая модель для Kaggle «Bike Sharing Demand» [19]
    Описание достаточно простой модели для соревнования по машинному обучению «Bike Sharing Demand» на Kaggle с примерами на языке программирования R.

Онлайн-курсы, обучающие материалы и литература

Видеоматериалы

  • EN Видеолекции Для новичков R Martin Maechler о практике хорошего кода на R [25]
    Martin Maechler (член команды R-Core) выступил с интересным докладом на конференции useR! 2014. В данном видео он расскажет о практике хорошего кода как на языке программирования R, так и в целом о лучших приемах и практиках в программировании.
  • RU Видеолекции Data engineering Материалы со встречи «Новинки PostgreSQL 9.4 и кое-что ещё» [26]
    Не так давно прошла интересная встреча в офисе компании «Яндекс» и была посвящена СУБД PostgreSQL. И вот появились и видеоматериалы с данной встречи.
  • EN Видеолекции Теория Nando de Freitas о деревьях принятия решений [27]
    Отличная лекция от профессора Nando de Freitas из The University of British Columbia о деревьях принятия решений.
  • EN Видеолекции Теория Jürgen Schmidhuber о Deep Learning [28]
    Интересное видео, в котором профессор Jürgen Schmidhuber из IDSIA (International Computer Science Institute) рассказывает об истории Deep Learning и возрождении интереса к данному методу машинного обучения в настоящее время.

Data engineering

Обзоры

Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №15 (22 — 28 сентября 2014) [42]

Автор: moat

Источник [43]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/data-mining/70953

Ссылки в тексте:

[1] Использование подхода Data-Driven в машинном обучении: http://machinelearningmastery.com/a-data-driven-approach-to-machine-learning/

[2] Введение в машинное обучение для разработчиков: http://java.dzone.com/articles/developers-guide-data-science

[3] 30 лучших блогов по теме Data Science: http://www.datasciencecentral.com/profiles/blogs/top-30-dsc-blogs-based-on-new-scoring-technology

[4] Улучшение навыков машинного обучения: http://machinelearningmastery.com/how-to-build-an-intuition-for-machine-learning-algorithms/

[5] Как успешно пройти собеседование на позицию в области Data Science: http://alyaabbott.wordpress.com/2014/10/01/how-to-ace-a-data-science-interview/

[6] Модули Vowpal Wabbit в Azure ML: http://blogs.technet.com/b/machinelearning/archive/2014/10/02/vowpal-wabbit-modules-in-azureml.aspx

[7] 22 навыка, которые необходимы Data Scientist: http://www.datasciencecentral.com/profiles/blogs/the-22-skills-of-a-data-scientist

[8] Первая неделя курса «Stanford’s Machine Learning»: http://blog.iriomk.com/post/98965227733/stanfords-machine-learning-week-1-what-ive-been

[9] Наивный Байес и текстовая классификация (часть 1): http://sebastianraschka.com/Articles/2014_naive_bayes_1.html

[10] О вычислительной сложности MapReduce: http://jeremykun.com/2014/10/05/on-the-computational-complexity-of-mapreduce/

[11] Введение в нейронные сети: http://karpathy.github.io/neuralnets/

[12] Использование машинного обучения и NodeJS для определения пола пользователей Instagram: http://totems.co/blog/machine-learning-nodejs-gender-instagram/

[13] Введение в метод опорных векторов: http://www.analyticsvidhya.com/blog/2014/10/support-vector-machine-simplified/

[14] Оценка эффективности системы бинарной классификации: http://sebastianraschka.com/PDFs/articles/performance_metrics.pdf

[15] miniCRAN: свой собственный репозитарий библиотек: http://blog.revolutionanalytics.com/2014/10/introducing-minicran.html

[16] Запуск RStudio в облаке: http://www.magesblog.com/2014/09/running-rstudio-via-docker-in-cloud.html

[17] Вывод нескольких переменных на линейной диаграмме в ggplot2: http://java.dzone.com/articles/r-ggplot---plotting-multiple

[18] Интервью с Diogo Ferreira: http://machinelearningmastery.com/discover-the-methodology-and-mindset-of-a-kaggle-master-an-interview-with-diogo-ferreira/

[19] Простая модель для Kaggle «Bike Sharing Demand»: http://brandonharris.io/kaggle-bike-sharing/

[20] Стартовал онлайн-курс «Mining Massive Datasets»: http://igorsubbotin.blogspot.ru/2014/09/coursera-stanford-university-mining-started.html

[21] Книга «The Field Guide to Data Science»: http://www.boozallen.com/insights/2013/11/data-science-field-guide

[22] Анонс книги «Practical Data Science Cookbook»: http://datacommunitydc.org/blog/2014/10/announcing-publication-practical-data-science-cookbook/

[23] Список для чтения (октябрь): http://davegiles.blogspot.ru/2014/10/october-reading.html

[24] Книга «Getting Started with Impala»: http://blog.cloudera.com/blog/2014/09/heres-your-getting-started-with-impala-book/

[25] Martin Maechler о практике хорошего кода на R: http://igorsubbotin.blogspot.ru/2014/10/martin-maechler-invited-talk-at-user-2014-good-practices-in-r-programming.html

[26] Материалы со встречи «Новинки PostgreSQL 9.4 и кое-что ещё»: http://igorsubbotin.blogspot.ru/2014/09/meetup-postgresql-94-video.html

[27] Nando de Freitas о деревьях принятия решений: http://igorsubbotin.blogspot.ru/2014/10/ubc-decision-trees.html

[28] Jürgen Schmidhuber о Deep Learning: http://igorsubbotin.blogspot.ru/2014/10/schmidhuber-rnn.html

[29] Использование Pinot для аналитики в режиме реального времени: http://engineering.linkedin.com/analytics/real-time-analytics-massive-scale-pinot

[30] Результаты тестов производительности NoSQL-хранилищ: http://java.dzone.com/articles/dissecting-nosql-benchmark

[31] Масштабируемые деревья принятия рещений в Apache Spark: http://databricks.com/blog/2014/09/29/scalable-decision-trees-in-mllib.html

[32] Анонс бета-версии ForestDB: http://blog.couchbase.com/next-generation-storage-engine-couchbase-server-and-couchbase-lite-forestdb-now-available-beta

[33] Что такое Apache Storm: http://cloudvane.com/2014/09/30/apache-storm-is-now-a-top-level-hadoop-project-but-what-is-it/

[34] Еженедельный дайджест от DataScienceCentral: http://www.datasciencecentral.com/profiles/blogs/weekly-digest-october-6

[35] Лучшие материалы Niut Blanche (сентябрь): http://nuit-blanche.blogspot.ru/2014/10/nuit-blanche-in-review-september-2014.html

[36] Еженедельный обзор Hadoop Weekly №89 (28 сентября): http://www.hadoopweekly.com/Hadoop-Weekly-89.html

[37] Еженедельный обзор Hadoop Weekly №88 (21 сентября): http://www.hadoopweekly.com/Hadoop-Weekly-88.html

[38] Наиболее интересные материалы от Freakonometrics №170: http://freakonometrics.hypotheses.org/17205

[39] Наиболее интересные материалы от Freakonometrics №169: http://freakonometrics.hypotheses.org/17132

[40] Наиболее интересные материалы от Freakonometrics №168: http://freakonometrics.hypotheses.org/17043

[41] Наиболее интересные материалы по High Scalability: http://highscalability.com/blog/2014/10/3/stuff-the-internet-says-on-scalability-for-october-3rd-2014.html

[42] Обзор наиболее интересных материалов по анализу данных и машинному обучению №15 (22 — 28 сентября 2014): http://habrahabr.ru/post/238431/

[43] Источник: http://habrahabr.ru/post/239247/