Обзор наиболее интересных материалов по анализу данных и машинному обучению №14 (15 — 21 сентября 2014)

в 16:42, , рубрики: big data, data mining, data science, data science digest, machine learning

Обзор наиболее интересных материалов по анализу данных и машинному обучению №14 (15 — 21 сентября 2014)
Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения. Хочу также обратить внимание, что я выпустил первый дайджест по теме высокой производительности и Data Enginering: Обзор наиболее интересных материалов по высокой производительности (15 — 21 сентября 2014). Думаю, что кого-то он тоже может заинтересовать.

Общее

Соревнования по машинному обучению

Онлайн-курсы и обучающие материалы

Литература

Теория и алгоритмы машинного обучения, примеры кода

Видеоматериалы

  • EN Видеолекции Andrew Ng о Deep Learning
    Andrew Ng из Stanford University выступил на конференции «2014 Robotics: Science and Systems Conference» с интересным докладом о Deep Learning.
  • RU Видеолекции Moscow Data Science. September 2014 Meetup
    5 сентября посетил достаточно интересный meetup под названием Moscow Data Science — «September 2014 Meetup», организованный компанией Mail.ru. По ссылке можно будет посмотреть видео с данной встречи, я для удобства разметил время начала и длительность выступления каждого участника.

Data engineering

  • EN Кто и как использует Hadoop
    Интересная статья о текущем состоянии дел в экосистеме Hadoop: кто и как её пользуется, а также о преспективах развития.
  • RU Ближайшие встречи по Data Science в Москве
    В ближайшее время намечается сразу несколько интересных митапов, поэтому я решил опубликовать небольшой список ближайших интересных встреч по теме анализа данных и высокой производительности в Москве.
  • EN 10 способов работы с Hadoop через SQL-запросы
    10 инструментов и способов для работы с Hadoop через SQL-запросы и небольшое описание каждого.
  • RU HABR Приглашаем на HadoopKitchen
    Объявление о встрече, посвященной Hadoop, которая состоится в офисе Mail.ru. Я тоже собираюсь посетить данное мероприятие.
  • EN Видеолекции Введение в HBase
    Статья, содержащая видео и поясняющий материал по теме HBase — хранилища данных из экосистемы Hadoop, а также рассказывающая о ситуациях, когда стоит применять данное решение и когда не стоит.
  • EN Анонс Apache Spark 1.1
    Анонс новой версии Apache Spark 1.1 и описание основных нововведений.
  • EN Потоковая обработка данных в Apache Spark 1.1
    Статья о новых возможностях потоковой обработки данных в Apache Spark 1.1 и о вариантах использования данной функциональности.
  • EN R Python Статистические вычисления в Apache Spark 1.1
    Описание расширенных возможностей статистических вычислений в Apache Spark 1.1.

Обзоры

Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №12 (1 — 8 сентября 2014)

P.S. Думаю, что многим хотелось бы видеть больше материал по тематике на русском языке, так что если кто-то может посоветовать таковые, то я буду очень признателен и добавлю их в свой список ресурсов за которыми слежу.

Автор: moat

Источник

* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js