- PVSM.RU - https://www.pvsm.ru -

Обзор наиболее интересных материалов по анализу данных и машинному обучению №9 (11 — 18 августа 2014)

Обзор наиболее интересных материалов по анализу данных и машинному обучению №9 (11 — 18 августа 2014)
Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения. В данном выпуске достаточно много интересных видеоматериалов. Некоторые количество материалов посвящено теме Data Engineering. В данном выпуске достаточно много практических примеров кода на языках программирования R и Python. Как обычно много материалов посвящено алгоритмам машинного обучения.

Материалы по анализу данных и машинному обучению

  • EN Визуализация с помощью фреймворка D3 [1]
    Небольшая статья про визуализацию данных с помощью популярного JS-фреймворка D3.
  • EN Python Свой собственный поиск по изображениям [2]
    Автор рассказывает свою собственную разработку на Python, которая позволяет упростить работу с изображениями на локальном компьютере.
  • EN Data engineering Видеолекции Alex Smola рассказывает про масштабируемое машинное обучение [3]
    Это еще одна лекция из серии лекций, которые были представлены на летней школе машинного обучения Machine Learning Summer School (MLSS ’14) в Питтсбурге. В данной видеолекции известный специалист в области компьютерных наук и в том числе в области машинного обучения Alex Smola (исследователь в Google, профессор университета Карнеги-Меллона) затрагивает очень интересную и важную тему масштабирования в машинном обучении.
  • EN Будущее потребления контента глазами Yahoo [4]
    Интересная о статья о планах компании Yahoo на будущее в области искусственного интеллекта и машинного обучения.
  • EN R 21 инструмент навигации в R [5]
    Полезный набор из 21 инструмента навигации для языка программирования R, который будет полезен каждому.
  • EN Развитие технологий искусственного интеллекта в Facebook завистит от этого человека [6]
    Интересная статья о Yann LeCunn — одном из самых известных специалистов в области анализа данных и машинного обучения, который является одним из основоположников Deep Learning и сейчас занимается развитием технологий машинного обучения в компании Facebook.
  • EN Список ведущих исследователей в области анализа данных [7]
    Любопытный список ведущих исследователей и ученых в области анализа данных и Data Science от популярного портала KDnuggets, основанный на обработке результатов данных с Microsoft Academic Search.
  • RU R Выбор подмножества записей из большого файла [8]
    При работе с большим файлом в языке программирования R чаще гораздо удобнее работать с небольшим случайным подмножеством записей из всего набора данных. В данной короткой статье представлен пример кода для извлечения подмножества записей из файла.
  • EN Python Apache Spark совместно с IPython [9]
    Небольшая статья с блога компании Cloudera об интеграции Apache Spark и IPython.
  • EN Python Библиотека машинного обучения PyStruct [10]
    Библиотека для машинного обучения, а именно Structured Learning с использованием языка программирования Python. Библиотека создана с ориентировкой на схожесть дизайна с популярной библиотекой машинного обучения scikit-learn.
  • EN Быстрое обучение с Vowpal Wabbit [11]
    Небольшая статья от Microsoft Technet Machine Learning Blog о системе машинного обучения с открытым исходным кодом Vowpal Rabbit, которую развивает Microsoft Research и которая имеет возможность интеграции с облачной платформой машинного обучения Microsoft Azure ML.
  • EN Видеолекции Лучшие видео первой половины года по теме анализа данных [12]В данной cтатье можно найти список лучших видеоматериалов первого полугодия 2014, которые были на портале IBM Big Data & Analytics Hub.
  • EN Библиотека машинного обучения QuickML [13]
    Интересная библиотека для машинного обучения с использованием языка программирования Java.
  • EN SAS в облаке [14]
    В данной статье достаточно кратко рассказывается о работе SAS в облаке AWS от компании Amazon, а также об интеграции платформы SAS с некоторыми AWS-сервисами.
  • EN 38 статей по анализу данных, которые должен прочитать каждый [15]
    Отличный список из 38 статей по анализу данных, которые будут интересны тому, кто интересуется данной темой.
  • EN R Как сделать наклонные подписи на осях графика [16]
    Как сделать наклонные подписи на осях графика — вопрос, который часто возникает при использовании стандартных средств визуализации в языке программирования R. В данной статье есть небольшой пример кода, который позволяет делать подписи к осях под различными углами наклона.
  • EN Для новичков Как улучшить свои навыки в машинном обучении [17]
    Хорошая небольшая статья, написанная простым языком, о том как улучшить свои навыки машинного обучения.
  • EN Сравнение программного обеспечения для анализа данных [18]
    Сравнительная таблица программных продуктов (R, MATLAB, SAS, STATA и SPSS) на предмет встроенной поддержки различных инструментов статистического анализа в них.
  • EN Data engineering 18 основных инструментов семейства Hadoop [19]
    Количество новых инструментов вокруг Hadoop стремительно растет и следить за всеми новинками в данном направлении достаточно сложно. В данный статье можно найти список из 18 основных с кратким описанием каждого.
  • EN R Библиотека semPlot для языка R [20]
    Небольшой пример использования библиотеки semPlot, которая предназначена для визуализации данных Structural equation modeling (SEM), что позволяет исследовать различные сложные взаимосвязи между переменными.
  • EN R Дилемма заключённого: пример на языке R [21]
    Интересный пример реализации фундаментальной проблемы из теории игр «Дилемма заключенного» с использованием языка программирования R.
  • EN Для новичков Python Немного базовой статистики [22]
    Немного примеров простых операций из статистики с примерами на языке программирования Python.
  • RU Python Трансформация данных из SAS в SQLite [23]
    Полезный пример кода на языке программирования Python для трансформации данных из формата SAS в формат SQLite.
  • EN R GrapherR: GUI-система визуализации для R [24]
    GrapherR — библиотека для языка программирования R, которая позволяет визуализировать различные данные, но что очень важно — данная библиотека имеет свой GUI.
  • EN Теория Сверточные нейронные сети [25]
    Публикация посвящена теме сверточных нейронных сетей, с достаточно глубоким погружением в материал и теорию по данной интересной и популярной теме.
  • EN Для новичков Так вы хотели попробовать Deep Learning? [26]
    Статья посвящена популярной теме Deep Learning, а скорее является набором полезных и интересных ресурсов по данной тематике, которые позволят лучше разобраться в теме Deep Learning.
  • EN Краткое описание OpenML [27]
    Небольшая статья про набирающий популярность портал по машинному обучению OpenML, на котором в том числе можно поучаствовать в соревнованиях по машинному обучению.
  • EN Для новичков Python Исследовательский анализ данных с помощью Python и Pandas [28]
    Очень любопытная статья про исследовательский анализ данных с использованием Python и Pandas, с примерами кода на основе популярного датасета «Титаник» с Kaggle.
  • EN Data engineering Видеолекции Построение инфраструктуры для машинного обучения [29]
    В данном интересном видео с очень легким стилем изложения Джош Виллис (Senior Director of Data Science в Cloudera) расскажет над чем работает в Cloudera в данный момент и про использование машинного обучения на живой среде с большим количеством данных или Industrial Machine Learning, что зачастую бывает гораздо сложнее чем академическое машинное обучение.
  • EN Data engineering Новое в CDH 5.1: Кэширование чтения в HDFS [30]
    Данная статья расскажет о новой функциональности в CDH 5.1: кэширование чтения в HDFS, которая потенциально позоволит значительно увеличить скорость чтения в системах, которые используют HDFS.
  • EN R Нелинейная классификация в R [31]
    Восемь видов нелинейной классификации с примерами на языке программирования R.

Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №8 (4 — 11 августа 2014) [32]

Автор: moat

Источник [33]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/data-mining/67733

Ссылки в тексте:

[1] Визуализация с помощью фреймворка D3: http://java.dzone.com/articles/how-d3-can-help-you-build

[2] Свой собственный поиск по изображениям: http://pythonformachinelearning.wordpress.com/2014/08/15/your-very-own-personalised-image-search-using-python/

[3] Alex Smola рассказывает про масштабируемое машинное обучение: http://igorsubbotin.blogspot.ru/2014/08/alex-smola-on-scalable-machine-learning.html

[4] Будущее потребления контента глазами Yahoo: http://gigaom.com/2014/08/12/the-future-of-content-consumption-through-the-eyes-of-yahoo-labs/

[5] 21 инструмент навигации в R: http://www.statsblogs.com/2014/08/17/21-r-navigation-tools/

[6] Развитие технологий искусственного интеллекта в Facebook завистит от этого человека: http://www.wired.com/2014/08/deep-learning-yann-lecun/

[7] Список ведущих исследователей в области анализа данных: http://www.kdnuggets.com/2014/08/top-research-leaders-data-mining-data-science.html

[8] Выбор подмножества записей из большого файла: http://igorsubbotin.blogspot.ru/2014/08/snippet-extracting-subsample-from-large.html

[9] Apache Spark совместно с IPython: http://blog.cloudera.com/blog/2014/08/how-to-use-ipython-notebook-with-apache-spark/

[10] Библиотека машинного обучения PyStruct: http://pystruct.github.io/

[11] Быстрое обучение с Vowpal Wabbit: http://blogs.technet.com/b/machinelearning/archive/2014/08/13/vowpal-wabbit-for-fast-learning.aspx

[12] Лучшие видео первой половины года по теме анализа данных: http://igorsubbotin.blogspot.ru/2014/08/top-videos-big-data-and-analytics-first-half-2014.html

[13] Библиотека машинного обучения QuickML: http://quickml.org/

[14] SAS в облаке: http://inside-bigdata.com/2014/08/13/sas-drives-analytics-cloud-amazon-web-services/

[15] 38 статей по анализу данных, которые должен прочитать каждый: http://www.datasciencecentral.com/profiles/blogs/30-seminal-articles-every-data-scientist-should-read

[16] Как сделать наклонные подписи на осях графика: http://igorsubbotin.blogspot.ru/2014/08/rotated-axis-labels-in-r-plots.html

[17] Как улучшить свои навыки в машинном обучении: http://machinelearningmastery.com/how-to-get-better-at-machine-learning/

[18] Сравнение программного обеспечения для анализа данных: http://stanfordphd.com/Statistical_Software.html

[19] 18 основных инструментов семейства Hadoop: http://igorsubbotin.blogspot.ru/2014/08/18-essential-hadoop-tools.html

[20] Библиотека semPlot для языка R: http://www.r-bloggers.com/ploting-sems-in-r-using-semplot/

[21] Дилемма заключённого: пример на языке R: http://www.r-bloggers.com/to-cooperate-of-defect-besides-of-coding-prisoners-dilemma-a-game-theory-example-in-r/

[22] Немного базовой статистики: http://python.dzone.com/articles/some-basic-statistics

[23] Трансформация данных из SAS в SQLite: http://igorsubbotin.blogspot.ru/2014/08/sas-to-sqlite-on-python.html

[24] GrapherR: GUI-система визуализации для R: http://www.statsblogs.com/2014/08/12/grapher-a-gui-for-base-graphics-in-r/

[25] Сверточные нейронные сети: http://nuit-blanche.blogspot.ru/2014/08/deep-learning-and-convolutional-kernel.html

[26] Так вы хотели попробовать Deep Learning?: http://snippyhollow.github.io/blog/2014/08/09/so-you-wanna-try-deep-learning/

[27] Краткое описание OpenML: http://www.kdnuggets.com/2014/08/openml-share-discover-do-machine-learning.html

[28] Исследовательский анализ данных с помощью Python и Pandas: http://www.analyticsvidhya.com/blog/2014/08/baby-steps-python-performing-exploratory-analysis-python/

[29] Построение инфраструктуры для машинного обучения: http://igorsubbotin.blogspot.ru/2014/08/josh-wills-on-industrial-machine-learning.html

[30] Новое в CDH 5.1: Кэширование чтения в HDFS: http://blog.cloudera.com/blog/2014/08/new-in-cdh-5-1-hdfs-read-caching/

[31] Нелинейная классификация в R: http://machinelearningmastery.com/non-linear-classification-in-r/

[32] Обзор наиболее интересных материалов по анализу данных и машинному обучению №8 (4 — 11 августа 2014): http://habrahabr.ru/post/232879/

[33] Источник: http://habrahabr.ru/post/233681/