Рубрика «data mining» - 84

Обзор наиболее интересных материалов по анализу данных и машинному обучению №7 (28 июля — 4 августа 2014)

2014-08-04 в 7:10, admin, рубрики: big data, data mining, data science, data science digest, machine learning

Обзор наиболее интересных материалов по анализу данных и машинному обучению №7 (28 июля — 4 августа 2014)
Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения. В данном обзоре есть несколько статей, которые будут интересны новичкам. Есть несколько любопытных видеолекций по тематике Data Science. В текущем выпуске как обычно много статей по машинному обучению и анализу данных с примерами кода на языка программирования R и Python. В обзоре также могут заинтересовать несколько обзоров книг по теме анализа данных.

Читать полностью »

Трекинг аккумулятора в ноутбуке для личностной аналитики

2014-07-28 в 15:28, admin, рубрики: data mining, Железо, личностная аналитика

Астрофизик Джеймс Дэвенпорт (James Davenport) в свободное время увлекается разными проектами по анализу данных.

Год назад он опубликовал статистику по состоянию аккумуляторов ноутбуков MacBook Air 2013, MacBook Air 2012 и MacBook Pro 2009, с которыми работал за последние два года. Ежеминутный съём показаний помогает произвести программа CoconutBattery.

Сейчас пришло время обновить статистику.

Трекинг аккумулятора в ноутбуке для личностной аналитики

Джеймс с удовлетворением отмечает, что аккумулятор MacBook Air 2013 держится гораздо лучше, чем в MacBook Air 2012. Но речь совсем не о том.
Читать полностью »

Обзор наиболее интересных материалов по анализу данных и машинному обучению №6 (21 — 28 июля 2014)

2014-07-28 в 9:10, admin, рубрики: big data, data mining, data science, data science digest, machine learning

В очередном выпуске обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения некоторое количество статей посвящено практическому применению различных видов регрессии. Есть интересная серия статей о применении машинного обучения в трейдинге. Как обычно много материалов посвящено алгоритмам машинного обучения (в том числе нейронным сетям). Есть несколько любопытных видеолекций, а также много статей про практическое применение языка R при анализе данных и машинном обучении.
Читать полностью »

Эксперимент в Яндексе. Как идентифицировать взломщика с помощью машинного обучения

2014-07-21 в 13:00, admin, рубрики: data mining, Блог компании Яндекс, информационная безопасность, машинное обучение, Яндекс.Почта

На серверах Яндекса хранится много нужной и важной для людей информации, поэтому нам необходимо надёжно защищать данные наших пользователей. В этой статье мы хотим рассказать вам о наших исследованиях, в которых мы изучаем, как отличить владельца аккаунта от злоумышленника. Причем даже тогда, когда оба имеют логин и пароль от учетной записи. Мы разработали метод, который основан на анализе поведенческих характеристик пользователей. Он использует машинное обучение и позволяет отличать поведение настоящего владельца аккаунта от злоумышленника по ряду характеристик.

Такой анализ базируется на математической статистике и изучении данных об использовании сервисов Яндекса. Поведенческих характеристик недостаточно, чтобы однозначно идентифицировать пользователя и заменить тем самым использование пароля, но это позволяет определить взлом уже после авторизации. Таким образом, украденный пароль от почты не даст прикидываться её настоящим владельцем. Это по-настоящему важный шаг, который позволит по-другому взглянуть на системы безопасности в интернете и решить такие сложные задачи, как определение настоящего владельца аккаунта, а также момента и характера взлома.
Читать полностью »

Обзор наиболее интересных материалов по анализу данных и машинному обучению №5 (7 — 21 июля 2014)

2014-07-21 в 9:47, admin, рубрики: big data, data mining, data science, data science digest, machine learning, искусственный интеллект

Представляю очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения (в том числе Deep Learning). Как всегда есть материалы по алгоритмам машинного обучения. Несколько практических статей по популярному пакету для машинного обучения Scikit-Learn для Python. Есть статьи, посвященные практическому применению языка R. Некоторое количество материалов посвящено теме Data Engineering. Присутствуют интересные статьи про популярные проекты 'Google Brain' и 'Project Adam'.
Читать полностью »

Некоторые методы поиска нечетких дубликатов видео

2014-07-21 в 0:47, admin, рубрики: data mining, gist, lhs, Алгоритмы, видео, обработка изображений, сравнение видео, сравнение изображений, хэширование

Существует достаточно широкий круг задач, где требуется анализ, аудио-визуальных моделей реальности. Это относится и к статическим изображениям, и к видео.

Ниже приведен не большой обзор некоторых существующих методов поиска и идентификации нечетких дубликатов видео,
рассмотрены их преимущества и недостатки. На основе структурного представления видео построена комбинация методов.
Обзор совсем не большой, за подробностями, лучше обращаться к первоисточникам.

Читать полностью »

Пишем простую систему рекомендаций на примере Хабра

2014-07-18 в 5:16, admin, рубрики: data mining, data science, filtering, machine learning, рекомендательная система, Статистика в IT, Хабрахабр API

Пишем простую систему рекомендаций на примере Хабра
Сегодня мы поговорим о рекомендательных системах, а точнее о самой простой форме коллаборативной фильтрации. В программе передач: что такое рекомендательная система, на чем основана, каков математический аппарат и как её можно воплотить в код. В качестве бонуса предоставим результаты в виде простого сервиса.

Читать полностью »

Вероятностные модели: LDA, часть 2

2014-07-16 в 15:52, admin, рубрики: data mining, байесовские сети, Блог компании Surfingbird, искусственный интеллект, классификация, кластеризация, математика, математическое моделирование, теория вероятностей

Продолжаем разговор. В прошлый раз мы сделали первый шаг на переходе от наивного байесовского классификатора к LDA: убрали из наивного байеса необходимость в разметке тренировочного набора, сделав из него модель кластеризации, которую можно обучать ЕМ-алгоритмом. Сегодня у меня уже не осталось отговорок – придётся рассказывать про саму модель LDA и показывать, как она работает. Когда-то мы уже говорили об LDA в этом блоге, но тогда рассказ был совсем короткий и без весьма существенных подробностей. Надеюсь, что в этот раз удастся рассказать больше и понятнее.
Вероятностные модели: LDA, часть 2
Читать полностью »

Ищем мелодию по фрагменту

2014-07-15 в 11:54, admin, рубрики: data mining, datamining, информационный поиск, Работа со звуком

Приветствую, уважаемые читатели !
В этой статье хочу рассказать, как я искал музыкальное произведение по его отрывку.
Итак, поехали!
Задача передо мной стоит следующая: есть отрывок музыкального произведения, есть база музыкальных произведений, и необходимо найти, какому из имеющихся музыкальных произведений принадлежит данный отрывок.
Кому интересно, читайте под харбокатом!
Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «data mining» - 84

Обзор наиболее интересных материалов по анализу данных и машинному обучению №7 (28 июля — 4 августа 2014)

Похожие поисковые запросы в hh.ru

Трекинг аккумулятора в ноутбуке для личностной аналитики

Обзор наиболее интересных материалов по анализу данных и машинному обучению №6 (21 — 28 июля 2014)

Эксперимент в Яндексе. Как идентифицировать взломщика с помощью машинного обучения

Обзор наиболее интересных материалов по анализу данных и машинному обучению №5 (7 — 21 июля 2014)

Некоторые методы поиска нечетких дубликатов видео

Пишем простую систему рекомендаций на примере Хабра

Вероятностные модели: LDA, часть 2

Ищем мелодию по фрагменту