Рубрика «отбор признаков»

Обзор методов отбора признаков - 1

Правильный отбор признаков для анализа данных позволяет:

  • повысить качество моделей машинного обучения с учителем и без, 
  • уменьшить время обучения и снизить требуемые вычислительные мощности,
  • а в случае входных данных высокой размерности позволяет ослабить «проклятие размерности».

Оценка важности признаков необходима для интерпретации результатов модели.

Мы рассмотрим существующие методы отбора признаков для задач обучения с учителем и без. Каждый метод проиллюстрирован open source-реализацией на Python, чтобы вы могли быстро протестировать предложенные алгоритмы. Однако это не полная подборка: за последние 20 лет было создано множество алгоритмов, и здесь вы найдёте самые основные из них. Для более глубокого исследования ознакомьтесь с этим обзором.
Читать полностью »

В научном исследовании, как и в любом другом виде осмысленных человеческих занятий, важен план действий. Есть люди, которые занимаются чистой наукой, но это совсем другая история. Когда речь идет о приложении, то есть об использовании научного метода в повседневной жизни, нужна четкая последовательность действий, в соответствии с которой будет работать конвейер. В Genotek занимаются прикладными генетическими исследованиями, анализируют и интерпретируют данные, записанные в ДНК. Наш научный отдел опубликовал статью о том, как выбрать нужные гены и почему результатам анализа этих генов можно верить. Приводим краткое изложение публикации.

image
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js