Рубрика «искусственный интеллект» - 229

Классификация русского текста с помощью библиотеки Natural на NodeJS

2013-09-14 в 7:42, admin, рубрики: node.js, искусственный интеллект, метки: node.js

Я никого не удивлю, если скажу, что современный человек, а, в особенности, программист, каждый день получает огромное информации. К примеру, мой RSS-клиент выдает мне в неделю около 500 статей. И, конечно же, это далеко не единственный источник информации.

Я задумался над тем, чтобы сделать для себя RSS-клиент с обучаемым фильтром статей на NodeJS. В принципе, под ноду есть готовые RSS ридеры, есть готовые нейронные сети с классификаторами, так что написать какой-то прототип мне показалось не особенно сложной задачей.

Я решил начать с тестирования подвернувшихся под руку нейронных сетей. Я взял небольшое количество входных данных. Позитивные данные я скопировал из статей по nodejs с хабра. Негативные данные я нашел на «ленте.ру». Задача классификатора заключалась в том, чтобы отсортировать статьи о программировании и nodejs от обычных, безынтересных для моего развития, новостей.

Результаты работы с Brain и Fann я показывать не хочу — я не считаю, что я обладаю достаточной экспертизой для того, чтобы судить о них. Скажу только что из коробки они меня не устроили совершенно — на моих входных данных они не давали адекватного количества правильных ответов. А вот библиотека Natural меня очень впечатлила.

Далее я покажу как я обучал классификатор, проверял его работу и заставлял понимать русский язык.

Читать полностью »

Применение локальных бинарных шаблонов к решению задачи распознавания лиц

2013-09-13 в 11:37, admin, рубрики: eLBP, LBP, идентификация личности, искусственный интеллект, обработка изображений, распознавание лиц, метки: eLBP, LBP, идентификация личности, распознавание лиц

Всем добрый день!

В статье уже был кратко рассмотрен оператор LBP. Хотелось бы остановиться на данном вопросе несколько подробнее, а также рассмотреть применение LBP к решению задачи распознавания лиц.

1. Введение

Как правило, система распознавания лиц представляет собой программно-аппаратный комплекс для автоматической верификации или идентификации личности по цифровому изображению (фотографии или кадру видеопоследовательности). Задача распознавания лиц решается при разработке систем контроля и управления доступом, систем пограничного контроля, проведении оперативно-розыскных мероприятий и т.д.
Читать полностью »

«Живой» искусственный разум, человек и проблемы AI

2013-09-10 в 10:21, admin, рубрики: Биотехнологии, будущее, будущее здесь, искусственный интеллект, общество и IT, метки: будущее, искусственный интеллект

Отличие искусственного и человеческого разума

Многие ученные прошлого делали свои гениальные открытия не в ходе вычислений или многочисленных экспериментов (хотя, конечно же, эксперименты и вычисления отвергать нельзя), а благодаря мгновенному озарению, будь то яблоко Ньютона или таблица химических элементов Менделеева, увиденная им во сне. Нильс Бор который в своем сне сидел на солнце и наблюдал за вращающимися планетами вокруг себя открыл планетарную модель атома, Леонардо да Винчи, который решил создать летательный аппарат по образу и подобию птицы и многие другие.

Но что самое главное — мгновенные озарения характерны не только для великих, но и для каждого из нас. Иногда у нас появляются проблемы связанные с нашей работой, хобби, семьей. И как мы ищем ответ на проблемы? Мы мыслим, воображаем, представляем, но часто ответ находится спонтанно, мы можем подумать вообще о чем-либо, не касающемся нашей проблемы, и найти решение оной.
Читать полностью »

Создание своего домашнего игрового искусственного интеллекта

2013-09-10 в 8:34, admin, рубрики: game development, искусственный интеллект

Детские мечты или Pack-Man своими руками

Каждый в своей жизни делал свой велосипед. В оправдание желания его сделать, можно только сказать, что если бы люди периодически это не делали, то многих вещей мир бы просто не увидел.

Свою игру, а точнее игровой искусственный интеллект (ИИ) сделать желание было очень давно. Не буду кривить душой: сначала банально не хватало знаний, потом как ни странно времени. У меня было несколько недель относительно свободного времени, что бы реализовать мечту своего детства.

Расскажу что получилось, а также опишу путь, по которому шел, и наблюдения, которые по пути сделал. Оговорюсь сразу, что буду описывать не код, а соображения, мысли, и проблемы с которыми столкнулся в процессе реализации мечты.

Создание своего домашнего игрового искусственного интеллекта
Читать полностью »

Искусственный интеллект и почему мой компьютер меня не понимает?

2013-09-09 в 13:21, admin, рубрики: BigData, nlp, siri, анафора, искусственный интеллект, поисковые системы

Искусственный интеллект и почему мой компьютер меня не понимает?

Гектор Левек^wiki утверждает, что его компьютер тупой. И ваш тоже. Siri и голосовой поиск Google умеют понимать заготовленные предложения. Например «Какие фильмы будут показывать неподалёку в 7 часов?» Но что насчёт вопроса «Может ли аллигатор пробежать стометровку с барьерами?» Такой вопрос никто раньше не задавал. Но любой взрослый может найти ответ на него (Нет. Аллигаторы не могут участвовать в беге с барьерами). Но если вы попытаетесь ввести этот вопрос в Google, то получите тонны информации о спортивной команде по лёгкой атлетике Florida Gators. Другие поисковые системы, такие как Wolfram Alpha, тоже не способны найти ответ на поставленный вопрос. Watson, компьютерная система выигравшая викторину «Jeopardy!», вряд ли покажет себя лучше.
Читать полностью »

Алгоритм Self-Organizing Incremental Neural Network (SOINN)

2013-09-08 в 21:18, admin, рубрики: machine learning, SOINN, Алгоритмы, искусственный интеллект, машинное обучение, обучение без учителя, метки: machine learning, SOINN, машинное обучение, обучение без учителя

Введение

Одной из задач обучения без учителя является задача нахождения топологической структуры, которая наиболее точно отражает топологию распределения входных данных. Существует несколько подходов решения этой задачи. Например, алгоритм Самоорганизующихся Карт Кохонена является методом проецирования многомерного пространства в пространство с более низкой размерностью (как правило, двумерное) с предопределенной структурой. В связи с понижением размерности исходной задачи, и предопределенной структурой сети, возникают дефекты проецирование, анализ которых является сложной задачей. В качестве одной из альтернатив данному подходу, сочетание конкурентного обучения Хебба и нейронного газа является более эффективным в построении топологической структуры. Но практическому применению данного подхода препятствует ряд проблем: необходимы априорные знания о необходимом размере сети и сложность применения методов адаптации скорости обучения к данной сети, излишняя адаптация приводит к снижению эффективности при обучении новым данным, а слишком медленная скорость адаптации вызывает высокую чувствительность к зашумленным данным.

Для задач онлайн обучения или длительного обучения, перечисленные выше методы не подходят. Фундаментальной проблемой для таких задач — это как система может приспособиться к новой информации без повреждения или уничтожения уже известной.

В данной статье рассматривается алгоритм SOINN, который частично решает озвученные выше проблемы.
Читать полностью »

Система персонализации News360: ранжирование кластеров информации

2013-08-28 в 9:00, admin, рубрики: data mining, искусственный интеллект, кластерный анализ, ранжирование, метки: кластерный анализ, ранжирование

Когда система рекомендаций работает с большим количеством контента, основной задачей становится не фильтрация этого контента, а его ранжирование. Если говорить о новостях — каждый день выходят сотни тысяч статей, тысячи из которых могут затрагивать интересы каждого человека, читающего новости. Но в основном пользователи не читают больше 5-10 статей в день (по данным News360). Какие статьи показать первыми?

Ответ на этот вопрос в News360 ищут уже третий год. Мы нашли уже много разных ответов, но в этом году решили отказаться от концепции, которая была основной на протяжении всех предыдущих лет.

В статье простыми словами постараюсь рассказать о том, почему в News360 сначала несколько лет работали над реализацией и развитием системы кластеризации статей по событиям и ранжирования событий, а затем выбросили этот подход и решили реализовать другой. А также немного о том, как работает News360, что под капотом и где об этом почитать.

News360 - Everything you want to read

Читать полностью »

Способы представления словарей для автоматической обработки текстов

2013-08-26 в 6:21, admin, рубрики: Алгоритмы, искусственный интеллект, Компьютерная лингвистика, конечные автоматы, морфологический анализ, метки: Компьютерная лингвистика, конечные автоматы, морфологический анализ

Автоматический анализ текстов практически всегда связан с работой со словарями. Они используются для морфологического анализа, выделения персон (нужны словари личных имен и фамилий) и организаций, а также других объектов.

В общем виде словарь — множество записей вида {строка, данные ассоциированные с этой строкой}.

Например, для морфологического анализа словарь состоит из троек {словоформа, нормальная форма, морфологические характеристики}. При анализе слова «мыла» из предложения «мама мыла раму» надо уметь получать следующие варианты анализа:

Нормальная форма	Характеристики
МЫЛО	S (существительное), РОД (родительный падеж), ЕД (единственное число), СРЕД (средний род), НЕОД (неодушевленность)
МЫЛО	S (существительное), ИМ (именительный падеж), МН (множественное число), СРЕД (средний род), НЕОД (неодушевленность)
МЫЛО	S (существительное), ВИН (винительный падеж), МН (множественное число), СРЕД (средний род), НЕОД (неодушевленность)
МЫТЬ	V (глагол), ПРОШ (прошедшее время), ЕД (единственное число), ИЗЪЯВ (изъявительное наклонение), ЖЕН (женский род), НЕСОВ (несовершенный вид)

Читать полностью »

Псевдолемматизация, композиты и прочие странные словечки

2013-08-21 в 9:46, admin, рубрики: Блог компании ABBYY, Блог компании Mail.Ru Group, искусственный интеллект, Компьютерная лингвистика, морфология, метки: Компьютерная лингвистика, морфология

Псевдолемматизация, композиты и прочие странные словечки

Содержание цикла статей про морфологию

• Морфология и компьютерная лингвистика для самых маленьких
• Роль морфологии в компьютерной лингвистике
• Морфология. Задачи и подходы к их решению
• Псевдолемматизация, композиты и прочие странные словечки

Не все задачи успели мы с вами обозреть в предыдущем посте, поэтому продолжать будем в этом.

Часто случается, что в интернете появляется какой-нибудь неологизм. Например, «затроллить». Слово «тролль» в словаре есть, но «затролля» уже нет, а, как мы выяснили ранее, приставка при разборе не отделяется от корня, так что мы понятия не имеем, что это за «затроллить» и как его изменять. Чтобы проанализировать это слово, нам придётся воспользоваться псевдолемматизацией. Для этого мы снова пользуемся так называемым обратным деревом окончаний (записанных справа налево).
Читать полностью »

Мой опыт работы с SOINN

2013-08-20 в 6:41, admin, рубрики: SOINN, искусственный интеллект, нейронные сети, метки: SOINN, искусственный интеллект, нейронные сети

Занимаясь алгоритмическим трейдингом, я довольно продолжительное время строил торговых роботов на основе классических индикаторов и методов технического анализа. Попутно, почитывая различные статьи, я натыкался на упоминания о нейронных сетях, которые с той или иной степенью успешности трейдеры применяют для торговли. Эта тема меня увлекла.Читать полностью »

Информация

Статьи из архивов

Обсуждаемое

Рекомендуем

Рубрика «искусственный интеллект» - 229

Классификация русского текста с помощью библиотеки Natural на NodeJS

Применение локальных бинарных шаблонов к решению задачи распознавания лиц

1. Введение

«Живой» искусственный разум, человек и проблемы AI

Отличие искусственного и человеческого разума

Создание своего домашнего игрового искусственного интеллекта

Детские мечты или Pack-Man своими руками

Искусственный интеллект и почему мой компьютер меня не понимает?

Алгоритм Self-Organizing Incremental Neural Network (SOINN)

Введение

Система персонализации News360: ранжирование кластеров информации

Способы представления словарей для автоматической обработки текстов

Псевдолемматизация, композиты и прочие странные словечки

Мой опыт работы с SOINN

Архив

Информация

Статьи из архивов

Обсуждаемое

Рекомендуем

Рубрика «искусственный интеллект» - 229

1. Введение

Отличие искусственного и человеческого разума

Детские мечты или Pack-Man своими руками

Введение

Новости

Актуальные темы

Архив