- PVSM.RU - https://www.pvsm.ru -

Некоторые современные подходы в области обработки естественного языка

Результаты научных исследований, полученные в последние годы в задачах распознавания речи [1] [1], машинного перевода [2], определения оттенка предложения [3] и частей речи [2] [4] показали перспективность нейросетевых алгоритмов глубокого обучения в сравнении с классическими методами обработки естественного языка (natural language processing). Однако, в области вопросно-ответных [3] и диалоговых [4] систем еще остается много нерешенных задач [5, 6]. В данной статье дан обзор результатов применения современных алгоритмов для задач обработки и понимания естественного языка. Обзор содержит описание нескольких разных подходов и не претендует на полноту исследований.
Некоторые современные подходы в области обработки естественного языка - 1
Human: how many legs does a cat have ?
Machine: four, i think .
Human: What do you think about messi ?
Machine: he ’s a great player .
Human: where are you now ?
Machine: i ’m in the middle of nowhere .

(из статьи [5] A Neural Conversational Model. КДПВ из фильма Ex Machina)


К решению задачи самообучающихся вопросно-ответных систем IT компании и исследовательские организации подходят с разным видением первоначальной точки отсчета.

Facebook пошел по пути определения перечня 20 конкретных логических операций и генерации под них искусственного набора задач (так называемый bAbi task [6], детальное описание [7]). С их точки зрения, эти операции являются необходимыми, но не достаточными для создания искусственного интеллекта [7 [8]]. Например, система должна уметь: положительно или отрицательно отвечать на вопросы, отвечать на вопросы, исходя из одного или нескольких известных фактов, считать, работать с неопределенностью и др.
Для решения предложенного набора задач была разработана оригинальная нейросетевая самообучающаяся архитектура с памятью — Memory Networks [8 [9]] и ее End-to-End реализация [9 [10]] (код [11] от авторов, реализация [12] на tensor flow).
Некоторые современные подходы в области обработки естественного языка - 2

Google, разрабатывая архитектуру Neural Turing Machine [10 [13]], использует более фундаментальный подход — систему, которая самостоятельно обучается, какую информацию и когда необходимо записывать и читать из памяти для решения задачи.
Некоторые современные подходы в области обработки естественного языка - 3
Однако результаты этого подхода пока менее конкурентноспособны при решении реальных задач. Neural Turing Machine решает задачи сортировки и получения информации из памяти, оперируя при этом небольшим размером памяти в 128 ячеек. Чуть большую функциональность демонстрирует Neural Programmer [11 [14]].
Некоторые современные подходы в области обработки естественного языка - 4
Некоторые современные подходы в области обработки естественного языка - 5
Система способна обучаться выполнять базовые логические и арифметические операции над таблицей с данными. Задача ставится таким образом: есть набор столбцов с данными, есть набор базовых операций, и система самостоятельно обучается необходимой последовательности действий — выбора данных и применения к ним операции, для получения требуемого решения.

Allen Institute for Artificial Intelligence [15] для проекта создания вопросно-ответной системы об окружающем мире (система ARISTO) использует онтологический подход [12 [16]], в том числе с возможностью обучения системы за счет взаимодействия с пользователем [13 [17]]. Проект разбит на 3 этапа — решение тестов для 4, 8 и 12 классов американской школы. Если с 4-м классом, более или менее, удалось [18] справиться, то для 8-го задачка оказалась непростая, и институт решил привлечь мировое сообщество data scientists на Kaggle для ее решения — The Allen AI Science Challenge [19].
Участникам даны обучающая (2 500 вопросов) и тестовая (8 132 вопроса) выборки вопросов в текстовой форме с 4-мя вариантами ответа. Для обучающей выборки правильные ответы известны, для тестовой — нет. Из-за небольшого объема обучающая выборка скорее предназначена не для обучения системы, а для использования при работе над решением для оценки его качества в целом и степени “покрытия” им основных тем физики, биологии, географии и прочих предметов для 8-го класса.
Конкурс имеет ряд особенностей (здесь [20] можно найти обзор-выжимку с форума конкурса) — например, итоговое решение должно работать без доступа к интернету, поэтому применить столь долгожданный Google Knowledge Graph API [21] не получится.

Ниже в таблице* приведен сравнительный обзор современных походов к созданию вопросно-ответных систем, подготовленный в рамках семинара Memory and Q&A systems группы Deep Learning Moscow [22] (в группе есть полная версия [23] презентации с ссылками на источники).
Некоторые современные подходы в области обработки естественного языка - 6
* IR — information retrieval; KB — knowledge base; IE — information extraction; BiLSTM — bidirectional long-short term memory; NN — neural net; NTM — Neural Turing Machine; IGOR — архитектура Memory Networks — Input feature map, Generalization, Output feature map, Response.

Ранее на Хабре уже упоминался [24] новый хакатон, совмещенный с научной школой, DeepHack.Q&A, на котором можно будет опробовать в деле все вышеперечисленные классические и нейросетевые вопросно-ответные методы, а также напрямую задать вопросы их авторам.

[1] Andrew Y. Ng et al. (2014), Deep Speech: Scaling up end-to-end speech recognition
[2] Bengio Y., Cho K., Bahdanau D. (2015), Neural Machine Translation by Jointly Learning to Align and Translate, International Conference on Learning Representations 2015
[3] Blunsom P., Grefenstette E., Kalchbrenner N. (2014), A Convolutional Neural Network for Modelling Sentences, The 52nd Annual Meeting of the Association for Computational Linguistics
[4] Kumar A. et al. (2015), Ask Me Anything: Dynamic Memory Networks for Natural Language Processing
[5] T. Mikolov et al. (2015), A Roadmap towards Machine Intelligence
[6] Serban J.V. et al. (2015), A Survey of Available Corpora For Building Data-Driven Dialogue System
[7] Jason Weston et al. (2015), Towards AI-Complete Question Answering: A Set of Prerequisite Toy Tasks
[8] Jason Weston et al. (2015), Memory Networks
[9] Sainbayar Sukhbaatar et al. (2015), End-To-End Memory Networks
[10] Alex Graves et al. (2015), Neural Turing Machines
[11] Arvind Neelakantan et al. (2015), Neural Programmer: Inducing Latent Programs with Gradient Descent
[12] Clark P., et. al (2015), Automatic Construction of Inference-Supporting Knowledge Bases
[13] Hixon B., et. Al (2015), Learning Knowledge Graphs for Question Answering through Conversational Dialog

Автор: e777

Источник [25]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/programmirovanie/108095

Ссылки в тексте:

[1] распознавания речи: http://arxiv.org/abs/1412.5567

[2] частей речи: http://arxiv.org/abs/1506.07285

[3] вопросно-ответных: http://arxiv.org/abs/1511.08130

[4] диалоговых: http://arxiv.org/abs/1512.05742

[5] статьи: http://arxiv.org/pdf/1506.05869v3.pdf

[6] bAbi task: https://research.facebook.com/researchers/1543934539189348

[7] детальное описание: https://github.com/facebook/bAbI-tasks

[8] 7: http://arxiv.org/abs/1502.05698

[9] 8: http://arxiv.org/abs/1410.3916

[10] 9: http://arxiv.org/abs/1503.08895

[11] код: https://github.com/facebook/MemNN

[12] реализация: https://github.com/carpedm20/MemN2N-tensorflow

[13] 10: http://arxiv.org/abs/1410.5401

[14] 11: http://arxiv.org/abs/1511.04834

[15] Allen Institute for Artificial Intelligence: http://allenai.org/

[16] 12: http://allenai.org/content/publications/clark_balasubramanian.pdf

[17] 13: http://allenai.org/content/publications/hixon_naacl_2015.pdf

[18] удалось: http://aristo-demo.allenai.org/

[19] The Allen AI Science Challenge: https://www.kaggle.com/c/the-allen-ai-science-challenge

[20] здесь: https://docs.google.com/document/d/1L96Y2JnQ_iGNgnA8duH0kE0RxXuyohO_jS4RURY2b7U/edit?usp=sharing

[21] Google Knowledge Graph API: https://developers.google.com/knowledge-graph/

[22] Deep Learning Moscow: https://www.facebook.com/groups/1505369016451458/

[23] полная версия: https://www.facebook.com/download/1498762900424685/Presentation_221115_QA_memory.pptx

[24] упоминался: http://habrahabr.ru/post/274233/

[25] Источник: http://habrahabr.ru/post/274577/