Рубрика «Семантика»

Новый год — время чудес и подарков. Главным чудом, которое подарила нам природа, безусловно является естественный язык и человеческая речь. А мы, в свою очередь, хотим сделать новогодний подарок всем исследователям этого феномена и поделиться датасетом по открытой семантике русского языка.

В статье мы позволим себе немного подискутировать на тему смыслов, расскажем как мы пришли к необходимости создания открытой семантической разметки, расскажем о настоящих результатах и будущих направлениях этой большой работы. И, конечно, дадим ссылку на датасет, который вы сможете скачать и использовать для своих экспериментов и исследований.Читать полностью »

Продолжаю рассказывать про проекционное моделирование.
Следующая тема, которую я хочу затронуть, — это объяснение, почему мы определили связь в конструкции как 4-Д объект. Напомню, что в проекционном моделировании связь – это общая часть элементов конструкта. Поскольку элементы конструкта – это 4-Д объекты, то связи – тоже 4-Д объекты. То есть, для существования связи между двумя 4-Д объектами должен быть общий 4-Д объем, принадлежащий обоим этим объектам.

Мы привыкли считать связью нечто, что существует между двумя объектами, но никто в аналитике еще не давал еще точного определения этому понятию. Мы сделали это впервые. Я расскажу, почему в данной дисциплине связь определена так, а не иначе.

Пространственные связи

Начнем с простого: пусть объекты связаны общим положением в пространстве или во времени. Это связи типа «справа», «выше», «после», «вместе» и т.д. Для моделирования такого рода связей нам нужно рассмотреть 4-Д пространство, в котором помещены рассматриваемые нами 4-Д объекты. 4-Д пространство играет такую же роль, как и другие 4-Д объекты. Обычно моделирование начинается именно с того, что мы формируем границы модели, то есть, 4-Д пространство, в котором потом размещаем 4-Д объекты. Почему-то про этот самый первый 4-Д объект забывают сразу после его определения. Но именно его свойства позволяют нам описать указанные мной связи.
Читать полностью »

Вступление

Спасибо Игорю Катричеку за прекрасный вопрос! На форуме, посвященном проекционному моделированию, он задал интересный вопрос:

Если я буду смотреть на вал двигателя, и его повороты сольются для меня в единое целое, то это будет функция. Если я буду отсчитывать каждый поворот вала на 90 градусов или другой угол, то это будет операция. А если я буду следить за положением точки на валу, например, с целью автоматического регулирования её координат, то что это? Например, на валу радиолокационная антенна. Операций нет, так как нет начала и конца движения, повороты вала не дискретны, требуемое положение антенны постоянно меняется оператором, а фактическое меняется от ветра. Функций тоже нет, так как повороты вала не сливаются в единое вращение. Что это?

Вопрос настолько интересный, что я решил посвятить ему отдельную статью. Это поможет на конкретном примере разобраться с определениями проекционного моделирования. Заодно, я расскажу, какой у меня запрос к математикам.
Читать полностью »

Введение

В прошлой статье Проекционное моделирование я дал определения и тезисы проекционного моделирования. Начиная с этой, я начну подробный рассказ, почему же все-таки это сделано так, а не иначе и как это работает.

Дуальность

Часто можно слышать: этот объект одновременно обладает и свойствами такими-то и свойствами такими-то. Например, такое часто можно услышать про квантовую частицу. Якобы она обладает одновременно и свойствами волны, и свойствами частицы. В моей модели нет дуальностей. Как только появляется дуальность, это значит, что у нас есть либо две разные точки зрения на описание 4-Д объекта, или два разных метода.
Читать полностью »

Вступление

В прошлой статье я рассмотрел, что такое моделирование. Из этого рассказа должно было возникнуть чувство, что обмен описаниями скорее невозможен, чем возможен. У каждого субъекта свой мир в его сознании. Кто-то видит модель в виде образа, кто-то слышит ее в виде речи, кто-то осязает ее. Как мы при этом умудряемся о чем-то договориться, совершенно непонятно. И все же мы это делаем. Как это нам удается, — вопрос к психологам. Нам же стоит удивиться и воспользоваться этой возможностью, чтобы идти дальше.

В идеале должно быть так: два разных субъекта, получив на вход одну и ту же информацию, должны дать ее описание в одном и том же виде. Вспомните начертательную геометрию. Вам дается задание начертить конус. И все студенты чертят похожие рисунки, называемые чертежами. Так и в случае моделирования более сложных объектов: предприятий, зданий, процессов, мы должны добиться такого же уровня унификации, при котором все будут чертить похожие рисунки, писать похожие тексты (и т.д.), называемые моделями.

Для этого надо придумать единый язык моделирования. Для машиностроителей, строителей, технологов был придуман язык проекционной геометрии. Изначально он был создан как язык описания фортификационных сооружений и был засекречен. Но потом он распространился на другие области, став доминирующим на протяжении трех столетий.

Я претендую на создание подобного языка, но для описания более сложных объектов: операций, функций, объектов. Об этом языке сегодня мой рассказ.
Читать полностью »

Пирожки в Go - 1

В продолжение эпопеи с дистрибутивно-семантическими пирожками (и в погоне за модными тенденциями) решил переписать веб-сервис с лапидарного Питона на прогрессивный Go. Заодно был вынужден перенести и всю «интеллектуальную» часть (благо, не бином Ньютона). Сделать это оказалось куда проще и приятней, чем предполагал в начале. Впрочем, на медово-синтаксическом празднике жизни не обошлось без ложки дёгтя — самая быстрая гошная «числодробилка», какую смог найти (mat из gonum) таки уступила по скорости питоновской связке numba + numpy.
Читать полностью »

«Автоматический детектор спама». Или «О чем предупреждали Хемингуэй, Хаксли и Постман?» - 1

У каждого человека внутри должен быть
встроенный автоматический детектор дерьма
(Эрнест Хемингуэй, 1954)

В этот день почти пятьдесят лет назад в Национальную конвенцию учителей английского языка (Вашингтон D.C.) была доставлена необычная статья. Нейл Постман, американский писатель, педагог, теоретик медиа и критик культуры поднял тему о том, что главная задача учителей — это научить детей противостоять влиянию бесполезной и ложной информации.

28 ноября 1969 года

Отрывок из статьи:

Я вижу это так: лучшее, что могут сделать школы для детей, — это научить их отличать полезную информацию от бесполезной. Думаю, что все серьезные люди понимают, что около 90% того, что дают в школе, оказывается бесполезным. Читать полностью »

Пусть есть пользователи информационной системы. Авторизованным пользователям позволено строить свои модели в этой ИС. Неавторизованные могут только смотреть, как другие строят эти модели, но сами не могут этого делать.
Вопрос: сколько ролей в ИС?

Пусть есть две кучи песка, сваленные рядом.
Вопрос: Это одна куча, или по-прежнему две кучи, но теперь сваленные рядом?

Пусть есть должность директора школы №123. Сидоров занимает эту должность после Иванова.
Вопрос: это два разных директора, или один директор?

Сегодня Иванов играет роль княжны Мэри.
Вопрос: завтра, когда он будет играть роль с тем же названием, это будет та же роль, или другая?
Вопрос: Сидоров, который сегодня играет роль с тем же названием, играет ту же роль, или другую?

Есть часовой механизм, исполняющий роль часового привода в часах на городской башне. Пусть он сломался и его заменили на другой часовой механизм.
Вопрос: часовой привод теперь другой, или это тот же часовой привод, но с другим часовым механизмом?
Читать полностью »

Информационные технологии уже как десяток-другой лет стали неотъемлемой частью любого бизнеса. Ведение дел без применения программного обеспечения сейчас уже в принципе невозможно. Пока бизнес маленький — состоит из основателя, бухгалтера и пары-тройки наемных работников, им хватает таблиц в Excel или устных указаний. Но как только компания начинает расти, потребность в специализированном программном обеспечении резко возрастает. Есть и другая ситуация, когда компания занимается какими-то специализированными проектами или появляется крупный и крайне важный для благосостояния всей команды клиент. И для обслуживания этого клиента опять-таки нужно специализированное ПО, чьи возможности уходят далеко за пределы пакета MS Office.

В этот момент любой бизнес (кто-то раньше, кто-то позже) сталкивается с дилеммой: заводить собственный отдел разработки, размеры которого могут превышать текущие размеры компании, или поискать готовые решения на стороне. И вот тут начинается либо мучительный поиск квалифицированных разработчиков, либо не менее мучительный поиск адекватных поставщиков ПО. Наш проект — ROI4CIO — решает вторую проблему: помогает потребителю найти своего поставщика. В этой публикации мы вкратце расскажем, зачем мы нужны и чем хотим поделиться с сообществом в рамках вопроса закупки IT-решений.

Выбираем поставщика IT-решений и сохраняем рассудок - 1
Типичные переговоры с поставщиком. Холст, масло. (Оригинал: «The Expert», 2014)

Итак, представим, что вы — предприятие, которое ищет новое АСЭД-решение для вашей организации. Конечно, главбух вместе со своей бандой слегка сопротивляется, так как им хватает десять лет назад купленной 1С и бумажных приказов, но вот вся остальная организация погрязла в бесконечных косяках, недопонимании и тех самых бумажных приказах, которые имеют неприятное свойство «теряться» у кого-нибудь на столе. Так жить определенно нельзя, ведь уже заканчивается 2017 год. И вот, вы начинаете искать.
Читать полностью »

Русскоязычный чат-бот Boltoon: создаем виртуального собеседника - 1

Несколько лет назад было опубликовано интервью, в котором говорят об искусственном интеллекте и, в частности, о чат-ботах. Респондент подчеркивает, что чат-боты не общаются, а имитирует общение.

В них заложено ядро разумных микродиалогов вполне человеческого уровня и построен коммуникативный алгоритм постоянного сведения разговора к этому ядру. Только и всего.

На мой взгляд, в этом что-то есть…

Тем не менее, о чат-ботах много говорят на Хабре. Они могут быть самые разные. Популярностью пользуются боты на базе нейронных сетей прогнозирования, которые генерируют ответ пословно. Это очень интересно, но затратно с точки зрения реализации, особенно для русского языка из-за большого количества словоформ. Мной был выбран другой подход для реализации чат-бота Boltoon.
Читать полностью »