Рубрика «лингвистика»

Обычно в преддверии Нового года мы обновляем наш датасет по Открытой семантике. В этом году было сделано много работы, но она не подошла к логическому завершению и мы продолжим её в следующем году. Сейчас же мы хотим рассказать о не менее важном открытом датасете, вызвавшим живой интерес на ряде лингвистических конференций этого года, как по стороны исследователей, так и со стороны представителей индустрии. Речь в посте пойдёт об открытом тональном словаре русского языка.

Новогодний датасет 2019: открытый тональный словарь русского языка - 1
Читать полностью »

Любим читать ушами? Мысли о будущем ITSumma Press - 1

Привет!

Давненько мы не выбирались из своего издательского подвала и не общались с вами про наболевшее, да? Пора исправляться! И для начала хотим поделиться последними новостями о том, что происходило в жизни нашей книгопечатной.

Самое значительное из недавнего — это конференция Highload++, проходившая в Сколково. Там мы, в партнёрстве с «Онтико» @oleg-bunin и Олегом Буниным сделали подарок всем участникам: помимо привычных блокнотов, брошюр-каталогов, ручек и визиток, посетители получали нашу первую книгу — «Проектирование событийно-ориентированных систем».
Читать полностью »

Мы привычно пользуемся интернет-поиском, общаемся с чат-ботами, читаем документы на любых языках благодаря переводчикам. Приказать роботу-пылесосу начать уборку при помощи голоса? Ничего особенного… Для многих голосовые помощники на смартфоне вошли в повседневность. Будущее, в котором компьютер, прочитав постороннюю заметку о футболе, соответствующим образом меняет тональность новости о погоде, уже наступило.

Как это всё работает? Как стать специалистом в NLP (расшифровывается Natural Language Processing, не путайте с нейролингвистическим программированием:) )?

Тех, кто задается такими вопросами, мы приглашаем на открывшийся недавно онлайн- курс Samsung Research Russia. Под катом подробности…
Новый бесплатный онлайн-курс от Samsung по анализу текста при помощи нейросетей - 1
Авторы курса “Нейронные сети и обработка текста”
Читать полностью »

Ко дню рождения Юрия Кнорозова: изучаем основы письменности Майя - 1

Письменность майя была единственной полноценной системой письменности в Америке, но благодаря старанием отважных испанских конкистадоров к XVII веку она была полностью забыта. Тем не менее, тысячи этих символов сохранилось на резных камнях, фресках и керамике, и в XX веке обычный советский аспирант выдвинул идею, которая позволила их расшифровать. И данная статья покажет, как устроена эта система.
Читать полностью »

Блеск и нищета переводной литературы - 1

— Лучше вообще не читать, чем такое.

Часто ли вы читаете техническую литературу? Именно литературу, а не мануалы на хабре или багрепорты на гитхабе? А когда читаете, на каком языке предпочитаете это делать (если есть возможность выбирать, конечно)? Какую версию предпочтёте, русскоязычную или англоязычный оригинал?

В некоторых кругах бытует отдающее снобизмом и элитаризмом мнение, что читать (смотреть кино, играть в игры) стоит только на языке Шекспира и никак иначе. Многим же другим довольно сложно проверить первых на тему того, просто ли они зазнаются или с переводной тех.литературой есть какие-то серьёзные проблемы. Банально по причине плохого владения языком оригинала.
Читать полностью »

Ученый-лингвист нашел ключ к рукописи Войнича. Или нет - 1

В конце апреля Джерард Чешир из Бристольского университета опубликовал статью в журнале Romance Studies, где описывается языковая система, представленная в рукописи Войнича — средневековом литературном памятнике, который до сих не удавалось расшифровать. Новая попытка вызвала резонанс среди лингвистов, и большинство из них настроены скептически.
Читать полностью »

Не бросайте чтение, будет не про политику. Язык, как он есть. Краткие заметки для быстрого начала понимания украинского, ну и в конце немного программирования, чтобы уж не совсем оффтоп.

Несколько замечательных особенностей украинского языка.

1. Звательный падеж.

Эта милая сердцу категория была в общем прародителе всех славянских языков, но сейчас осталась рудиментарно. Хотя она и понятна носителю современного русского, возьмите обращение «Друже!». Звательный падеж знаком нам из Библии («Отче наш!», «Врачу, исцелися сам!»), что неудивительно, так как церковнославянский — солунский диалект староболгарского.
Примеры:
Читать полностью »

Открытая семантика русского языка, об истории создания которой вы можете прочитать здесь и здесь, получила большое обновление. Мы собрали достаточное количество данных, чтобы применить поверх собранной разметки машинное обучение и построить семантическую модель языка. Что из этого получилось смотрите под катом.

Новогодний датасет 2018: открытая семантика русского языка - 1
Читать полностью »

Подробное интервью с легендарным лингвистом, вышедшее 6 лет назад, но ничуть не утратившее своей актуальности. Ноам Хомский —  «современный Эйнштейн», как его называют, делится своими соображениями об устройстве человеческого мышления и языка, искусственном интеллекте, состоянии современных наук. На днях ему исполнилось 90 лет, и это кажется достаточным поводом для публикации статьи. Интервью ведет молодой учёный-когнитивист Ярден Кац, он сам прекрасно разбирается в предмете, поэтому беседа очень содержательна, а вопросы столь же интересны, как и ответы.

Ноам Хомский: где искусственный интеллект пошел не туда? - 1

Читать полностью »

Научиться программировать — значит не только развить полезный навык, но и приобрести особый тип мышления. Программисты умеют хорошо решать математические и логические задачи. Также они обращают внимание на детали, моделируют ситуации в обычной жизни и дают оценку на основе большого количества факторов.

Программист на всю голову: как кодинг влияет на мышление - 1

В преддверии нашего курса Go Workshop рассказываем, что психологи, лингвисты и педагоги думают о влиянии кодинга на мозг, при чем тут австралийские индейцы и гипотеза Сепира-Уорфа.
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js