Рубрика «русский язык» - 4

Люди ломаются на логике, роботы — на всем понемногу. Экзамены по русскому для NLP-моделей

2020-06-10 в 9:00, admin, рубрики: BERT, deep learning, natural language processing, nlp, transfer learning, Алгоритмы, Блог компании Сбербанк, искусственный интеллект, лидерборд, машинное обучение, нейронные сети, обработка текстов, русский язык, Семантика, славянская группа языков, управление проектами, языки

Чтобы машины могли обрабатывать текст на русском и «понимать» его, в NLP используются универсальные языковые модели и трансформеры — BERT, RoBERTa, XLNet и другие — архитектуры от 100 миллионов параметров, обученные на миллиардах слов. Все оригинальные модели появляются обычно для английского, показывают state-of-the-art в какой-нибудь прикладной задаче и только спустя полгода-год появляются и для русского языка, без тюнинга архитектуры.

Чтобы корректнее обучать свою модель для русского или другого языка и адаптировать её, хорошо бы иметь какие-то объективные метрики. Их существует не так много, а для нашей локали и вовсе не было. Но мы их сделали, чтобы продолжить развитие русских моделей для общей задачи General Language Understanding.

Мы — это команда AGI NLP Сбербанка, лаборатория Noah’s Ark Huawei и факультет компьютерных наук ВШЭ. Проект Russian SuperGLUE — это набор тестов на «понимание» текста и постоянный лидерборд трансформеров для русского языка.
Читать полностью »

О доверии

2020-05-03 в 18:12, admin, рубрики: английский, английский язык, изучение языков, иностранный язык, лингвистика, образование, русский язык

Волнует в последнее время эта тема, решил порассуждать. Буду признателен за комментарии и замечания.

1. Микроуровень

Большинство людей реально компетентны в 1-2 областях, по поводу всех остальных вынуждены полагаться на круг знакомых и мнения признанных (реальных или мнимых) специалистов и opinion-maker’ов (известных людей, формирующих своими публичными действиями или высказываниями общественное мнение). Иначе никак – ты не можешь проверять каждый факт и разбираться на профессиональном уровне во всех областях.

И вот тут начинается интересное. А кому верить? Похоже, что верят люди на самом базовом ИНСТИНКТИВНОМ уровне – тем, с кем разделяют систему ценностей, фундаментальные представления о жизни: в чём важно разбираться/что не заслуживает внимания, что круто/что не круто (эстетические предпочтения): кто-то с восторгом смотрит на чётких пацанчиков с бритым затылком, кого-то восхищает хорошо написанный текст.

Каждый день с утра до вечера мы посылаем в общество сигналы: манера двигаться, одеваться, формулировать и произносить фразы, выбор лексикона – всё это способы заявить, кто мы есть. И притягивать себе подобных. «Мне пофиг, что обо мне думают» – детский сад. И прекратите уже исправлять тех, кто говорит «звОнит». Всё они знают, не мешайте людям самоидентифицироваться.
Читать полностью »

Человек в бутылке

2020-04-17 в 16:31, admin, рубрики: английский, английский язык, изучение языков, иностранный язык, лингвистика, образование, русский язык

В детстве читал рассказ Г. Майринка с таким названием. Восточный князь организовал в европейском городке представление. По сюжету известный всей публике житель городка находится на сцене в большой бутылке. Довольно быстро он начинает делать публике какие-то знаки, махать руками. Стёкла бутылки искажают черты его лица, получается очень смешно. Публика умирает со смеха, князь сидит на бутылке. Скоро человек в бутылке падает на дно и затихает. Князь ускользает в удобный момент, публика пытается понять, что это было. Оказалось, что в бутылку не поступал воздух. Их знакомый умер. У них на глазах. Знаками пытаясь объяснить, что нечем дышать. А они все при этом покатывались со смеху.

Позже я сам попал примерно в такую же ситуацию. Будучи честным преподом, годами пытался с помощью своих статей воевать с продуктами жизнедеятельности сотен языковых школ – застрявшей в головах людей рекламной демагогией. Кричал, махал руками… Часто не хватало авторитета заставить прочитать даже людей, изучающих английский. Печально, конечно, что в 21-м веке эти вещи всё ещё приходится объяснять, а люди, часто даже неглупые, продолжают вестись на чудодейственные методики, «снять языковой барьер» и прочий английский с носителями…
Читать полностью »

Про фразовые глаголы-3 (on-off)

2020-04-13 в 16:06, admin, рубрики: английский, английский язык, изучение языков, иностранный язык, лингвистика, образование, русский язык, фразовые глаголы

Перед этой статьёй рекомендуется прочитать две предыдущие части. On и Off обычно имеют противоположный смысл, поэтому мне показалось хорошей идеей совместить обзоры этих частиц.

И предлог, и частица on соответствуют русскому «на». Тут логика вполне очевидная: «на» – это и предлог (говорим о поверхностях: «на стене/столе»), и приставка – НА-сыпать (сыпать на поверхность).

Put – класть, put on – «на-кладывать». Например, put on makeup – «на-кладывать» грим. Любой предмет одежды, обуви, головной убор носители английского языка тоже накладывают, а не надевают, как у нас: put on a hat – надеть шляпу. У них даже вес тела накладывают: put on weight по-английски «набрать вес».

Часто ON соответствует русской приставке «про-». «Про-» обычно означает «двигаться вперёд»: про-двигаться, про-лезать, про-двигать. Возьмём фразовый глагол (ФГ) get on. Get означает «двигаться, перемещаться», get on буквально «про-двигаться». Или в пространстве, или, метафорически, в жизни или карьере: Young people try to get on in life – Молодые люди стараются продвигаться в жизни.
Читать полностью »

Про фразовые глаголы

2020-04-05 в 17:55, admin, рубрики: английский, английский язык, изучение языков, иностранный язык, лингвистика, образование, русский язык, фразовые глаголы

Фразовые глаголы английского языка гораздо проще, чем кажутся. Они работают точно так же, как в русском языке приставки. Выдающийся советский актёр Зиновий Гердт, узнав однажды о недостойном поступке, совершённом знакомым ему писателем, сказал: «Разрешите с вами раззнакомиться». Думаю, мало кто слышал в живой речи глагол «раззнакомиться». Но интуитивно всё равно понятно, что это противоположность «ПО-знакомиться».

Почему это так легко и понятно? Потому что в раннем детстве мы глубоко усвоили значения русских приставок и с тех пор оперируем ими легко и бессознательно. Так же легко и бессознательно 7-8-летние английские дети оперируют частицами во фразовых глаголах, на ходу сочиняют новые фразовые глаголы, которых нет ни в одном словаре.

Безответственные преподаватели рекомендуют значения фразовых глаголов «просто запоминать», не пытаясь понять их внутреннюю логику. Это порочная практика: фразовых глаголов только самых распространённых – тысячи. «Выучить» их принципиально невозможно. Вот, скажем, let – это «позволять, пускать». А фразовый глагол «let in on» означает «посвящать в тайну». Запомнить такое способен только человек, который понимает переносные значения частиц, образующих фразовые глаголы.

Если правильно усвоить эти переносные значения, можно начать понимать даже такие фразовые глаголы, с которыми сталкиваешься впервые. Знание нескольких принципов освобождает от необходимости знания многих фактов.
Читать полностью »

Мифы об изучении иностранных языков

2020-04-04 в 16:58, admin, рубрики: английский, английский язык, изучение языков, иностранный язык, лингвистика, образование, русский язык

Миф 1. «Если я окажусь в языковой среде, я быстро и хорошо заговорю». Многие люди живут в Англии или США по 10-20 лет, но при этом очень плохо говорят по-английски. Слов и выражений — десятки тысяч только самых употребительных. Каждое из них надо осмысливать отдельно — они не отложатся каким-то магическим образом. У слов очень часто несколько значений, каждое из которых требует отдельного внимания. И надо ведь как-то ещё удерживать всю эту махину в памяти. А ещё слова часто не сочетаются друг с другом, это тоже надо держать в голове. Буквально при мне, русская дама лет пятидесяти, говорит подруге: «…и вот он мне прете-ензии делает!» Претензии. Делает. Носитель языка!
Читать полностью »

Как пользоваться словарями (и не только)

2020-04-03 в 16:56, admin, рубрики: английский, английский язык, изучение языков, иностранный язык, лингвистика, образование, русский язык

Для совсем начинающих оптимальным словарём будет Abbyy Lingvo lingvolive.ru, потому что в нём значения слов не свалены в кучу, как в некоторых электронных словарях — первые два значения слова будут наиболее актуальными. По сути Lingvo представляет из себя старые советские словари в цифровом варианте. Для сколько-нибудь продвинутых студентов Lingvo — зло, потому что многие значения от третьей позиции и дальше работают только в каком-то контексте, но сути слова не отражают. Например, вводим слово expect. 3-е значение — «думать». В каком-то контексте оно будет верным, например: I expect him to come at 5. Но нельзя это слово использовать как взаимозаменяемое с think, например: I think she is beautiful. Фраза I expect she is beautiful будет иметь совсем другой смысл, потому что базовое значение expect — «ожидать».

Повторюсь: Lingvo — лучший словарь для начинающих, продвинутым студентам он может сильно навредить, как показывает практика. Продвинутые студенты могут использовать Lingvo для перевода названий птиц, растений, животных. Потому что если вы вводите в англо-английский словарь слово finch, то вам расскажут, что это птица из семейства вьюрковых, питающихся преимущественно семенами и обитающих главным образом в Северном полушарии, обычно имеют конический клюв. Для сиюминутных целей это совершенно бессмысленное толкование. Lingvo же не будет мудрить и просто скажет вам, что finch — это зяблик. Страницы онлайн версии Lingvo не перегружены скриптами и открываются очень быстро.
Читать полностью »

Паблики – зло

2020-04-02 в 16:57, admin, рубрики: английский, английский язык, изучение языков, иностранный язык, лингвистика, образование, русский язык

Те, кто изучает иностранные языки, очень любят подписываться на разные паблики, посвящённые этим языкам. И, судя по моей ленте новостей ВК, охотно репостят разные материалы из них.

Необходимо понимать, что у этих пабликов никогда не было цели кого-то чему-то учить. Единственный смысл их существования — накрутить как можно больше подписчиков и потом как можно дороже продавать рекламу или курсы. Никаких других целей там нет.

В пабликах очень популярны посты на тему «распространённые выражения, связанные с...». С отношениями, например. И красивая картиночка. Люди с восторгом репостят это себе на стену: «потом посмотрю!». И смотрят ведь, и пытаются запомнить! Если оценивать эти посты профессиональным взглядом, всё выглядит немножко по-другому.
Читать полностью »

Трудности в преподавании иностранных языков (студентам тоже рекомендовал бы)

2020-04-01 в 18:03, admin, рубрики: английский, английский язык, изучение языков, иностранный язык, лингвистика, образование, русский язык

1. Чем отличаются «слово» и «понятие» и почему специальные методики запоминания слов — баловство

Слово — это лексическая единица с набором значений. Понятие — более сложная материя, плохо поддающаяся формулировке. Когда человек начинает осваивать иностранный язык, он сталкивается с лексическими единицами (незнакомыми словами), лезет в словарь, видит несколько значений слова и пытается понять, какое из них работает в данном конкретном контексте.

Иллюстрация: англичанин учит русский язык, сталкивается со словом «стол». Смотрит в словарь. Оказывается, это и table, и desk. Но desk — скорее стол, за которым работают (не плотники). Ну ок. Затем встречает где-нибудь «паспортный стол». Стол?? Видит в супермаркете вывеску «Стол заказов», Но там внезапно нет никакого стола, а есть девочка за стойкой с планшетным компьютером… До него начинает доходить, что «стол» — это ещё некий пункт, где население обслуживается по конкретному вопросу (очевидно, в связи с тем, что сотрудник, который непосредственно обслуживает людей, сидит, как правило, за столом). Заходит в интернет-магазин, видит кнопку «Стол заказов», понимает, что это расширенное значение от реального (не виртуального) «стола заказов».
Читать полностью »

Как запоминать иностранные слова и выражения

2020-03-31 в 18:40, admin, рубрики: английский, английский язык, изучение языков, иностранный язык, лингвистика, образование, русский язык

Тема заезженная, понимаю. Но, как человек, добившийся выдающихся успехов в развитии вокабуляра при СРЕДНЕЙ памяти, позволю себе несколько слов. Каждый запоминает информацию очень по-разному, это зависит от целого ряда индивидуальных особенностей — преподаватели тут особо не помогут. Не верьте рекламе, никаких универсальных методик запоминания не существует, каждый должен изучить работу своей памяти самостоятельно. В целом наша способность запоминать опирается на 2 столпа:

Эмоции (у него сложная фамилия, но я запомнил легко, потому что мне кажется, что она забавно звучит)
Ассоциативные связи (у него сложная фамилия, но я запомнил легко, потому что похожая была у моего одноклассника).

Чем больше ваших личных ассоциаций привязано к слову или выражению, тем больше шансов, что оно останется в памяти. Отчасти поэтому рекомендуется запоминать слова в контексте, а не по отдельности. Если уж и запоминать что-то вне контекста, так это фразеологизмы, или идиомы. Они уже сами по себе содержат яркий образ, и вы (как в русской идиоме) убиваете сразу двух зайцев — и идиому запоминаете, и слова, из которых она состоит.
Читать полностью »

Информация

Комментарии

Рекомендуем