Рубрика «изучение языков» - 10

tl;dr: потому что перед Ы не могли возникнуть ни Ж, ни Ш.

Орфография многих живых языков отражает давно исчезнувшие вещи: например, написание английского слова knight указывает на то, что когда-то в 14 в. оно произносилось «книхт». В русской орфографии тоже полно «доисторических окаменелостей»; и для того, чтобы не зубрить, а понимать орфографические правила — нужно разбираться, откуда эти правила взялись. Готового обзора истории шипящих я не нашёл, так что взялся составить его сам. Особенно интригует природа буквы Щ — самой необычной в нашем алфавите.

История славянских шипящих: почему мы пишем жи-ши через И? - 1

Читать полностью »

Сегодня мы расскажем вам о главном неприятном сюрпризе для студента, который начинает изучать иностранный язык. 

Словарный запас еще небольшой, а тут встречается слово, которое сильно похоже на знакомое. К примеру, accurate. Человек сразу думает, что это «аккуратный». Ведь не может же настолько похожее слово означать что-то иное.

Увы, может. AccurateЧитать полностью »

В нашей онлайн-школе студенты могут выбрать, какой диалект английского им изучать: американский или британский. Соответственно, есть преподаватели и из США, и из Британии. А еще из Австралии, Канады и кучи других стран, но темы статьи это не касается :)

В Британии и США говорят практически на разных языках. Доходит до того, что некоторые фразы американского английского доводят большинство британцев до белого каления. Мы собрали некоторые из этих фраз здесь. Когда будете в Британии, постарайтесь их не использовать. 

Читать полностью »

cover

Количество атомов в наблюдаемой Вселенной — где-то 10^80, число Дэвидов на картинке к статье — 2. Количество книг в этой подборке находится между этими ориентирами и будет пополняться (всегда рад рекомендациям). Что же это за книги?

Не будучи лингвистом, языки я люблю, поэтому накопил (и даже прочитал) довольно много книг по этой теме. В статье я собрал наиболее яркие книжки, которые попали мне в руки и запали в душу. Среди тем — популярная лингвистика, переводы, конланги и нескучные учебные пособия. Начнем с наиболее популярных.

Увлекательно про языки

Здесь каждая глава будет посвящена какому-то конкретному языку.

⭐ Лингво. Языковой пейзаж Европы | Гастон Доррен (2014)

Европа — языковой пирог

Популярная лингвистика. Книги про языки, которые мне нравятся - 2

Филолог и журналист из Нидерландов рассказывает каков на вкус этот самый пирог. Все это сделано в форме максимально нефромальных заметок, в конце каждой из которых есть примеры заимствованных из этого языка слов. Также автор приводит и непереводимые слова, например "мерак" — удовольствие, получаемое от какого-то простого времяпровождения, например, от общения с друзьями (сербохорватский). Помимо этого вы узнаете, что слово avalanche (лавина) — только одно заимствованное английским из романшского (одного из четырех официальных языков Швейцарии), а самое известное заимствованное слово из чешского — робот.

Читать полностью »

Какое-то время назад я начал собирать несостыковки между тем, что слышал от своих (и чужих) преподавателей и тем, что понял, изучая язык самостоятельно. Увидев недавно на Хабре похожий материал («Заблуждения об английском, которым нас научила школа»), я решил поделиться своей «коллекцией».

Ещё о преподавании английского языка - 1

Читать полностью »

Мы уже написали довольно много материалов про английские ругательства. И заметили одну интересную вещь — даже у вполне обычных слов из общей лексики часто есть грубые и пошлые значения.

Нам стало интересно, почему так происходит, и мы копнули глубже. Оказалось, что таких двусмысленных слов много, но часто их грубые смыслы работают только в рамках одного диалекта. Поэтому сегодня мы рассмотрим обычные слова в английском, которые в Британии считаются грубыми и некультурными. Поехали.

Читать полностью »

Английский язык богат ругательствами и оскорблениями. Это в американском кино можно услышать только «фак», «щит» и «бич», а на самом деле бранных слов там куда больше. Интеллигентные люди ругаются изощреннее.

Ранее мы написали целую серию материалов про английские ругательства. Вот про легкие, а вот чуть пожестчеЧитать полностью »

Моя маленькая помощь малым языкам - 1

Сложный был год: налоги, катастрофы, бандитизм и стремительное исчезновение малых языков. С последним мириться было нельзя...

На территории России проживает большое количество народов, говорящих более чем на 270 языках. Около 150 языков насчитывает менее 1 тысячи носителей, а за последние 20 лет 7 языков уже исчезло.

Этот проект — мои "пять копеек" по поддержке языкового разнообразия. Его цель — помощь исследователям в области машинного перевода, лингвистам, а также энтузиастам, радеющим за свой родной язык. Помогать будем добыванием параллельных корпусов, — своеобразного "топлива", при помощи которого современные модели все успешнее пытаются понять человеческий язык.

Сегодняшние языки — башкирский и чувашский, с популяризаторами которых я в последнее время тесно общался. Сначала я покажу как в принципе извлечь корпус из двух текстов на разных языках. Затем мы столкнемся с тем, что на рассматриваемых языках предобученная модель не тренировалась и попробуем ее дообучить.

Экспериментировать мы будем в среде Colab'а, чтобы любой исследователь при желании смог повторить этот подход для своего языка.

I. Извлекаем параллельный корпус

Для выравнивания двух текстов я написал на python'е библиотеку lingtrain_aligner. Код у нее открыт. Она использует ряд предобученных моделей, можно подключать и свои. Одной из самых удачных мультиязыковых моделей сейчас является LaBSE. Она обучалась на 109 языках. Так как соотношение текстов смещено в сторону популярных языков, то для них качество эмбеддингов (эмбеддингом называют вектор чисел применительно к данным, которые он описывает) будет лучше.

Читать полностью »

Автор: Виолетта Хайдарова

Все мы привыкли, что есть пары типа голос – гласгород – градзолото – злато, сторож – страж в которых слова обозначают одно и то же, отличаясь только стилем. Одно слово в таких парах всегда стилистически нейтральное, а второе – торжественное и книжное. Но как вам понравится, если я скажу, что порох и прах тоже когда-то имели одинаковое значение и были точно такой же парой? А еще один и тот же корень имеют слова колодец и кладмолодёжь и младенецоборона и браньворота и вращатьсяоболочка иЧитать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js