Рубрика «лингвистика» - 3

Ветеранам Хабра пора напрячься: время летит слишком быстро... В этом году нашему корпоративному блогу стукнуло 10 лет! За это время мы исследовали мир айтишки через самые разные сферы: от киберспорта и «фантазий о будущем» до классических технических «заглядываний под капот» с сотнями строк кода.

В честь юбилея вспоминаем 10 лучших (по версии редакции) текстов — по одному на каждый год. Это статьи, без которых невозможно представить нас как команду и блог.

P.S. А вас просим оценить нас в ежегодном опросе Хабр/ЭКОПСИ. Это займёт всего 5–7 минутЧитать полностью »

Есть 2 разных способа говорения на иностранном языке. Они именно принципиально разные – как лазерная и струйная технологии печати. И нарабатываются они тоже абсолютно по-разному. Непостижимым образом многие из тех, кто мечтает «заговорить» не знают даже об этом, не говоря уже о более тонких моментах развития навыка говорения. Это улучшенная версия старой статьи.

Читать полностью »

ВВЕДЕНИЕ

Большие языковые модели (LLM) становятся неотъемлемой частью инструментов генерации, анализа и автоматизации программирования. Их возможности позволяют автоматизировать разработку, искать ошибки, генерировать тесты, осуществлять перевод между языками программирования. Однако одно из ключевых ограничений – контекстное окно, то есть максимально возможная длина входных данных. С ростом объема современных программ эффективность работы LLM с длинным кодом становится всё более актуальной задачей, особенно учитывая вычислительные и финансовые издержки обработки длинных последовательностей.

Читать полностью »

Каждый, кто изучал языки и хотя бы немного сравнивал их, не мог не замечать много систематических языковых шаблонов. Эти паттерны наверняка происходят из самой природы вещей, из натуры, что называется. Либо из восприятия этой натуры человеком говорящим.
В этой статье речь пойдёт о лицах (Nth person / πρόσωπον), а возможно и более широком понятии. Здесь я попытаюсь обобщить те представления, которые насобирал в свой языковой и лингво-научпопный опыт.

Читать полностью »

Давно думаю над моделью, в которой есть всего две формулы:

State = Static + Dynamic

и

State = Fact + Delay.

Казалось бы – пора звонить в Спортлото, не стыковались они у меня, хотя по отдельности каждая формула вроде работает. Но заявить, что на все вопросы я готов ответить по этим формулам – такого ощущения не было.

И вот... Сидел я как-то над пиццей, подумал, что прикольно раскидали начинки. «Четыре вкуса» и всё такое. И как бы мысленно (а потом и физически) ее ни резал – всё равно что-то влезет на соседний кусок. Итогом стало это...

Читать полностью »

1. В 1066-м году Вильгельм Завоеватель захватил британские земли и получилась такая ситуация: всё начальство – французы, говорят на французском; местные – на своих языках. Французов ассимилировали, связь с Францией у них фактически оборвалась. Но английский впитал в себя огромную часть французского языка. Эти слова стали литературными синонимами, их до сих пор используют в образованных кругах + в школах и вузах французский учат как иностранный – это тоже не даёт французским словам устаревать.

2. Читать полностью »

На основе разговоров с выпускниками ведущих вузов Москвы и комментариев на Хабре.

___Военные/сотрудники спецслужб быстро и эффективно выучивают языки.

В бесчисленных фильмах на территории противника действует иностранный разведчик, изображающий местного жителя. Чтобы такое провернуть на практике, нужны выдающиеся способности к языкам и годы, многие годы подготовки.

Читать полностью »

В настоящее время нейросети успешно используются для языкового перевода. По сравнению со старыми программами и онлайн переводчиками, прогресс на лицо. Алгоритмы демонстрируют более тонкое понимание речи, владение контекстом, они способны к стилизации.

И если с современными языками нейросети справляются довольно толково, возникает вопрос: как насчет древних? До сих пор работа с ними представляла существенное затруднение. Скажем, тот же Google Translate из рук вон плохо работает с латынью.

Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js