Рубрика «переводчик»
Первый нейросетевой переводчик для эрзянского языка
2022-10-09 в 10:00, admin, рубрики: cезон data mining, data mining, lower-resource language, machine learning, machine translation, ml, natural language processing, nlp, искусственный интеллект, малоресурсный язык, машинное обучение, машинный перевод, переводчик, СемантикаЭрзянский язык из финно-угорской семьи – один из официальных в республике Мордовия, и на нём говорят сотни тысяч людей, но для него до сих пор не было почти никаких технологий машинного перевода, кроме простых словарей. Я попробовал создать первую нейросеть, способную переводить с эрзянского на русский (и с натяжкой ещё на 10 языков) и обратно не только слова, но и целые предложения.
Пока её качество оставляет желать лучшего, но пробовать пользоваться уже можно.
Как я собирал для этого тексты и обучал модели – под катом.
Как Google подсунул нам котлеты и чуть не погубил проект. Почти юмористическая и почти детективная история одной ошибки
2022-02-11 в 5:30, admin, рубрики: Google Chrome, браузеры, КодоБред, котлеты, ошибки программистов, переводчик, переводчик google, Расширения для браузеров, хром, юморЮмористический детектив о том, как нам подсунули свинью котлеты. Он не то что основан на реальных событиях, - это их подробное описание, без доли вымысла. Только отметок времени нет, для большей детализации. Но могу сказать, что на всё про всё ушло часа 3.
Вероятно, заголовок сбивает с толку, может показаться что это какой-то кликбейт. Но так вы сможете себе лучше представить мои эмоции, когда у меня спросили: «А откуда у нас в проекте котлеты?»
Две крайности перевода
2021-11-23 в 10:29, admin, рубрики: книги, переводчик, русский перевод, русский язык, Читальный залОбычно имя переводчика печатают мелким шрифтом где-то среди выходных данных книги. Иногда оно так запрятано, что его приходится выискивать среди многочисленных аннотаций, номеров ISBN и адресов издательств. Как же так? Ведь переводчик фактически написал русский текст, который мы читаем. Немного грустно, что их труд часто недооценивают.
Кастомный виджет Яндекс.Переводчик для сайтов
2021-05-02 в 17:59, admin, рубрики: css, css3, html, javascript, translate, translator, перевод сайта, переводчик, Разработка веб-сайтов, Яндекс.переводчикКогда-то я предложил свое решение по кастомизации виджета googleTranslateЧитать полностью »
Встречайте чувашский язык в Яндекс.Переводчике: как мы решаем главную проблему машинного перевода
2020-02-11 в 7:52, admin, рубрики: Блог компании Яндекс, изучение языков, команда яндекс.переводчика, машинное обучение, нейросети, переводчик, поисковые технологии, Разработка веб-сайтов, чувашский язык, яндексРегионы России — это не просто границы на карте. В каждом регионе есть свои культурные традиции, во многих — свои языки. Машинный перевод мог бы помочь сохранять и применять эти языки — в частности, публиковать статьи в Википедии. Но как быть, если данных для обучения машинного интеллекта недостаточно?
Сегодня мы расскажем о нашем подходе на примере чувашского языка, которому мы обучили Яндекс.Переводчик. По данным последней переписи населения, этот язык считают родным более миллиона человек.
Ошибки переводчиков, которые привели к катастрофическим последствиям
2020-02-04 в 14:22, admin, рубрики: английский язык, Блог компании Онлайн школа EnglishDom, изучение языков, история, катастрофа, ошибки перевода, переводчик, Читальный залПравильный и точный перевод — штука сложная и ответственная. И чем ответственнее перевод, тем к более катастрофическим последствиям может привести ошибка переводчика.
Иногда одна такая ошибка стоит человеческой жизни, но среди них есть и такие, которые стоили десятков тысяч жизней. Сегодня мы вместе с вами разберем ошибки переводчиков, которые обошлись истории слишком дорого. В виду специфики нашей работы, мы рассмотрели ошибки, так или иначе связанные с английским языком. Поехали.
Google закрывает Инструменты переводчика
2019-11-23 в 19:40, admin, рубрики: Google, Google API, Google Translate, машинный перевод, облачные сервисы, перевод, переводчик, сервисыGoogle надавно разослал извещение о том, что 4 декбря закрывает сервис Инструменты переводчика или как его еще называют Google Translator Toolkit.
Недавно мы сообщали Вам, что 4 декабря 2019 мы прощаемся с Инструментами переводчика Google. Вы получили последнее напоминание, поскольку сервис прекратит работу менее чем за 2 недели. Ниже мы описали, как Вы можете загрузить свои данные.
Резюме для переводчика-фрилансера
2019-11-12 в 12:36, admin, рубрики: Локализация продуктов, переводчик, резюме, фрилансКогда я только перешла на фриланс, я часто смотрела резюме других переводчиков, пытаясь понять, каким оно должно быть, чтобы привлечь внимание компаний или клиентов. Года два я открывала чужие резюме в надежде, что вот сейчас я увижу то, что ищу: полное, грамотно составленное, структурированное резюме, написанное на хорошем английском. Такое, чтобы я захотела его сбайтить. Два года прошло — ни одного резюме я не нашла. Возможно, переводчики с хорошим резюме просто не держат их в свободном доступе или мне просто попадались неудачные варианты. Но почему-то мне кажется, что отчасти это проблема того, что мы не умеем рассказывать о себе и любое письменное общение по работе (даже такое отсроченное и без фидбека) ставит нас в тупик.
Я несколько раз меняла своё резюме, дополняла новыми разделами, экспериментировала с дизайном и вот год назад у меня получилось то, чем я немного горжусь и чем мне захотелось поделиться.Читать полностью »
Как Яндекс применил технологии искусственного интеллекта для перевода веб-страниц
2018-07-03 в 6:31, admin, рубрики: Блог компании Яндекс, браузеры, искусственный интеллект, машинное обучение, машинный перевод, нейронные сети, переводчик, Софт, яндексВ современном интернете более 630 миллионов сайтов, но лишь 6% из них содержат русскоязычный контент. Языковой барьер – главная проблема распространения знаний между пользователями сети, и мы верим, что решать её нужно не только обучением иностранным языкам, но и с помощью автоматического машинного перевода в браузере.
Сегодня мы расскажем читателям Хабра о двух важных технологических изменениях в переводчике Яндекс.Браузера. Во-первых, перевод выделенных слов и фраз теперь использует гибридную модель, и мы напомним, чем этот подход отличается от применения исключительно нейросетей. Во-вторых, нейронные сети переводчика теперь учитывают структуру веб-страниц, об особенностях которой мы также расскажем под катом.