Рубрика «ABBYY» - 10

Добрый день, уважаемые читатели.

Наверное, вы хотите услышать от нас бравурную success-story внедрения наших облачных технологий. Разочарую – сегодня речь пойдёт о делах более чем земных, но не становящихся от этого менее интересными. Я попробую рассказать вам об амбициозном проекте процессинга рунических документов, получаемых из разных источников. К примеру, вот таких:

image

В этом проекте мы столкнулись с необычными задачами не только для систем распознавания, синтеза текста и DA (document analysis – так у нас называют часть FineReader’а, отвечающую за выделение текстовых областей), но и для обработки изображений и экспорта.

Наша компания выступила в этом проекте не в совсем привычной для себя роли. Обычно наши технологии используются для потокового ввода документов, мы в этом поднаторели основательно и потому к таким задачам всегда готовы. На этот раз заказчики выбрали нас для решения скорее исследовательских задач, где требуется кропотливое восстановление каждого документа с максимальной точностью.

Читать полностью »

ABBYY: экологичность++Отмечаемый сегодня День без бумаги — событие, мимо которого ABBYY пройти просто не может. Почему? Потому что у нас есть OCR, без которого немыслимы СЭД. Потому что мы организуем DocFlow. Да и вообще, большей части сотрудников не всё равно. Правда, подтвердить это можно только скриншотами с внутреннего форума, но их здесь не будет. А ещё здесь не будет рассказов о том, что средний офисный работник изводит на свои офисно-работниковские задачи около 10к страниц в год. И даже о том, что 45% этих документов становятся не нужными на следущий день.

Зато здесь будет рассказ о том, что компания не только рассказывает про заботу об экологии, но и сама по возможности придерживается правильных принципов.
Читать полностью »

List of files Иногда вам приходится делать не только красивые, но и полезные фотографии — например, если вы хотите сохранить стихотворение, написанное в кафе на салфетке, или главу из учебника, который есть только в библиотеке. Все это можно фотографировать на телефон и сразу сохранять на мобильный Яндекс.Диск.

Чтобы документы лучше читались и были больше похожи на отсканированную копию, удобную для чтения, а не на художественное фото, вы можете воспользоваться приложением ABBYY FineScanner, новая версия которого с поддержкой Яндекс.Диска сегодня появилась в AppStore.

ABBYY FineScanner поможет быстро и качественно оцифровать самые разные документы: счета, страховые свидетельства, договоры, слайды презентаций и многое другое. Прямо из приложения вы можете сохранить данные в формате PDF на Яндекс.Диск — и они сразу же станут доступны на любом вашем устройстве, подключенном к интернету. Для этого надо просто настроить учетную запись Диска в настройках приложения FineScanner.

Читать полностью »

Электронный словарь сегодня стал одним из основных инструментов переводчика, наряду с браузером, оцифрованными справочниками и базами соответствий (последнее важно в основном лишь для переводчиков нехудожественных текстов).

Среди электронных словарей ABBY Lingvo отличается одной ключевой особенностью: полнотекстовым поиском с индексацией. Что-то похожее можно реализовать при помощи индексов в Adobe Acrobat, но удобство интерфейсов именно в словарной области не подлежит сравнению.

ABBY Lingvo давно уже превратился из обычного словаря в универсальный агрегатор источников. Вдобавок к титанической работе фирмы-создателя, энтузиастами оцифрованы в формат Lingvo сотни пособий, в том числе и основные двуязычные, и огромные многотомные толковые словари серий Cambridge, Collins, Longman, Merriam-Webster, Oxford, и энциклопедические словари вроде Британики. Созданы локальные копии сетевых гигантов (Википедий, Викисловарей, Urban Dictionary и так далее). И при обычном использовании это предоставляло бы исключительные возможности. Но при полнотекстовом поиске всё это богатство превращается ещё и в языковые корпусы и базы соответствий. Значение такого поиска при переводах сложных терминов, устойчивых словосочетаний, фразеологизмов трудно переоценить.

С каждым выпуском ABBY расширяет допустимые границы компилируемых словарей и поисковых индексов. Уже сейчас можно скомпилировать словарь размером почти в 2 гигабайта исходного текста. Однако при подключении большого количества словарей индекс разрастается. И сами словари на диске, и поисковый пользовательский индекс также могут достигать гигабайтных размеров. При этом полнотекстовый поиск замедляется, на него начинает влиять скорость работы винчестеров. Эпоха развития SSD может помочь в решении этой проблемы, но пока эти механизмы ещё не используются повсеместно из-за большей цены и меньшей износоустойчивости. К счастью, есть способ, по приросту скорости выигрывающий даже у SSD. Читать полностью »

ABBYY FineScanner: iPhone вместо сканера
Недавно наш мобильный департамент выпустил новое приложение для iPhone – называется ABBYY FineScanner. Программа умеет делать очень простую, но нужную вещь – фотографировать документы и обрабатывать фотографии так, чтобы получившиеся электронные копии (по сути – сканы) были удобны для работы – чтения, печати или хранения/пересылки в удобочитаемом виде. Это может пригодиться, если вам, например, нужно переслать скан нескольких страниц загранпаспорта в турагентство или загрузить в Dropbox расписание уроков ребенка – чтобы все члены семьи были в курсе.

Вы спросите, почему бы это не делать просто фотокамерой iPhone? Ответ – потому что она не умеет находить края страницы, исправлять трапециевидные искажения и улучшать качество изображения. Кстати, объединять несколько фотографий в многостраничные PDF-файлы она тоже не может. О том, как всё это делает FineScanner, под катом.Читать полностью »

Последние несколько месяцев анализаторы надежности паролей попадаются мне чуть ли не в каждой форме регистрации в Интернете. В этой области сегодня наблюдается особенно бурный рост.
Программа zxcvbn: реалистичная оценка надежности пароля
Вопрос только в том, действительно ли такая программа помогает защитить учетную запись пользователя? Этот аспект интернет-безопасности, конечно, не настолько важен, как некоторые другие, например:

  • предотвращение взлома веб-страниц за счёт нарастающей задержки или использования CAPTCHA;
  • предотвращение офлайн-взлома путем применения достаточно медленной хеш-функции с индивидуализированной на уровне пользователя «солью»;
  • защита хешей паролей.

Читать полностью »

imageДавайте ненадолго заглянем в Мексику, где живёт и творит «Оксфорд Южной Америки» — издательство Ediciones Larousse Mexico. Эти замечательные люди с инстинктом первопроходцев подарили латиноамериканскому миру справочники, словари и кулинарные книги – всё на испанском языке. Недавно они пошли ещё дальше и наколдовали четыре словарных приложения на базе нашего движка ABBYY Lingvo Dictionaries for iOS, так что теперь владельцы яблочных девайсов с берегов двух Америк могут batir tambores и bailar la rumba. А мы расскажем, что это за софт и чего он умеет. Читать полностью »

Business Card Reader 2.0 для Android — теперь со своей визитницей В начале месяца получил обновление до версии 4.99 Business Card Reader для iPhone, а буквально на днях вышла вторая версия приложения для устройств на платформе Android.

Самое заметное изменение в обновлённом приложении – это появление «визитницы» (она не нова для BCR в принципе: ее преимущества уже успели оценить обладатели iPhone). Визитница дает возможность сохранять распознанные визитки в специальном архиве приложения, а при желании перенести их в адресную книгу устройства.

Достоинство визитницы в том, что в ней пользователь хранит детальную информацию о контактах, включая изображение визитки, не перегружая адресную книгу и не смешивая деловые и личные контакты. Например, это очень удобно для менеджеров по продажам, которые могут собрать до 100 визиток на одном мероприятии. Вместе с визитницей в новом BCR появилась возможность редактировать данные прямо в приложении, обмениваться визитками и контактами по почте или СМС и найти офис в Google Maps или на Яндекс.Картах.
Читать полностью »

«Диалог 2012»: соревнования по анализу тональности текстов и конкурс синтаксических анализаторов В прошлом году мы довольно подробно писали про международную конференцию по компьютерной лингвистике «Диалог», одним из основных организаторов которой является наша компания. Конференция нынешнего года была примечательна тем, что на ней были подведены итоги сразу двух соревнований между системами автоматического анализа текста. За подробностями добро пожаловать под кат.

Читать полностью »

ABBYY открывает две кафедры компьютерной лингвистики Как знают наши постоянные читатели, ABBYY не только выпускает программные продукты, но и много лет занимается научными исследованиями в области компьютерной лингвистики, без которых эти продукты не могли бы появиться. Мы также ежегодно проводим международную конференцию «Диалог» (подробно о ней – здесь). А недавно наша компания открыла кафедры компьютерной лингвистики в двух московских вузах – в Институте лингвистики РГГУ (совместно с IBM) и на факультете инноваций и высоких технологий МФТИ.

У ABBYY уже есть позитивный опыт обучения студентов: на базе МФТИ шесть лет работает наша кафедра распознавания изображений и обработки текста, а многие из ее выпускников успели сделать неплохую карьеру в компании. Поэтому мы надеемся, что с подготовкой компьютерных лингвистов у нас тоже получится.
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js