Рубрика «распознавание» - 2

Smart IDReader SDK — как написать Telegram-бота на Python для распознавания документов за 5 минут

2017-12-20 в 3:54, admin, рубрики: github, ocr, open source, python, SDK, smart idreader, Блог компании Smart Engines, обработка изображений, Программирование, распознавание, распознавание банковских карт, распознавание изображений, распознавание паспорта

Мы, Smart Engines, продолжаем цикл статей про то, как встроить наши технологии распознавания (паспортов, банковских карт и других) в ваши приложения. Ранее мы уже писали про встраивание на iOS и Android, а сегодня мы расскажем про то, как работать с Python-интерфейсом библиотеки распознавания Smart IDReader и напишем простого Telegram-бота.

Кстати, список поддерживаемых нами языков программирования расширился и теперь включает C++, C, C#, Objective-C, Swift, Java, Python, а также такие эзотерические языки, как Visual Basic и, разумеется, PHP. Как и раньше, мы поддерживаем все популярные и многие непопулярные операционные системы и архитектуры, а наши бесплатные приложения доступны для скачивания из App Store и Google Play.

По традиции, демо-версия Smart IDReader SDK для Python вместе с исходным кодом реализации Telegram-бота выложены на Github и доступны по ссылке.

Читать полностью »

Smart IDReader SDK — как добавить распознавание в iOS приложение за 5 минут — теперь и на Github

2017-05-29 в 6:53, admin, рубрики: github, iOS, ocr, SDK, smart idreader, Блог компании Smart Engines, обработка изображений, Программирование, разработка мобильных приложений, разработка под iOS, распознавание, распознавание банковских карт, распознавание изображений, распознавание паспорта, метки: smart idreader

Smart IDReader SDK — как добавить распознавание в iOS приложение за 5 минут — теперь и на Github - 1

Ранее мы, Smart Engines, уже писали про наши технологии распознавания (паспорта РФ, банковских карт и многих других). Основной ценностью SDK является "ядро" или "движок" распознавания Smart IDReader, который объединяет функциональность сканирования всего, что мы умеем сканировать, под единым интерфейсом.

Библиотека распознавания написана на С++ для достижения максимальной производительности, но для использования с различными языками программирования у нас есть версии интерфейсов библиотеки на C++, C, C#, Objective-C, Java и даже Visual Basic. Мы поддерживаем все популярные операционные системы: iOS, Android, Windows, Linux, MacOS, Solaris и, разумеется, Эльбрус и AstraLinux. Наши алгоритмы оптимизированы под такие архитектуры, как ARMv7-v8, AArch64, x86, x86_64, SPARC, E2K.

Мы решили выложить демо-версию нашего SDK на Github, чтобы вы могли ознакомиться с интерфейсом библиотеки (как Objective-C часть, так и C++), почитать документацию и попробовать встроить Smart IDReader в ваше приложение. Репозиторий с демо-версией Smart IDReader iOS SDK доступен по ссылке: https://github.com/SmartEngines/SmartIDReader-iOS-SDK

Чтобы посмотреть, как Smart IDReader выглядит в нашем исполнении после встраивания, вы можете скачать бесплатные полные версии приложений из App Store и Google Play.

В этой статье мы расскажем, как iOS разработчик может использовать наши технологии для добавления функциональности распознавания документов в своё приложение.

Читать полностью »

Многорукий бандит в задаче поиска объектов в видеопотоке

2017-05-16 в 8:32, admin, рубрики: viola jones, Алгоритмы, Блог компании Smart Engines, видеопоток, машинное обучение, многорукий бандит, обработка изображений, Программирование, распознавание

Drawing На Хабре уже неоднократно затрагивалась тема применения так называемых “бандитов” для интеллектуального анализа данных. В отличии от уже привычного обучения машин по прецедентам, которое сплошь и рядом применяется в задачах распознавания, многорукий бандит применяется для построения в некотором смысле “рекомендательных” систем. На Хабре уже очень подробно и доступно рассказано о идее многорукого бандита и применимости ее к задаче рекомендации интернет-контента. Мы же в своем очередном посте хотели рассказать вам о симбиозе обучения по прецедентам и обучения с подкреплением в задачах распознавания видеопотока.
Читать полностью »

Магические жесты как вызов для электронщика

2017-05-09 в 21:51, admin, рубрики: ведьмак, Железо, Интернет вещей, научная фантастика, Носимая электроника, Производство и разработка электроники, производство электроники, распознавание, ролевые игры, ролевые игры живого действия

Волшебная палочка — это круто, но куда круче творить волшебство просто движением рук. Чтобы это стало возможным, в 2014 году мы занялись распознаванием жестов и сделали перчатку на акселерометрах для ролевой игры. Проект получился сложным и с далеко идущими последствиями.

Магические жесты как вызов для электронщика - 1
Читать полностью »

Сегментация текстовых строк документов на символы с помощью сверточных и рекуррентных нейронных сетей

2017-05-04 в 10:16, admin, рубрики: ocr, Алгоритмы, Блог компании Smart Engines, машинное обучение, нейронные сети, обработка изображений, Программирование, распознавание, распознавание паспорта, рекуррентные сети, свёрточные сети, сегментация

Сегментация строки на символы является одним из важнейших этапов в процессе оптического распознавания символов (OCR), в частности, при оптическом распознавании изображений документов. Сегментацией строки называется декомпозиция изображения, содержащего последовательность символов, на фрагменты, содержащие отдельные символы.

Важность сегментации обусловлена тем обстоятельством, что в основе большинства современных систем оптического распознавания текста лежат классификаторы (в том числе — нейросетевые) отдельных символов, а не слов или фрагментов текста. В таких системах ошибки неправильного проставления разрезов между символами как правило являются причиной львиной доли ошибок конечного распознавания.

Поиск границ символов усложняется из-за артефактов печати и оцифровки (сканирования) документа, приводящим к “рассыпанию” и “склеиванию” символов. В случае использования стационарных или мобильных малоразмерных видеокамер спектр артефактов оцифровки существенно пополняется: возможны дефокусировка и смазывание, проективные искажения, деформирование и изгибы документа. При съемке камерой в естественных сценах на изображениях часто возникают паразитные перепады яркости (тени, отражения), а также цветовые искажения и цифровой шум в результате низкой освещенности. На рисунке ниже показаны примеры сложных случаев при сегментации полей паспорта РФ.

Сегментация текстовых строк документов на символы с помощью сверточных и рекуррентных нейронных сетей - 1

В этой статье мы расскажем о методе сегментации символов текстовых строк документов, разработанном нами в Smart Engines, основанный на обучении сверточных и рекуррентных нейронных сетей. Основным рассматриваемым в работе документом является паспорт РФ.
Читать полностью »

Оптимизация кода для платформы Эльбрус на простых примерах

2016-12-15 в 7:17, admin, рубрики: c++, ELBRUS, sparc, Алгоритмы, Блог компании Smart Engines Ltd., МЦСТ, обработка изображений, оптимизация кода, Программирование, распознавание, распознавание изображений, распознавание паспорта, Эльбрус

"Обычно хакер пишет программы не ради выгоды,
а ради собственного удовольствия. Такая программа
может оказаться полезной, а может остаться
всего лишь игрой интеллекта."
Генри С. Уоррен. Алгоритмические трюки для программистов [1]

Сегодня мы продолжим наши заметки об Эльбрусе. Первую статью, посвященную запуску и оптимизации системы распознавания паспорта, можно прочитать тут.

Однажды мы с коллегами заинтересовались, как самые простые методы оптимизации работают на Эльбрусе.

Читать полностью »

Как мы отличали тележку от прораба — видеоаналитика для кассовой зоны гипермаркета (и продолжение про кота-терминатора)

2016-11-03 в 6:59, admin, рубрики: Блог компании КРОК, видео, видеонаблюдение, длина, ит-инфраструктура, кот, магазин, очередь, покупатели, попался, раскривушка шайтанама, распознавание, системное администрирование, стройматериалы

В одном строительном гипермаркете есть 18 касс, и надо уметь делать так, чтобы кассиры открывали их вовремя, чтобы очередь не была больше 4 человек. Ну, и чтобы лишние кассы не простаивали открытыми. Это распознавание людей (подсчёт покупателей) с видео, аналитика по погоде и другим факторам и предсказание потока. Плюс много другой забавной статистики.

Как мы отличали тележку от прораба — видеоаналитика для кассовой зоны гипермаркета (и продолжение про кота-терминатора) - 1
Пример очереди перед кассой — картинка обрезанная и замыленная по просьбе безопасников, по факту очередь мы видим длиннее, чем на фото.

В рознице первым вопросом стало то, как отличить прораба от тележки. И это было ничуть не смешно.

Да, и тем, кто переживал за кота-терминатора из прошлого поста — его поймали. Детали в конце.Читать полностью »

Распознавание цифр на микроконтроллере

2016-08-29 в 8:06, admin, рубрики: arduino, diy или сделай сам, OCR-технологии, Интернет вещей, Компьютерное зрение, программирование микроконтроллеров, распознавание, распознавание цифр

Как видно из названия речь в этой статье пойдет о распознавании цифр на микроконтроллере. Сразу хочу оговориться, что в данной статье не будет приведен исходный код, рассматриваться технология или алгоритм распознавания, скажу лишь, что используются идеи системного подхода. Некоторые из них изложены в наших статьях (здесь, здесь и вот здесь). Это связано с тем, что наш подход тянет на оригинальность, но требует уточнения некоторых вопросов. Кто-то может сказать: «очередная статья про программирование микроконтроллеров». Отнюдь нет, поиск подобных проектов не дал каких-то внятных результатов, за исключением этого видео. Из обсуждений на форумах понятно одно: идея получения подобного устройства (камера + микроконтроллер = результат распознавания на выходе, а не просто снятая картинка) приходила многим, но оставалась без реализации. Да и распознавание, по общему мнению, требует много вычислительных ресурсов и микроконтроллеры для этого не подходят, в частности про Arduino были высказывания, что это вообще невозможно. Если стало интересно прошу под кат.

Распознавание цифр на микроконтроллере - 1
Читать полностью »

Распознавание штрих и QR кодов в приложениях UWP

2016-08-24 в 4:59, admin, рубрики: .net, C#, qr, qrcode, uwp, zxing, обработка изображений, разработка под windows, разработка под windows phone, распознавание, штрих коды, Штрих-код, штрихкод

Я не открою Америку, если скажу, что самой популярной библиотекой для распознавания штрихкода является ZXing («Zebra Crossing»). Список поддерживаемых форматов довольно внушителен и включает в себя: EAN-8 и EAN-13, QR Code, UPC-A и UPC-E, Code 39, Code 93, Code 128 и другие.

Есть порт и для WinRT, а значит, библиотеку можно использовать и с универсальной платформой Windows.
Читать полностью »

Идентификация личности по обычной охранной камере: приключения на одной проходной

2016-08-23 в 7:12, admin, рубрики: Блог компании КРОК, видео, видеопоток, воровство, идентификация, ит-инфраструктура, камера, кот, который обожает Баккарди, лицо, распознавание, системное администрирование, СКУД

Идентификация личности по обычной охранной камере: приключения на одной проходной - 1
Фото с объекта нельзя. Это — примерно похожее место на примере КРОК.

Началось всё с кота-терминатора. На начало операции мы знали следующее:

При строительстве здания с крупным продуктовым рабочая бригада завела кота, чтобы он ловил крыс.
После приёмки кот незнамо где заныкался, и уже три или четыре года его никто не видел.
Какая-то сволочь показала ему прямую взаимосвязь между открытым мешком кошачьего корма из торгового зала и появлением корма.
Появлялся он только на камерах — приходил ночью охотиться на мешки, причём как настоящий матёрый охотник, детей и самок не трогал, а брал только жирных самцов, то есть выбирал самые крупные мешки, неожиданно на них прыгал и вскрывал им брюхо.
Ему пробовали на ночь накладывать отдельную миску с кормом, но он был уже далеко не домашним, и отказаться от охоты не мог.
Кроме этого, кот любил крайне дорогой алкоголь: сотрудники догадались списывать на кота бутылки. Мол, уронил, уборщица уже осколки убрала.
Суммарный убыток он приносил примерно на 50–100 тысяч в месяц (да, это будет покруче, чем в нашумевшей истории про единоразовый обед кота на 1000 долларов в аэропорту Владивостока).
За поимку кота уже 4 месяца была награда в 5 тысяч рублей.

Мысль про алкоголь навела нас на идею о том, что стоит для начала проверить, насколько честны сотрудники. Так, слово за слово, мы поставили свою камеру на пункт пропусков в задней части магазина и начали смотреть на тех, кто заходит в здание.

Здесь и нас и операционного директора ждало несколько открытий, согласующихся с русским менталитетом. Когда мы для начала узнали, что происходит, мату главного просто не было предела.Читать полностью »

Информация

Статьи из архивов

Обсуждаемое

Рекомендуем

Рубрика «распознавание» - 2

Smart IDReader SDK — как написать Telegram-бота на Python для распознавания документов за 5 минут

Smart IDReader SDK — как добавить распознавание в iOS приложение за 5 минут — теперь и на Github

Многорукий бандит в задаче поиска объектов в видеопотоке

Магические жесты как вызов для электронщика

Сегментация текстовых строк документов на символы с помощью сверточных и рекуррентных нейронных сетей

Оптимизация кода для платформы Эльбрус на простых примерах

Как мы отличали тележку от прораба — видеоаналитика для кассовой зоны гипермаркета (и продолжение про кота-терминатора)

Распознавание цифр на микроконтроллере

Распознавание штрих и QR кодов в приложениях UWP

Идентификация личности по обычной охранной камере: приключения на одной проходной

Архив

Информация

Статьи из архивов

Обсуждаемое

Рекомендуем

Рубрика «распознавание» - 2

Новости

Актуальные темы

Архив