Рубрика «распознавание» - 4

image

Поиск текста в изображениях — достаточно популярная функция Evernote. Мы бы хотели рассказать, как она работает и ответить на некоторые частые вопросы.

Как происходит обработка изображений

Когда в процессе синхронизации заметка отправляется в Evernote, любые ресурсы, включенные в эту заметку, с MIME-типами PNG, JPG или GIF пересылаются на отдельный набор серверов, занятых исключительно распознаванием текста во вложенных изображениях и возвращением найденных результатов. Эти результаты добавляются в заметку в виде скрытого (точнее не видимого при просмотре заметки) набора метаданных под названием recoIndex. Весь recoIndex можно посмотреть, если экспортировать заметку в файл ENEX.

Например, вот старая заметка в одном из наших аккаунтов со снимком пивной бутылки.
Читать полностью »

image

Специалист по информационной безопасности Ян Крисслер, также известный как Starbug, на прошедшей в Гамбурге конференции Chaos Computer Club, сделал доклад, из которого следует, что ему удалось получить отпечаток большого пальца министра обороны Германии Урсулы фон дер Лайен при помощи фотографии, сделанной обычной фотокамерой, и пользуясь общедоступным программным обеспечением. Крисллер известен тем, что ему удалось обмануть систему идентификации TouchID в iPhone 5S по прошествии 48 часов после выхода смартфона в продажу.
Читать полностью »

Весной администрация хабра любезно предоставила нам блог, чтобы мы рассказали о нашем экзерсисе с распознаванием номеров. Всё поддержание этой системы делалось просто из интереса и на энтузиазме, зато позволило пообщаться с интересными людьми, некоторым людям помочь, а самим найти подработку по совершенно другим тематикам.

И ещё раз про распознавание номеров - 1

В любых задачах обработки изображений 90% успеха — хорошая база данных. Репрезентативная и большая. Весной мы обещали выложить полную базу изображений того, что нам придёт. Подписка блога заканчивается, поэтому время выполнить обещание (блог может продлят, а может и нет). Наш сервер работал 95% времени, начиная с первого поста. Всё что пришло теперь доступно + мы сделали отдельные базы по вырезанным номерам и нарезанным символам.

Под катом ссылки на базу + её анализ + немного кода + небольшой рассказ о том, что будет сделано дальше с нашим сервером/жизнью проекта.
Читать полностью »

Рушим капчу SilkRoad 2.0

Эта статья является продолжением моего предыдущего топика. Вы просили, и я публикую.

Для начала: я был крайне удивлен, что код из первой статьи действительно побеждал капчу SilkRoad. Люди реально стали интересоваться темным интернетом, и, как Вы знаете, появился SillRoad 2.0 после закрытия первого его товарища (хотя второй, тоже недавно был закрыт). О взломе капчи мы поговорим с Вами под катом. Читать полностью »

Нередко бизнес-процесс компании включает в себя необходимость обработки документации, содержащей штрих-коды, с последующим занесением их в некую учетную систему. Это актуально, например, для сферы ЖД-перевозок и авиакомпаний: в штрих-код купона, присылаемого на электронную почту агентами компании, зашиты номера билетов. Операционисты вынуждены ежедневно обрабатывать и заносить во внутреннюю учетную систему тысячи таких купонов.

Работа рутинная, человеческий фактор провоцирует ошибки. Как автоматизировать процесс и избавить оператора от необходимости ручной обработки писем и их вложений? Мы нашли простое решение с использованием MS SharePoint. По своему обыкновению, мы постарались по максимуму задействовать имеющийся функционал систем, существующую библиотеку и немного своей программистской магии:)

Читать полностью »

Французская компания Spotter разработала инструмент, который, по их словам, способен идентифицировать сарказм в комментариях в Интернете.

imageСозданная программная платформа сканирует социальные медиа и другие интернет-источники для создания отчетов о репутации своих клиентов — среди которых есть Европейская комиссия, Air France и другие крупные заказчики. Как и большая часть подобного ПО, приложение занимается анализом семантики, лингвистики и эвристики. Однако, как и любая другая система с машинным анализом данных, их инструмент часто испытывает проблемы с такими тонкими частями человеческой речи, как сарказм и ирония — и, вроде бы, как раз эту проблему Spotter и удалось преодолеть — пусть их руководители и признают, что результат пока что далек от идеального, и что полностью доверять машине еще рано. Процент распознавания составляет уже примерно 50%, и, по заявлению авторов, еще несколько лет назад даже подобный результат был немыслим.
Читать полностью »

Привет!

Минула волна постов про редизайн новой версии ОС, и теперь самое время дожидаться первых постов про изменения для нас, разработчиков. Не так давно на портале macrumors появилась информация об очередном нововведении.
С выпуском второй беты для семёрки apple добавили новую функцию, которая позволит разработчикам получить доступ к обнаружению и распознаванию мимики на фотографиях пользователей. Ранее многие могли заметить, что теперь можно использовать зум во время съёмки видео.
Читать полностью »

Три месяца назад ко мне обратился хороший товарищ и коллега по работе с просьбой написать небольшую программу для проведения психологического тестирования. Я, до этого писавший исключительно для мелких нужд офисной автоматизации на vba, vb, vb.net, решил воспользоваться моментом и за время проекта подучить C#. К слову, проект простой, всего 5 психодиагностических методик. Позже оказалось, что мечта его — система распознавания бланков этих методик. Ситуация усложнилась. Стало понятно, что основное количество времени я потрачу на распознавание.
Читать полностью »

Сегодня прочитал пост с многообещающим названием «Как мы к этому пришли: современные смартфоны и их перспективы» http://habrahabr.ru/post/151987/#habracut
Прочитал с интересом, но захотелось чего-то большего. Уж если говорить о перспективах смартфонов, то не ограничиваться обсуждением ОС, а рассмотреть более фундаментальные вопросы: функциональность гаджета и технологии, которые эту функциональность обеспечивают, то есть «железо». Как говорится, были бы кости (железо), а мясо (ОС и приложения) нарастет.

Читать полностью »

Разработка комплексной автоматизированной системы, целью которой является автоматизация механизма контроля доступа на основании системы распознавания номерных знаков, сложная и, несомненно, комплексная задача. Для ее решения, в рамках квалификационной работы на степень бакалавра, мне потребовался не один месяц, и не одна сотня чашек чая.
Сегодня посмотрим на алгоритм и результаты решения локальной задачи по созданию шрифта в векторном формате согласно нормативной документации для отображения эталонов символов при корреляционном распознавании. На первом этапе углубимся в суть решаемой задачи.
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js