Рубрика «распознавание символов»

Ян Лекун, создатель LeNet, формата DjVu и адвокат опенсорса

2025-05-05 в 9:01, admin, рубрики: cnn, CRF, deepseek, djvu, DWT, GTN, jpeg2000, lenet, llama, llm, Lush, ocr, PDF, ruvds_статьи, вейвлет-преобразование, Компьютерное зрение, машинное зрение, нейросети, распознавание символов, сверточные нейросети, тест тьюринга, условные случайные поля, Ян Лекун

Ян Лекун, один из крёстных отцов современного ИИ, в своём твиттере резко критикует корпоративных исследователей ИИ, которые ведут проприетарные разработки и занимаются «нагнетанием страха». Среди этих людей называются Сэм Альтман (OpenAI), Демис Хассабис (Google DeepMind) и Дарио Амодеи (Anthropic)

Ян Лекун (Yann LeCun) — французский и американский учёный в области машинного обучения и компьютерного зрения. Известен как автор легендарной системы LeNet (1989 г.), где одним из первых начал применять методы биологических нейронных сетей для оптического распознавания символов (OCR).

Сейчас занимает должность вице-президента и ведущего исследователя ИИ в корпорации Meta (руководит разработкой опенсорсной языковой модели LLaMA, в том числе). При этом остаётся ярым приверженцем опенсорса, свободной науки и научно-технического прогресса человечества.Читать полностью »

Распознавание символов методом наименьшего расстояния Левенштейна

2020-02-17 в 10:52, admin, рубрики: java, Программирование, распознавание символов, расстояние Левенштейна

В последнее время задача распознавания символов в прикладных программах не представляет особой сложности — можно использовать множество готовых OCR-библиотек, многие из которых доведены почти до совершенства. Но все же иногда может возникнуть задача разработать свой алгоритм распознавания без использования сторонних «навороченных» OCR-библиотек.

Именно такая задача возникла у меня по ходу работы, а причин, почему лучше не использовать готовые библиотеки, несколько: закрытость проекта, с его дальнейшей сертификацией, определенное ограничение на количество строчек кода и размер подключаемых библиотек, тем более что по предметной области распознавать приходится достаточно определенный набор символов.

Читать полностью »

Хакер жалуется на полицию: его автомобиль с номерным знаком NULL получил штрафов более чем на $12 000

2019-08-14 в 14:20, admin, рубрики: null, ненормальное программирование, обработка изображений, распознавание символов, Тестирование IT-систем, Тестирование веб-сервисов, штрафные квитанции

Её дочь зовут Помогите! Меня заставляют подделывать паспорта

Специалист по безопасности под ником Droogie решил, что на его новом автомобильном номере должно быть написано NULL. В основном ради шутки, но был и скрытый смысл. Он надеялся, что благодаря такому хаку сможет избежать штрафов за превышение скорости (по понятной причине). Вышло совсем наоборот, о чём исследователь рассказал на хакерской конференции DEF CON 2019 в своём выступлении 11 августа.
Читать полностью »

Оптическое распознавание символов на микроконтроллере

2017-06-15 в 7:26, admin, рубрики: arduino, esp8266, ocr, Алгоритмы, Компьютерное зрение, обработка изображений, Программирование, программирование микроконтроллеров, Разработка для интернета вещей, распознавание символов

Оптическое распознавание символов на микроконтроллере - 1

На сегодняшний день оптическое распознавание символов является частью решения таких прикладных задач, как распознавание и оцифровка текстов, распознавание документов, распознавание автомобильных номеров, определение номеров банковских карточек, чтение показаний счетчиков учета, определения номеров домов для создания карт (Google Street View) и т.д.
Распознавание символа означает анализ его изображения с целью получения некоторого набора признаков для сравнения их с признаками класса [ 1 ]. Выбор такого набора и способы его определения отличают разные методы распознавания, но для большинства из них необходима одномоментная информация обо всех пикселях изображения.
Последнее обстоятельство и достаточно большой объем вычислений делают невозможным использования маломощных вычислительных устройств (микроконтроллеров) для оптического распознавания символов. «Да и зачем?» — воскликнет информированный читатель, «мощности вычислительных устройств постоянно растут, а их цена падает!»[2, 3]. Допустим, что ответ будет такой: просто интересно, возможно ли упростить метод распознавания до такой степени, чтобы можно было бы использовать микроконтроллер?Читать полностью »

Рунический процессинг

2013-04-01 в 7:03, admin, рубрики: ABBYY, success stories, Блог компании ABBYY, обработка изображений, распознавание символов, метки: ABBYY, success stories, распознавание символов

Добрый день, уважаемые читатели.

Наверное, вы хотите услышать от нас бравурную success-story внедрения наших облачных технологий. Разочарую – сегодня речь пойдёт о делах более чем земных, но не становящихся от этого менее интересными. Я попробую рассказать вам об амбициозном проекте процессинга рунических документов, получаемых из разных источников. К примеру, вот таких:

В этом проекте мы столкнулись с необычными задачами не только для систем распознавания, синтеза текста и DA (document analysis – так у нас называют часть FineReader’а, отвечающую за выделение текстовых областей), но и для обработки изображений и экспорта.

Наша компания выступила в этом проекте не в совсем привычной для себя роли. Обычно наши технологии используются для потокового ввода документов, мы в этом поднаторели основательно и потому к таким задачам всегда готовы. На этот раз заказчики выбрали нас для решения скорее исследовательских задач, где требуется кропотливое восстановление каждого документа с максимальной точностью.

Читать полностью »

Построение системы оптического распознавания структурной информации на примере Imago OCR

2013-03-13 в 19:04, admin, рубрики: open source, opencv, Алгоритмы, бинаризация, векторизация, машинное обучение, обработка изображений, распознавание символов, химия, метки: opencv, бинаризация, векторизация, машинное обучение, распознавание символов, химия

Построение системы оптического распознавания структурной информации на примере Imago OCR В настоящей заметке я расскажу о том, как можно построить систему оптического распознавания структурной информации, опираясь на алгоритмы, применяющиеся в обработке изображений и их реализации в рамках библиотеки OpenCV. За описанием системы стоит активно развивающийся open source проект Imago OCR, который может быть непосредственно полезен в распознавании химических структур, однако в заметке я не буду говорить о химии, а затрону более общие вопросы, решение которых поможет в распознавании структурированной информации различного рода, например таблицы или графики.
Читать полностью »

Распознавание рукописных символов с использованием Python и scikit

2013-03-05 в 14:00, admin, рубрики: data mining, kaggle, python, Песочница, распознавание символов, метки: data mining, kaggle, python, распознавание символов

Привет. Наверняка многие интересуются методами машинного обучения и решения различных задач, которые обычными подходами не решаются. Недавно мне посчастливилось попасть на курс Data Mining, организованный в рамках программы GameChangers. Первым же домашним заданием было сделать сабмит на Kaggle — решить задачу Digit Recognizer.
Читать полностью »

Информация

Комментарии

Рекомендуем