Рубрика «распознавание текста»

Современные OCR для сложных документов: сравниваем 6 open-source моделей на реальном кошмаре инженера

2025-11-16 в 6:31, admin, рубрики: gemma-3, llm, ocr, paddleocr, qwen3, vlm, мультимодальные модели, распознавание текста

Привет! Каждый, кто хоть раз пытался вытащить данные из скана акта или старого отчета, знает эту боль. Классические OCR-инструменты, вроде старого доброго Apache Tika, отлично справляются с простым печатным текстом, но пасуют перед реальными вызовами: таблицами со сложной вёрсткой, рукописными пометками, мелким курсивом и разными шрифтами в одном документе.

Чтобы не быть голословными, давайте посмотрим на типичный «сложный» документ и что с ним делает Tika.

Читать полностью »

Эффект Даннинга — Крюгера в нейросети. OCR распознавание текста LLM: доверяй, но проверяй

2025-11-01 в 5:21, admin, рубрики: llm, ocr, qwen, когнитивные искажения, распознавание текста

Читать полностью »

«Манускрипт. Распознать нельзя забыть: как мы научили нейросеть читать рукописи XIX века»

2025-10-28 в 20:08, admin, рубрики: ocr, исторические данные, нейросеть, разметка данных, распознавание текста, синтетические данные

Проект реализуется командой: Константин Кожин — руководитель проекта; Павел Шерстнев — ML-инженер; Антон Михалев — ML-инженер; Анна Пятаева — научный руководитель проекта; Владислава Жуковская — специалист по разметке данных; Алина Нуриманова — специалист по разметке данных. Работа ведётся при поддержке гранта (Фонд содействия инновациям, конкурс «Код-ИИ», VII очередь, декабрь 2024 – декабрь 2025).

Manuscript OCR — это open-source проект, опубликованный на GitHub и GitVerse.

Читать полностью »

Как мы научили нейросети читать паспорта: история борьбы с бликами, водяными знаками и кривыми фото

2025-07-03 в 16:03, admin, рубрики: ocr, OCR-технологии, документы удостоверяющие личность, паспорт, паспорта, распознавание изображений, распознавание образов, распознавание текста

Привет!

Читать полностью »

Рукописный редактор на Python: инструкция для тех, кто хочет «рисовать» код

2025-05-19 в 8:52, admin, рубрики: javascript, ocr, OCR-технологии, python, selectel, распознавание текста

Привет, меня зовут Лёня! Я автор YouTube‑канала eleday о программировании на Python. Недавно в школе была проверочная работа и мне пришлось писать код на бумаге. Такой подход показался странным: все-таки программа может исполняться только на компьютере и логично набирать ее там же. Подобная цепочка рассуждений привела к интересной идее — редактору рукописного ввода. В этой статье расскажу о задумке и деталях ее реализации. Создадим виртуальный лист, на котором можно набросать код от руки — и он будет исполняться!Читать полностью »

Модели T-lite и T-pro: training report

2025-03-12 в 14:30, admin, рубрики: llm-модели, распознавание текста, языковые модели

Привет! Я Дима Стоянов, MLE в команде разработки фундаментальных моделей. Мы продолжаем рассказывать о наших моделях T-lite и T-pro. Общие характеристики и результаты бенчмарков описывали в предыдущей публикации. В этой статье раскроем детали предобучения: от подготовки данных до финальных экспериментов, а совсем скоро поделимся особенностями этапа post-training.

Читать полностью »

Адские условия: Самый суровый краш-тест технологии распознавания паспорта

2024-10-04 в 8:21, admin, рубрики: ocr, OCR-технологии, smart engines, документы, Компьютерное зрение, распознавание изображений, распознавание образов, распознавание паспорта, распознавание текста, тест

Как вы знаете, в ситуациях, когда необходимо быстро и безопасно обработать данные паспорта и любых других документов, технологии распознавания Smart Engines творят настоящие чудеса. Качеству и надежности нашей технологии доверяют лидеры цифровой трансформации: госведомства, ведущие банки, аэропорты, промышленность и бизнес. Мы ценим доверие наших клиентов, а для вас, дорогие читатели, решили наглядно показать эффективность наших систем. Так сказать, лучше один раз увидеть, чем сто раз услышать. Летс гоу!

Красиво. Ритмично. Технологично

Читать полностью »

IDP и OCR в вопросах и ответах: Главное, что нужно знать

2024-09-03 в 10:24, admin, рубрики: ocr, ИИ, распознавание, распознавание документов, распознавание номеров, распознавание образов, распознавание объектов, распознавание паспорта, распознавание текста, технологии

Привет! Сегодня прогоним пару телег про то, что из себя представляют IDP и OCR, в чем их принципиальное различие и на чьей стороне правда (и Smart Engines). Без долгих вступлений - погнали!

Скрытый текст

OCR значительно превосходит IDP. И вот почему -

функционирование IDPЧитать полностью »

Создание искусственного датасета для обучения модели с использованием Paddle OCR

2024-08-29 в 4:00, admin, рубрики: paddleocr, tesseract, аугментация данных, искусственный интеллект, Компьютерное зрение, распознавание текста

Привет, коллеги! Продолжаем тему разработки плагина для распознавания иврита с использованием Paddle OCR. В прошлый раз я забыла представиться, сделаю это в этом посте)
Меня зовут Алексей, я руковожу компанией, которая занимается разработкой с применением ИИ-технологий. Сам я тоже погружен в разработку, но больше доверяю это своей команде – нам удалось собрать команду классных профи. Истории из нашей совместной работы я и планирую рассказывать в своем блоге.

Читать полностью »

Создание плагина для распознавания текста на иврите: мой опыт и решения

2024-08-17 в 14:15, admin, рубрики: easyocr, OCR-технологии, paddleocr, python, tesseract ocr, аугментация, искусственный интеллект, распознавание текста

Всем привет! Хочу поделиться недавним проектом, в котором я разрабатывал плагин для распознавания текста на иврите. Задача была непростая, особенно учитывая, что клиент уже пытался использовать Tesseract OCR, но точность распознавания оставляла желать лучшего. В этой статье расскажу о том, с какими трудностями я столкнулся и как их преодолел.

Проблемы с Tesseract OCR

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «распознавание текста»

Современные OCR для сложных документов: сравниваем 6 open-source моделей на реальном кошмаре инженера

Эффект Даннинга — Крюгера в нейросети. OCR распознавание текста LLM: доверяй, но проверяй

«Манускрипт. Распознать нельзя забыть: как мы научили нейросеть читать рукописи XIX века»

Читать полностью »

Как мы научили нейросети читать паспорта: история борьбы с бликами, водяными знаками и кривыми фото

Рукописный редактор на Python: инструкция для тех, кто хочет «рисовать» код

Модели T-lite и T-pro: training report

Адские условия: Самый суровый краш-тест технологии распознавания паспорта

Красиво. Ритмично. Технологично

IDP и OCR в вопросах и ответах: Главное, что нужно знать

Создание искусственного датасета для обучения модели с использованием Paddle OCR

Создание плагина для распознавания текста на иврите: мой опыт и решения

Проблемы с Tesseract OCR