Рубрика «ocr» - 2
Как мы создавали технологию валидации печатей
2025-06-26 в 16:00, admin, рубрики: contentcapture, ocr, валидация, обработка изображенийГенератор синтетических документов для обучения моделей ИИ
2025-06-20 в 13:55, admin, рубрики: ocr, распознавание документов, синтетические данныеГде взять пару миллионов документов с разметкой для обучения модели ИИ? Сгенерировать синтетически! Меня зовут Никита, я работаю в ИСП РАН и веду блог по ИИ. Выложил в открытый доступ проект, который поможет дата-саентистам самостоятельно создавать датасеты сканированных документов с разметкой, используя только CPU. Подойдет для предобучения мультимодальных трансформеров, OCR и проч.
Кратко:
-
Генератор создает синтетические PNG-картинки сканированных документов с разметкой. Ссылка на гитхаб
-
Язык текста: можно выбрать.
- Читать полностью »
Автоматизация без кода: как FastML справляется с документами за несколько кликов
2025-05-29 в 15:15, admin, рубрики: contentcapture, ocr, распознавание изображений
Привет!
В этом посте хотим рассказать, как технология FastML (о самой разработке уже рассказывали здесьЧитать полностью »
Рукописный редактор на Python: инструкция для тех, кто хочет «рисовать» код
2025-05-19 в 8:52, admin, рубрики: javascript, ocr, OCR-технологии, python, selectel, распознавание текста
Привет, меня зовут Лёня! Я автор YouTube‑канала eleday о программировании на Python. Недавно в школе была проверочная работа и мне пришлось писать код на бумаге. Такой подход показался странным: все-таки программа может исполняться только на компьютере и логично набирать ее там же. Подобная цепочка рассуждений привела к интересной идее — редактору рукописного ввода. В этой статье расскажу о задумке и деталях ее реализации. Создадим виртуальный лист, на котором можно набросать код от руки — и он будет исполняться!Читать полностью »
Как декомпозиция повышает точность распознавания текста: опыт с фотографиями СТС
2025-05-14 в 13:16, admin, рубрики: fullstack разработка, ocr, OCR-технологии, декомпозиция задач, компьтерное зрение, распознавание документов, Распознавание текста на фото, СТСПривет! Меня зовут Наталия Вареник, я DS-инженер в Авито, занимаюсь моделями распознавания изображений. Расскажу про один из наших проектов — пайплайн для распознавания номеров с фотографии свидетельства транспортного средства (СТС). В статье описала особенности задачи и рассказала, как мы решали её с помощью декомпозиции.
Материал будет полезен начинающим и мидл-DS-инженерам, которые хотят узнать больше про декомпозицию задачи на этапах разметки и построения моделей.
Ян Лекун, создатель LeNet, формата DjVu и адвокат опенсорса
2025-05-05 в 9:01, admin, рубрики: cnn, CRF, deepseek, djvu, DWT, GTN, jpeg2000, lenet, llama, llm, Lush, ocr, PDF, ruvds_статьи, вейвлет-преобразование, Компьютерное зрение, машинное зрение, нейросети, распознавание символов, сверточные нейросети, тест тьюринга, условные случайные поля, Ян Лекун
Ян Лекун (Yann LeCun) — французский и американский учёный в области машинного обучения и компьютерного зрения. Известен как автор легендарной системы LeNet (1989 г.), где одним из первых начал применять методы биологических нейронных сетей для оптического распознавания символов (OCR).
Сейчас занимает должность вице-президента и ведущего исследователя ИИ в корпорации Meta (руководит разработкой опенсорсной языковой модели LLaMA, в том числе). При этом остаётся ярым приверженцем опенсорса, свободной науки и научно-технического прогресса человечества.Читать полностью »
Решалка судоку: сам не представляю, как она у меня получилась
2025-04-23 в 14:05, admin, рубрики: ocr, OCR-технологии, timeweb_статьи_перевод, игры, искусственный интеллект, логика, математика, нейросети, судокуВ этой статье мы разберём, как написать программу для решения судоку. Предполагается, что ранее читатель не пробовал алгоритмически решать судоку, тем более — с применением нейронных сетей.
Я легко увлекаюсь. Мои пристрастия меняются, но сейчас на первых ролях — многопользовательские партии в Call of Duty: Modern Warfare 3 и судоку. Что касается второй — мне нравится, как она разгружает мне голову и умиротворяет меня. Здесь только вы, числа и достаточно очевидные стратегии, позволяющие выиграть.
Телеграм бот для быстрого распознавания текста на фото с помощью Mistral OCR
2025-03-25 в 12:41, admin, рубрики: AI, bot, ocr, telegramИногда надо что-то быстро оцифровать - время работы магазина с его таблички, визитную карточку, квитанцию почтового отправления. Приходится делать фотографию, которая потом теряется в куче других фотографий, и не может быть найдена по контексту.
Идея - сделать фото, перевести в текст, сразу отформатировать/обработать/перевести как надо и сохранить уже куда хочешь - в Telegram избранное, Google Keep, Google Контакты, Obsidian и т.д. И чтоб всё было быстро и удобно.
Так появился Argus Читать полностью »
Распознавание день в день: как настроить шаблон нового документа без программирования
2025-03-05 в 13:47, admin, рубрики: ocr, OCR-технологии, smart engines, дизайнер, документы, искусственный интеллект, настройка формы, распознавание изображений, распознавание образовПривет! Вы прекрасно знаете, что мы в Smart Engines непрерывно совершенствуем наши системы распознавания российского паспорта и других документов. Вместе с этим мы постоянно расширяем список документов, которые могут быть распознаны при помощи наших решений, – и будем делать это и дальше. Но что если бизнесу нужно оперативно настроить распознавание нового корпоративного документа с жесткой структурой? Сегодня такая потребность есть практически у любой организации.
Как мы переманили пользователей удобным сервисом платежей
2024-10-30 в 9:31, admin, рубрики: machine learning, ml, ocr, qr, Компьютерное зрение, машинное обучение, обработка изображенийВсем привет! Меня зовут Александра Пилюгина, я продакт-менеджер команды «QR и Фотоплатеж» в управлении «Платежи», банк ВТБ. К нам каждый месяц приходит около 500 тысяч новых клиентов. Специально для них наша команда разработала сервис переноса платежей в ВТБ Онлайн, попутно решив множество проблем с распознаванием платежных документов и извлечения из них полезной информации.

