Рубрика «ocr» - 3

Автоматизация без кода: как FastML справляется с документами за несколько кликов

2025-05-29 в 15:15, admin, рубрики: contentcapture, ocr, распознавание изображений

Привет!

В этом посте хотим рассказать, как технология FastML (о самой разработке уже рассказывали здесь Читать полностью »

Рукописный редактор на Python: инструкция для тех, кто хочет «рисовать» код

2025-05-19 в 8:52, admin, рубрики: javascript, ocr, OCR-технологии, python, selectel, распознавание текста

Привет, меня зовут Лёня! Я автор YouTube‑канала eleday о программировании на Python. Недавно в школе была проверочная работа и мне пришлось писать код на бумаге. Такой подход показался странным: все-таки программа может исполняться только на компьютере и логично набирать ее там же. Подобная цепочка рассуждений привела к интересной идее — редактору рукописного ввода. В этой статье расскажу о задумке и деталях ее реализации. Создадим виртуальный лист, на котором можно набросать код от руки — и он будет исполняться!Читать полностью »

Как декомпозиция повышает точность распознавания текста: опыт с фотографиями СТС

2025-05-14 в 13:16, admin, рубрики: fullstack разработка, ocr, OCR-технологии, декомпозиция задач, компьтерное зрение, распознавание документов, Распознавание текста на фото, СТС

Привет! Меня зовут Наталия Вареник, я DS-инженер в Авито, занимаюсь моделями распознавания изображений. Расскажу про один из наших проектов — пайплайн для распознавания номеров с фотографии свидетельства транспортного средства (СТС). В статье описала особенности задачи и рассказала, как мы решали её с помощью декомпозиции.

Материал будет полезен начинающим и мидл-DS-инженерам, которые хотят узнать больше про декомпозицию задачи на этапах разметки и построения моделей.

Читать полностью »

Ян Лекун, создатель LeNet, формата DjVu и адвокат опенсорса

2025-05-05 в 9:01, admin, рубрики: cnn, CRF, deepseek, djvu, DWT, GTN, jpeg2000, lenet, llama, llm, Lush, ocr, PDF, ruvds_статьи, вейвлет-преобразование, Компьютерное зрение, машинное зрение, нейросети, распознавание символов, сверточные нейросети, тест тьюринга, условные случайные поля, Ян Лекун

Ян Лекун, один из крёстных отцов современного ИИ, в своём твиттере резко критикует корпоративных исследователей ИИ, которые ведут проприетарные разработки и занимаются «нагнетанием страха». Среди этих людей называются Сэм Альтман (OpenAI), Демис Хассабис (Google DeepMind) и Дарио Амодеи (Anthropic)

Ян Лекун (Yann LeCun) — французский и американский учёный в области машинного обучения и компьютерного зрения. Известен как автор легендарной системы LeNet (1989 г.), где одним из первых начал применять методы биологических нейронных сетей для оптического распознавания символов (OCR).

Сейчас занимает должность вице-президента и ведущего исследователя ИИ в корпорации Meta (руководит разработкой опенсорсной языковой модели LLaMA, в том числе). При этом остаётся ярым приверженцем опенсорса, свободной науки и научно-технического прогресса человечества.Читать полностью »

Решалка судоку: сам не представляю, как она у меня получилась

2025-04-23 в 14:05, admin, рубрики: ocr, OCR-технологии, timeweb_статьи_перевод, игры, искусственный интеллект, логика, математика, нейросети, судоку

В этой статье мы разберём, как написать программу для решения судоку. Предполагается, что ранее читатель не пробовал алгоритмически решать судоку, тем более — с применением нейронных сетей.

Я легко увлекаюсь. Мои пристрастия меняются, но сейчас на первых ролях — многопользовательские партии в Call of Duty: Modern Warfare 3 и судоку. Что касается второй — мне нравится, как она разгружает мне голову и умиротворяет меня. Здесь только вы, числа и достаточно очевидные стратегии, позволяющие выиграть.

Читать полностью »

Телеграм бот для быстрого распознавания текста на фото с помощью Mistral OCR

2025-03-25 в 12:41, admin, рубрики: AI, bot, ocr, telegram

Иногда надо что-то быстро оцифровать - время работы магазина с его таблички, визитную карточку, квитанцию почтового отправления. Приходится делать фотографию, которая потом теряется в куче других фотографий, и не может быть найдена по контексту.

Идея - сделать фото, перевести в текст, сразу отформатировать/обработать/перевести как надо и сохранить уже куда хочешь - в Telegram избранное, Google Keep, Google Контакты, Obsidian и т.д. И чтоб всё было быстро и удобно.

Так появился Argus Читать полностью »

Распознавание день в день: как настроить шаблон нового документа без программирования

2025-03-05 в 13:47, admin, рубрики: ocr, OCR-технологии, smart engines, дизайнер, документы, искусственный интеллект, настройка формы, распознавание изображений, распознавание образов

Привет! Вы прекрасно знаете, что мы в Smart Engines непрерывно совершенствуем наши системы распознавания российского паспорта и других документов. Вместе с этим мы постоянно расширяем список документов, которые могут быть распознаны при помощи наших решений, – и будем делать это и дальше. Но что если бизнесу нужно оперативно настроить распознавание нового корпоративного документа с жесткой структурой? Сегодня такая потребность есть практически у любой организации.

Читать полностью »

Как мы переманили пользователей удобным сервисом платежей

2024-10-30 в 9:31, admin, рубрики: machine learning, ml, ocr, qr, Компьютерное зрение, машинное обучение, обработка изображений

Всем привет! Меня зовут Александра Пилюгина, я продакт-менеджер команды «QR и Фотоплатеж» в управлении «Платежи», банк ВТБ. К нам каждый месяц приходит около 500 тысяч новых клиентов. Специально для них наша команда разработала сервис переноса платежей в ВТБ Онлайн, попутно решив множество проблем с распознаванием платежных документов и извлечения из них полезной информации.

Читать полностью »

Адские условия: Самый суровый краш-тест технологии распознавания паспорта

2024-10-04 в 8:21, admin, рубрики: ocr, OCR-технологии, smart engines, документы, Компьютерное зрение, распознавание изображений, распознавание образов, распознавание паспорта, распознавание текста, тест

Как вы знаете, в ситуациях, когда необходимо быстро и безопасно обработать данные паспорта и любых других документов, технологии распознавания Smart Engines творят настоящие чудеса. Качеству и надежности нашей технологии доверяют лидеры цифровой трансформации: госведомства, ведущие банки, аэропорты, промышленность и бизнес. Мы ценим доверие наших клиентов, а для вас, дорогие читатели, решили наглядно показать эффективность наших систем. Так сказать, лучше один раз увидеть, чем сто раз услышать. Летс гоу!

Красиво. Ритмично. Технологично

Читать полностью »

Софт на диете: как мы в DCAP OCR разгоняли

2024-09-11 в 12:25, admin, рубрики: DCAP, fileauditor, ocr, оптимизация производительности, распознавание изображений, ресурсоемкость, СёрчИнформ

Привет!

Мы в «СёрчИнформ» 20 лет создаем софт для защиты информации и постоянно его оптимизируем. Например, последовательно работаем над ресурсоемкостью продуктов (низкая нагрузка на оборудование – важное преимущество для заказчиков), и придумали в этом направлении много удачных (не только наше мнение) решений.

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «ocr» - 3

Автоматизация без кода: как FastML справляется с документами за несколько кликов

Рукописный редактор на Python: инструкция для тех, кто хочет «рисовать» код

Как декомпозиция повышает точность распознавания текста: опыт с фотографиями СТС

Ян Лекун, создатель LeNet, формата DjVu и адвокат опенсорса

Решалка судоку: сам не представляю, как она у меня получилась

Телеграм бот для быстрого распознавания текста на фото с помощью Mistral OCR

Распознавание день в день: как настроить шаблон нового документа без программирования

Как мы переманили пользователей удобным сервисом платежей

Адские условия: Самый суровый краш-тест технологии распознавания паспорта

Красиво. Ритмично. Технологично

Софт на диете: как мы в DCAP OCR разгоняли