Рубрика «ocr» - 2

Учебник под микроскопом. Часть 1: из PDF в TXT

2025-09-01 в 15:15, admin, рубрики: education, EduText Analyzer, nlp, ocr, python

Недавно мы с научным руководителем задались вопросами: Какая лексика чаще всего встречается в учебнике, а какая появляется всего один раз? Какие упражнения присутствуют чаще – языковые или коммуникативные? Соответствует ли лексика в учебнике заявленному уровню? Сколько всего текстов в учебнике? О чем большинство?

Читать полностью »

Добавление OCR-слоя и другие преобразования PDF

2025-08-24 в 18:07, admin, рубрики: markitdown, ocr, ocrmypdf, PDF, syntax, конвертация

OCRmyPDF выравнивает и оптимизирует PDF-файлы вместе с распознаванием текста

Читать полностью »

Как мы научили нейросети читать паспорта: история борьбы с бликами, водяными знаками и кривыми фото

2025-07-03 в 16:03, admin, рубрики: ocr, OCR-технологии, документы удостоверяющие личность, паспорт, паспорта, распознавание изображений, распознавание образов, распознавание текста

Привет!

Читать полностью »

Как мы создавали технологию валидации печатей

2025-06-26 в 16:00, admin, рубрики: contentcapture, ocr, валидация, обработка изображений

Читать полностью »

Генератор синтетических документов для обучения моделей ИИ

2025-06-20 в 13:55, admin, рубрики: ocr, распознавание документов, синтетические данные

Где взять пару миллионов документов с разметкой для обучения модели ИИ? Сгенерировать синтетически! Меня зовут Никита, я работаю в ИСП РАН и веду блог по ИИ. Выложил в открытый доступ проект, который поможет дата-саентистам самостоятельно создавать датасеты сканированных документов с разметкой, используя только CPU. Подойдет для предобучения мультимодальных трансформеров, OCR и проч.

Кратко:

Генератор создает синтетические PNG-картинки сканированных документов с разметкой. Ссылка на гитхаб
Язык текста: можно выбрать.
Читать полностью »

Автоматизация без кода: как FastML справляется с документами за несколько кликов

2025-05-29 в 15:15, admin, рубрики: contentcapture, ocr, распознавание изображений

Привет!

В этом посте хотим рассказать, как технология FastML (о самой разработке уже рассказывали здесь Читать полностью »

Рукописный редактор на Python: инструкция для тех, кто хочет «рисовать» код

2025-05-19 в 8:52, admin, рубрики: javascript, ocr, OCR-технологии, python, selectel, распознавание текста

Привет, меня зовут Лёня! Я автор YouTube‑канала eleday о программировании на Python. Недавно в школе была проверочная работа и мне пришлось писать код на бумаге. Такой подход показался странным: все-таки программа может исполняться только на компьютере и логично набирать ее там же. Подобная цепочка рассуждений привела к интересной идее — редактору рукописного ввода. В этой статье расскажу о задумке и деталях ее реализации. Создадим виртуальный лист, на котором можно набросать код от руки — и он будет исполняться!Читать полностью »

Как декомпозиция повышает точность распознавания текста: опыт с фотографиями СТС

2025-05-14 в 13:16, admin, рубрики: fullstack разработка, ocr, OCR-технологии, декомпозиция задач, компьтерное зрение, распознавание документов, Распознавание текста на фото, СТС

Привет! Меня зовут Наталия Вареник, я DS-инженер в Авито, занимаюсь моделями распознавания изображений. Расскажу про один из наших проектов — пайплайн для распознавания номеров с фотографии свидетельства транспортного средства (СТС). В статье описала особенности задачи и рассказала, как мы решали её с помощью декомпозиции.

Материал будет полезен начинающим и мидл-DS-инженерам, которые хотят узнать больше про декомпозицию задачи на этапах разметки и построения моделей.

Читать полностью »

Ян Лекун, создатель LeNet, формата DjVu и адвокат опенсорса

2025-05-05 в 9:01, admin, рубрики: cnn, CRF, deepseek, djvu, DWT, GTN, jpeg2000, lenet, llama, llm, Lush, ocr, PDF, ruvds_статьи, вейвлет-преобразование, Компьютерное зрение, машинное зрение, нейросети, распознавание символов, сверточные нейросети, тест тьюринга, условные случайные поля, Ян Лекун

Ян Лекун, один из крёстных отцов современного ИИ, в своём твиттере резко критикует корпоративных исследователей ИИ, которые ведут проприетарные разработки и занимаются «нагнетанием страха». Среди этих людей называются Сэм Альтман (OpenAI), Демис Хассабис (Google DeepMind) и Дарио Амодеи (Anthropic)

Ян Лекун (Yann LeCun) — французский и американский учёный в области машинного обучения и компьютерного зрения. Известен как автор легендарной системы LeNet (1989 г.), где одним из первых начал применять методы биологических нейронных сетей для оптического распознавания символов (OCR).

Сейчас занимает должность вице-президента и ведущего исследователя ИИ в корпорации Meta (руководит разработкой опенсорсной языковой модели LLaMA, в том числе). При этом остаётся ярым приверженцем опенсорса, свободной науки и научно-технического прогресса человечества.Читать полностью »

Решалка судоку: сам не представляю, как она у меня получилась

2025-04-23 в 14:05, admin, рубрики: ocr, OCR-технологии, timeweb_статьи_перевод, игры, искусственный интеллект, логика, математика, нейросети, судоку

В этой статье мы разберём, как написать программу для решения судоку. Предполагается, что ранее читатель не пробовал алгоритмически решать судоку, тем более — с применением нейронных сетей.

Я легко увлекаюсь. Мои пристрастия меняются, но сейчас на первых ролях — многопользовательские партии в Call of Duty: Modern Warfare 3 и судоку. Что касается второй — мне нравится, как она разгружает мне голову и умиротворяет меня. Здесь только вы, числа и достаточно очевидные стратегии, позволяющие выиграть.

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «ocr» - 2

Учебник под микроскопом. Часть 1: из PDF в TXT

Добавление OCR-слоя и другие преобразования PDF

Как мы научили нейросети читать паспорта: история борьбы с бликами, водяными знаками и кривыми фото

Как мы создавали технологию валидации печатей

Генератор синтетических документов для обучения моделей ИИ

Автоматизация без кода: как FastML справляется с документами за несколько кликов

Рукописный редактор на Python: инструкция для тех, кто хочет «рисовать» код

Как декомпозиция повышает точность распознавания текста: опыт с фотографиями СТС

Ян Лекун, создатель LeNet, формата DjVu и адвокат опенсорса

Решалка судоку: сам не представляю, как она у меня получилась