- PVSM.RU - https://www.pvsm.ru -

Специальный шрифт для нахождения ошибок после OCR

Сообщество Distributed Proofreaders [1] («Распределённые корректоры») больше десяти лет занимается сканированием книг для проекта «Гутенберг». Сотни добровольцев помогают вычитывать тексты и исправлять ошибки.

После автоматического распознавания чаще всего ошибки встречаются в символах, которые похожи друг на друга, как I, l и 1, O и 0, и так далее. Поэтому для проекта Distributed Proofreaders был создан специальный шрифт , в котором «похожие» символы как можно сильнее отличаются друг от друга.

Специальный шрифт для нахождения ошибок после OCR

Все символы шрифта разработаны с учётом многочисленных советов и пожеланий участников проекта, добровольных корректоров. Цель — максимально удобно и эффективно идентифицировать типичные ошибки OCR.

К сожалению, сайт Distributed Proofreaders по историческим причинам не поддерживает юникод, и сообщество работает с весьма ограниченным списком языков, среди которых нет кириллических. Поэтому и сам шрифт DPCustomMono2 спроектирован только для латиницы. Но идеи, которые применили дизайнеры шрифта, можно использовать и в создании кириллического набора символов.

На этой странице [2] можно сравнить DPCustomMono2 с различными популярными шрифтами.

Специальный шрифт для нахождения ошибок после OCR

Автор: alizar


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/e-lektronny-e-knigi/16960

Ссылки в тексте:

[1] Distributed Proofreaders: http://www.pgdp.net/

[2] этой странице: http://www.pgdp.net/c/faq/font_sample.php?compare=Arial