Делаем себя развидеть это, или Право на предварительную правку

в 0:43, , рубрики: Песочница, метки: , , , ,

Мы часто видим ошибки и опечатки в интернете. Как правило, принято или с достоинством пройти мимо, в глубине души презирая неграмотного (или невнимательного) писателя, или, наоборот, с увлечением развернуть просветительскую деятельность (не всегда, к сожалению, уважительную). В лучше случаем, если на сайте установлен Orphus — нажать Ctrl+Enter.

Так поступал и я, пока однажды с ужасом не заметил, что написал «вООбщем» или нечто подобное. Разрушительное влияние чтения форумов, да и, что уж там, самого Хабра, на читательскую грамотность — налицо. А между тем — сейчас есть многое, что могло бы облегчить участь наших бедных глаз!

Приношу извинения за конспективность дальнейшего изложения.
Осталось сделать лишь несколько простых идеологических шагов.

Шаг 1. Существует класс ошибок, которые можно исправить автоматически. Например, заменить ВООБЩЕМ и ВОБЩЕМ на В ОБЩЕМ не составит труда, равно как и заметить, что в русском языке нет глаголов, оканчивающихся на -ЮТЬСЯ. Автоматически же искать разницу между ДЕРЖАТСЯ и ДЕРЖАТЬСЯ не рекомендую.
Такой подход применяется для борьбы с нецензурной бранью в чатах и на форумах — и довольно деструктивно. В остальных случаях, как правило, текстовый редактор лишь подчёркивает красным незнакомые слова при наборе их автором текста (писателем). Это рассуждение плавно подводит нас к следующему шагу.

Шаг 2. Читатель имеет право исправить текст перед прочтением. Да-да, не обязательно уповать на грамотность писателя или бдительность редактора/модератора. Можно самому делать свой интернет чище и светлее.

Так и родилась идея chas-correct — расширения для браузера, автоматически исправляющего многие ошибки. Репозиторий на github. Поддерживаются Firefox, Firefox Mobile и Chromium-подобные. (Для Google Chrome — инструкция по установке).

Посмотрев исходники, бородатый читатель презрительно усмехнётся: «Школокод на регулярках!». Да, на регулярках. А вы попробуйте провести синтаксический анализ текста в режиме реального времени в браузере (или на прокси-сервере — такой вариант тоже рассматривался, но реализован не был). Задействовать облако — не вариант: мы же не хотим, чтобы наши личные сообщения светились в централизованном сервисе проверки орфографии?

Вы скажете: «Это не панацея. Всё исправить невозможно». Конечно, это не абсолют. Но попробуйте поставить chas-correct и почитать хабр с ним недельку-другую, а потом выключить — разница будет, уж поверьте. (NB: слова, написанные капсом, оно не трогает. Если вы не видете сдесь ошыбок — скорее всего, оно работает.)

Вы скажете: «Код ужасен. Его надо причесать и оптимизировать». Я отвечу: патчи принимаются. Просто совесть не позволяет мне более держать эту идею неопубликованной. (Здесь должна быть хрестоматийная история про Васю и Петю, писавших стартапы)

Вы скажете: «Подробности в студию! Цифры эффективности, методики сбора словаря...» Найду время — выложу подробности. Вкратце — скачивал постранично Баш и Хабр со товарищи, резал на слова, самые частотные прогонял через Яндекс.Спеллер (говорю же, технологии-то есть!).

Конечно, работу над расширением нужно продолжать. Есть и третий идеологический шаг — но его только предстоит сделать, и это уже совсем другая история.

Поделиться новостью

* - обязательные к заполнению поля