Метка «орфография»

Автоматическая проверка орфографии, модель Noisy Channel Доброго времени суток. На днях у меня возникла задача по реализации алгоритма пост-обработки результатов оптического распознавания текста. Для решения этой проблемы не плохо подошла одна из моделей для проверки орфографии в тексте, хотя конечно слегка модифицированная под контекст задачи. Этот пост будет посвящен модели Noisy Channel, которая позволяет осуществлять автоматическую проверку орфографии, мы изучим математическую модель, напишем на c# немного кода, обучим модель на базе Питера Норвига, и под конец протестируем то что у нас получится.

Читать полностью »

В Notepad++ появилась подсветка ошибок в проверке орфографии

В замечательном редакторе наконец появилась (Upd. еще с 5 мая) подсветка ошибок в проверке орфографии! Для меня это очень долгожданное нововведение, которое очень сильно ждал и надеялся. В свое время даже хотел перескочить на другие редакторы из-за этой проблемы. В Notepad++ можно было до данного момента настроить проверку орфографию, но подсветки слов с ошибками не было, что сводило пользу от проверки орфографии на нет.

Далее расскажу, как настроить проверку русского и английского языка.Читать полностью »

Многие часто сталкиваются с необходимостью проверки орфографии на нескольких языках одновременно, однако далеко не все существующие программы позволяют производить такую проверку, предлагая пользователю переключаться с одного языка на другой, что довольно неудобно и отнимает массу времени.
Многоязыковая проверка орфографии для программ, использующих Hunspell
Не желая мириться с подобным неудобством для программ, использующих Hunspell словари (FireFox, Seamonkey, Miranda и др.) было принято решение создать автоматическую графическую утилиту для склейки нескольких языков, с возможностью дальнейшего использования полученных словарей.
Читать полностью »

После публикации DevStory Жи-Ши на Хабре мы получили массу конструктивной (и не очень) критики. Многие проблемы были устранены, а дизайн переработан. Сейчас мы хотим помочь всем студентам и школьникам сдать экзамены, тесты и курсовые используя наше приложение Жи-Ши. Оно уже получило массу положительных отзывов и поэтому мы думаем, что движемся в верном направлении.

Кто из нас хоть раз не задумывался над тем, как правильно написать слово? “О” или “А”? две “Н” или одна? “Как это вообще пишется?” В подобных случаях мы чаще всего открываем словарь и долго ищем подходящее слово, порой перебирая несколько вариантов — это если словарь электронный. Специально обученные люди — журналисты, лингвисты и филологи (а они тоже не всегда уверены, как будет правильно) пишут разные варианты слова и на глаз уже вычисляют “верное”, по памяти…
21 век на дворе! Словарь — это, конечно, хорошо. Но долго. И нельзя ошибиться в написании нужного слова. А как не ошибиться, если не знаешь как его написать? Замкнутый круг, разорвать который помогает приложение «Жи-Ши».

Не бойся, что не знаешь — бойся, что не учишься!

Читать полностью »

Вчера вышел топик «Хабр — не место для сублимации», автор которого привёл хороший пример того, как левые оффтопики оказываются популярнее, чем обсуждение основной темы.

Типичный оффтопик на Хабре — это граммарно-националистические советы-шутки-прибаутки. Где запятую поставить, да у кого тире подлиннее.

Самое забавное, что для решения это типичной проблемы давным-давно было придумано решениеЧитать полностью »

Доброго времени суток!

С недавнего времени я занимаюсь разработкой системы чатов, так сказать чаты 3.0. Данная идея пришла после того как познакомился с такой интересной и удобной штукой как comet-сервер Realplexor от dkLab. Но сейчас не об этом…

Основной движок написал, чат работает, пользователи общаются, все вроде бы ничего, но есть одно НО! Все же мы люди и бывает забываем переключить раскладку клавиатуры с английской на русскую, такое бывает. После написания n-го количества слов отправляем сообщение и что видим — написали не в той раскладке, и редко кому захочется заново переписывать этот текст, а читателям не всем захочется переводить Ваши каракули. И решено было придумать какой-нибудь очень простой способ исправления таких сообщений.
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js