Рубрика «словари» - 2

Telegram боты: в помощь редактору

2016-10-17 в 11:31, admin, рубрики: api, telegram api, telegram bots, Алгоритмы, журналистика, Программирование, Системы обмена сообщениями, словари

— Синоним к слову «своенравный»? — раздался голос жены из соседней комнаты.

Треск клавиатуры стих и кот, воспользовавшись паузой, решительно заявил о своем жалком полуголодном существовании, видимо надеясь, что вот сейчас уж точно хозяева наконец-то оторвут свой зад от кресла и покормят несчастного.

— Дык посмотри у этого… как его…
— Да-да, я тоже забыла. Ну так что, скажешь мне синоним?

Но увы, я не ходячая энциклопедия, и даже не ее сидячий вариант, поэтому я не нашел ничего лучше, чем отправить жену гуглить словарь.

Читать полностью »

Сохранение сетевых словарей в форматах DSL – LSD, TXT, PDF, DjVu и решение сопутствующих задач при помощи Node.js

2016-01-17 в 17:54, admin, рубрики: abbyy lingvo, djvu, dsl, html, javascript, LSD, node.js, PDF, txt, Urban Dictionary, лексикография, локализация, Локализация продуктов, перевод, поиск, поисковые технологии, словари

Компания ABBYY создала хорошую программную оболочку для работы со словарями, однако не меньшим её вкладом в цифровую лексикографию стал побочный продукт разработки ABBYY Lingvo — язык словарной разметки DSL. Он давно уже вышел за границы Lingvo, стал самостоятельным стандартом и форматом для других словарных оболочек, в том числе одной из самых известных в своём роде — GoldenDict.

Но сама по себе компания ABBYY не достигла бы таких успехов без помощи многочисленной армии энтузиастов-лексикографов, маниакально год за годом оцифровывавших бумажные словари и конвертировавших словари цифровые — от миниатюрных специальных до огромных общего назначения.

Одна из самых известных и плодотворных групп давно уже работает на сайте forum.ru-board.com. Со временем там накопилась как обширнейшая коллекция словарей, так и основательнейшая база знаний и инструментов в помощь их создателям и редакторам. Было написано множество скриптов и программ, набор которых отражает историю и изменения популярности языков программирования, более или менее приспособленных для обработки текста. Тут и Perl с Python, и языки пакетных файлов для оболочек, и макросы MS Word и Excel, и компилируемые программы на языках общего назначения.

Однако до последнего времени один из языков почти не был представлен в данной сфере. Хотелось бы восполнить этот пробел и отдать должное стремительному росту мощности, функциональности и популярности языка JavaScript. Думается, он может оказать большую помощь современным программистам-лексикографам, особенно на границе сетевой и локальной лексикографии. Читать полностью »

Однострочные выражения со словарями

2014-05-26 в 15:58, admin, рубрики: dictionary, python, генераторы, словари

Некоторые замечательнеые возможности языка Python незаслуженно оставлены без внимания и многие программисты о них не знают. В этот раз речь пойдет о прекрасной возможности языка, делающей код яснее: однострочных выражениях обрабатывающих словари. Но начнем с компактных выражений обработки списков и задачи удаления неуникальных элементов коллекций.

Будет интересно в основном новичкам в Python.
Читать полностью »

И снова закинул старик невод… (парсинг хабра, продолжение)

2013-09-05 в 11:47, admin, рубрики: python, ненормальное программирование, словари, хабрахабр, метки: словари, Хабрахабр

Примерно месяц назад я опубликовал пост Вернулся невод с тиной морскою..., речь там шла о сравнении частотных словарей Википедии и Башорга. В комментах было много идей насчёт того, как это сделать правильно, а так же просьб распарсить другие сайты — Луркмор и конечно же Хабрахабр.
Читать полностью »

Охота на слова

2013-08-06 в 21:26, admin, рубрики: python, wikipedia, ненормальное программирование, Питон, рекорды, слова, словари, метки: python, wikipedia, Питон, рекорды, слова, словари

Продолжу цикл статей «Как развлечь себя при помощи частотного словаря Википедии и интерпретатора Питона, если ничего другого под рукой нет и в ближайшее время не предвидится».
Я попробую воссоздать тот замечательный вечер, когда мой парсер Википедии отработал, я получил вожделенный словарь, открыл Питон в интерактивном режиме и начал вводить различные запросы с целью получить слова со всякими необычными свойствами. Тот, двухлетней давности, сеанс работы с шеллом, к сожалению, не сохранился, поэтому сделаю всё заново.
Читать полностью »

Вернулся невод с тиной морскою…

2013-08-01 в 19:33, admin, рубрики: bash.org.ru, python, wikipedia, башорг, ненормальное программирование, словари, эксперименты, метки: bash.org.ru, python, wikipedia, башорг, словари, эксперименты

Года полтора назад я решил провести небольшой эксперимент. Цель была посмотреть на концентрированный новояз. Сделал я следующее:
1) Распарсил bash.im (тогда ещё bash.org.ru) и создал частотный словарь встречающихся там слов
2) Распарсил Википедию и создал частотный словарь (точнее не совсем так, словарь Википедии у меня к тому моменту уже был, я его делал раньше для совсем других целей)
3) Рассортировал словарь Баша по встречаемости в порядке убывания, шёл по нему и печатал те слова, которые ни разу не встречались в Википедии.
Читать полностью »

Использование словарей в tcl

2013-03-26 в 4:05, admin, рубрики: tcl, извращения, ненормальное программирование, словари, метки: tcl, извращения, словари

Приветствую! %username, ты наверняка слышал про такой язык как tcl и его графический тулкит tk. Язык отличается особой гибкостью (на мой скромный взгляд). Пока нет много времени написать об «облачной» разработке, решил написать мини-статью/мини-урок про одну из возможностей замечательного языка tcl — словарях ( причем, их я не могу вспомнить по книге «Практическое программирование на Tcl/TK», быть может просто читал старую версию). Наиболее полное описание данного типа данных, %username, ты можешь найти по ссылкe.
Читать полностью »

Бесплатные словари для Android

2012-10-02 в 5:13, admin, рубрики: android, android apps, словари, метки: android apps, словари

Небольшой обзор словарных оболочек для Android. Словари на телефоне-это здорово.А вот чем их смотреть…
Читать полностью »

Переводчикам на заметку: ускорение работы ABBYY Lingvo и других инструментов

2012-09-03 в 22:21, admin, рубрики: ABBYY, big data, Lingvo, ram disk, windows, браузеры, высокая производительность, производительность, словари, словарь, Софт, метки: ABBYY, big data, Lingvo, ram disk, windows, браузеры, производительность, словари, словарь

Электронный словарь сегодня стал одним из основных инструментов переводчика, наряду с браузером, оцифрованными справочниками и базами соответствий (последнее важно в основном лишь для переводчиков нехудожественных текстов).

Среди электронных словарей ABBY Lingvo отличается одной ключевой особенностью: полнотекстовым поиском с индексацией. Что-то похожее можно реализовать при помощи индексов в Adobe Acrobat, но удобство интерфейсов именно в словарной области не подлежит сравнению.

ABBY Lingvo давно уже превратился из обычного словаря в универсальный агрегатор источников. Вдобавок к титанической работе фирмы-создателя, энтузиастами оцифрованы в формат Lingvo сотни пособий, в том числе и основные двуязычные, и огромные многотомные толковые словари серий Cambridge, Collins, Longman, Merriam-Webster, Oxford, и энциклопедические словари вроде Британики. Созданы локальные копии сетевых гигантов (Википедий, Викисловарей, Urban Dictionary и так далее). И при обычном использовании это предоставляло бы исключительные возможности. Но при полнотекстовом поиске всё это богатство превращается ещё и в языковые корпусы и базы соответствий. Значение такого поиска при переводах сложных терминов, устойчивых словосочетаний, фразеологизмов трудно переоценить.

С каждым выпуском ABBY расширяет допустимые границы компилируемых словарей и поисковых индексов. Уже сейчас можно скомпилировать словарь размером почти в 2 гигабайта исходного текста. Однако при подключении большого количества словарей индекс разрастается. И сами словари на диске, и поисковый пользовательский индекс также могут достигать гигабайтных размеров. При этом полнотекстовый поиск замедляется, на него начинает влиять скорость работы винчестеров. Эпоха развития SSD может помочь в решении этой проблемы, но пока эти механизмы ещё не используются повсеместно из-за большей цены и меньшей износоустойчивости. К счастью, есть способ, по приросту скорости выигрывающий даже у SSD. Читать полностью »

Не бойся, что не знаешь — бойся, что не учишься!

2012-05-11 в 8:24, admin, рубрики: mobile development, орфография, правописание, словари, учеба, метки: орфография, правописание, словари, учеба

После публикации DevStory Жи-Ши на Хабре мы получили массу конструктивной (и не очень) критики. Многие проблемы были устранены, а дизайн переработан. Сейчас мы хотим помочь всем студентам и школьникам сдать экзамены, тесты и курсовые используя наше приложение Жи-Ши. Оно уже получило массу положительных отзывов и поэтому мы думаем, что движемся в верном направлении.

Кто из нас хоть раз не задумывался над тем, как правильно написать слово? “О” или “А”? две “Н” или одна? “Как это вообще пишется?” В подобных случаях мы чаще всего открываем словарь и долго ищем подходящее слово, порой перебирая несколько вариантов — это если словарь электронный. Специально обученные люди — журналисты, лингвисты и филологи (а они тоже не всегда уверены, как будет правильно) пишут разные варианты слова и на глаз уже вычисляют “верное”, по памяти…
21 век на дворе! Словарь — это, конечно, хорошо. Но долго. И нельзя ошибиться в написании нужного слова. А как не ошибиться, если не знаешь как его написать? Замкнутый круг, разорвать который помогает приложение «Жи-Ши».

Не бойся, что не знаешь — бойся, что не учишься!

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «словари» - 2

Telegram боты: в помощь редактору

Сохранение сетевых словарей в форматах DSL – LSD, TXT, PDF, DjVu и решение сопутствующих задач при помощи Node.js

Однострочные выражения со словарями

И снова закинул старик невод… (парсинг хабра, продолжение)

Охота на слова

Вернулся невод с тиной морскою…

Использование словарей в tcl

Бесплатные словари для Android

Переводчикам на заметку: ускорение работы ABBYY Lingvo и других инструментов

Не бойся, что не знаешь — бойся, что не учишься!