Жизненный цикл документа в профессиональной справочной системе. Немного сказочный пост о том, как кипа бумаги превращается в систему. Часть 2

в 11:54, , рубрики: базы данных, Блог компании Консорциум «Кодекс», документация, законодательство, искусственный интеллект, кодекс, текст, техэксперт

Жизненный цикл документа в профессиональной справочной системе. Немного сказочный пост о том, как кипа бумаги превращается в систему. Часть 2 - 1
Добрый день, друзья!

В первой части нашей статьи мы начали рассказывать о том, как работает наш производственный департамент и как наши системы «Кодекс» и «Техэксперт» пополняются документами. Мы остановились на этапе набивки и сверки. В сегодняшнем посте закончим этапы корректорской проверки, обработаем тексты скриптами, пройдем юридическую проверку, снабдим нормативно-правовые и нормативно-технические документы интеллектуальными сервисами… одним словом, закончим наше путешествие с документом на его пути к пользователю.


4. Набивка и сверка
Нормативно-правовой документ

На данном этапе мы переводим бумажный оригинал в электронный вид.
Для этого нормативно-правовой документ сканируют и распознают. Полученный электронный текст оформляется в соответствии со стандартом предприятия. После этого документ распечатывают и несут на сверку корректорам. Важно пройтись глазами по каждой строке, потому что при распознавании текста могли быть допущены технические ошибки.

В среднем специалисты по набивке и сверке в год обрабатывает более километра печатного текста! Фото для оценки масштабов катастрофы. Цвет папки, в которой лежит документ, показывает, насколько срочно он должен быть обработан.
Жизненный цикл документа в профессиональной справочной системе. Немного сказочный пост о том, как кипа бумаги превращается в систему. Часть 2 - 2
Нормативно-технический документ

Нормативно-технический документ обрабатывается аналогично, однако есть нюансы, ведь вместе с печатным текстом мы обрабатываем чертежи, макеты, таблицы и другие сопроводительные материалы. Для такого документа мы всегда создаем сканер-копию – подтверждение высшей достоверности.

Перед тем, как стать сканер-копией, изображение проходит стадию отстройки графики. Если графический элемент простой, то мы без проблем включаем его в систему. Если речь идет о сложном чертеже, о разветвленной схеме или о каком-нибудь документе, который много лет пролежал в архивах, то здесь уже целая команда специалистов работает над его качеством и удобочитаемостью.
Полнотекстовая версия НТД также отображается в системе: это нужно для того, чтобы пользователю были доступны все аналитические сервисы.

На этом же сканер-копия документа связывается с его карточкой.
Сканер-копия остается лежать в технологической базе, а текст мы тоже несем на корректорскую сверку.
Жизненный цикл документа в профессиональной справочной системе. Немного сказочный пост о том, как кипа бумаги превращается в систему. Часть 2 - 3
5. Из корректорской сверки – к началу

После корректуры каждый документ возвращается на этап набивки. Там его радостно встретят и поправят все неточности, которые могли случайно прокрасться в текст. На этом же этапе к карточке документа, к его «паспорту», присоединяется электронный текст и все рисунки. Теперь мы можем видеть документ почти так, как его через некоторое время увидит пользователь. Опять распечатываем текст документа уже «из системы», несем корректорам (да, опять!!), которые вычитывают документ «палец в палец».

На фото — работа корректоров.
Жизненный цикл документа в профессиональной справочной системе. Немного сказочный пост о том, как кипа бумаги превращается в систему. Часть 2 - 4

6. Обработка текстов скриптами

На этом этапе с текстом работают операторы баз данных. Они отвечают за то, чтобы были доступны все сервисные возможности по работе с документом, которые предоставляет система. Для этих операций используются соответствующие скрипты.

Из важных моментов – мы расставляем гиперссылки и проверяем, все ли они корректно работают.
Одни гиперсвязи отвечают за отношения между документами внутри системы: документы могут ссылаться друг на друга, причем обращаться либо к началу документа, либо к конкретному участку текста.
Другой вид гиперссылок отвечает за навигацию по изучаемому документу и обеспечивает переход на упоминаемый в тексте пункт или раздел.
Третий вид гиперссылокведет на внешние источники, такие как сайты, а также справочные материалы в наших системах и т.д. Всё это нужно расставить и проверить корректность работы скриптов-расстановщиков и якорей.

Здесь же мы добавляем в документ стили, иерархически раскрываемое оглавление, по которому можно осуществить поиск. Уточняем, понимает ли система статус документа, планируемые в нем изменения и др… Одним словом, смотрим, чтобы всё-всё-всё работало.
Жизненный цикл документа в профессиональной справочной системе. Немного сказочный пост о том, как кипа бумаги превращается в систему. Часть 2 - 5

В свою очередь пользователь должен получить собственные возможности по работе с документом – например, получить ссылку на него в стороннее приложение, выгрузить текст к себе на компьютер, обратиться к всплывающей подсказке, поставить документ на контроль и т.д.

Нужно понимать, что технические средства не всегда могут верно распознавать, например, падежи, поэтому мы опять очень внимательно читаем текст.
Проверим, всё ли у нас в порядке. Гиперссылки расставились верно: Жизненный цикл документа в профессиональной справочной системе. Немного сказочный пост о том, как кипа бумаги превращается в систему. Часть 2 - 6

Смотрим в системе. Появилась информационная строка, гиперссылки также работают. Значит, можем идти дальше:

Жизненный цикл документа в профессиональной справочной системе. Немного сказочный пост о том, как кипа бумаги превращается в систему. Часть 2 - 7

Указываем статус опубликования – кто, когда и где его опубликовал – и кладем его в базу для дальнейшей обработки.

7. Юридическая проверка и отправка пакетов документов пользователям

Вы думали, всё? Нет! Сейчас наши юристы будут проверять на соответствие оригиналам все информационные строки, статусы документа и прочую информацию. Теперь документ – свежий и красивый – лежит в нашей технологической базе. Со спокойной душой мы его отдаем на копирование по томам. Наш документ, вместе с его сородичами, упакуют по тематическим базам и по информационным продуктам, а потом отдадут пользователям.

Получается вот так:

Жизненный цикл документа в профессиональной справочной системе. Немного сказочный пост о том, как кипа бумаги превращается в систему. Часть 2 - 8

8. Актуализация

На этом этапе обработка документа не заканчивается, так как в дальнейшем нужно поддерживать его актуальность. При подготовке новых документов юрист должен обратить внимание на то, не изменяют ли каким-то образом новые документы некоторые старые экземпляры, которые уже включены в нашу базу. К таким изменениям могут относиться изменения законодательства, поправки, возобновление и приостановка действия, разъяснения о применении и отмена документа.

Это настолько важные составляющие, что информацию о них мы предоставляем пользователю прямо в тот же день – он её получит вместе с ближайшим обновлением баз данных. Но нового текста он еще пока не увидит.

После того, как отправлена информация об оперативных изменениях в системе, за текст документа берется актуализатор-аналитик. Он создаст новую или будущую редакцию документа, поменяет текст, в соответствии с изменяющим документом, подготовит для документа сервисы «Сравнение редакций», «Обзор изменений», «Чистые тексты».

«Обзор изменений» покажет, что изменилось в текущей редакции, по сравнению с прошлой. Сервис «Сравнение редакций» позволит провести сравнение любых редакций документа между собой: система выделит все изменившиеся формулировки, так что специалисту будет легко с ними работать. Например:

Жизненный цикл документа в профессиональной справочной системе. Немного сказочный пост о том, как кипа бумаги превращается в систему. Часть 2 - 9

Как федеральное, так и техническое законодательства довольно часто подвергаются изменениям. В связи с этим тексты документов содержат большое количество поясняющих материалов. С помощью сервиса «Чистые тексты» можно получить текст документа, свободный от таких примечаний, что удобно при чтении и печати документа.

Когда пользователь увидит документ?

Как только все предыдущие стадии обработки будут пройдены, не один, а сразу подборка всех новых документов попадает в ежедневное, еженедельное или ежемесячное обновление.
Периодичность обновления определяется динамичностью изменения контента и потребностями пользователей. Это означает, что после обновления при запуске системы пользователь сможет данный документ получить. Специально для тех, кто не хочет ждать, новые документы по результатам дня можно найти в сервисе «Горячие документы онлайн». Туда мы складываем онлайн-версии документов, которые предназначены для широкого просмотра.

Есть ли смерть после жизни?

По сути, если документ раз в жизни попал в систему, он оттуда уже не исчезнет никогда, так что ответ «нет» :) Могут вноситься только изменения – в строгом соответствии с нашим внутренним регламентом. Может измениться статус документа, его карточка и внутренние формулировки, добавятся примечания и комментарии, но сам документ будет доступен всегда, даже после утраты силы.

И напоследок

Сегодня мы познакомились с некоторыми рабочими процессами Производственного департамента. Теперь вы сами знаете, через сколько рук проходит один-единственный документ, перед тем как попасть «на стол» пользователю.
Очень важно отметить вклад каждого сотрудника в слаженную работу по строительству системы, а также степень его личной ответственности. Конечный продукт пойдет пользователям — это более 150 тыс. компаний, которые нам доверяют. Это миллионы профессионалов и миллионы ситуаций, для каждой из которых система должна предоставить самое компетентное решение.

В будущих публикациях и дальше будем рассказывать о нашей работе. Уже не только о документах, но и в целом о наших методах организации данных в профессиональных справочных системах.
До новых встреч!

Автор: techzilla

Источник

Поделиться новостью

* - обязательные к заполнению поля