- PVSM.RU - http://www.pvsm.ru -

Совет по открытым данным: вести с полей

image
Источник фото: сайт Открытого Правительства [1]

23 декабря мне впервые посчастливилось побывать на заседании Совета по открытым данным [2]. Участвовала я от лица АНО “Информационная культура”, своим участием добавив общественный сектор к представителям госсектора и бизнеса.

Состав декабрьского заседания совета был, на первый взгляд, внушительным: собрались представители Минфина, Казначейства, Росстата, Минэкономразвития, Открытого Правительства, НИУ ВШЭ, Аналитического Центра “Форум”, Аналитического центра при Правительстве и Яндекса – как видно из списка, некоммерческого сектора очень не хватает. Повестка состояла из шести объемных пунктов, но это не помешало заседанию начаться на полчаса позже, что, впрочем, не вызвало удивления присутствовавших и не сопровождалось какими-либо комментариями организаторов.

1. Исключение дублирования статистических показателей в отчетности Росстата

Первым пунктом повестки был доклад Росстата о том, как исключить дублирование показателей в различных отчётах и как публиковать первичную статистическую информацию в формате открытых данных. Доклад вызывает множество вопросов, начиная с способа подачи материала, который заключался в дословном прочитывании текста из раздаточных материалов. Из содержательного запомнились два пункта:

Первый тезис заключался в том, что «дублирование показателей создает неоправданную нагрузку на бизнес и бюджеты всех уровней», что подразумевает многократную подготовку и сдачу одних и тех же показателей. Удивил комментарий министра Открытого Правительства Михаила Абызова, который прямо сказал, что сотни тысяч чиновников на рабочих местах только и делают, что находят цифры по форме из excel-таблиц, которые внезапно понадобились их руководителям. Что касается Росстата, то, на мой взгляд, намного интереснее тот факт, что нагрузку на бюджеты создает и само ведомство, когда продает региональным и муниципальным госорганам собранные данные. То есть работа Росстата оплачена не только нашими налогами, но и результаты этой работы продаются внутри государства, и на это идут региональные и муниципальные средства. Но вариант снижения нагрузки на бюджеты за счет отмены продажи данных не был озвучен.

image
Контракт на закупку показателей статистической отчетности Администрацией губернатора Пермского края у территориального органа ФСГС. Источник: проект Госзатраты [3]

Второй тезис — это работа Росстата с большими данными. Из озвученного текста у меня не сложилось впечатление, что представители Росстата правильно понимают и эту область и терминологию, т.к. по их мнению большие данные – это что-то отдельно-стоящее от всех остальных данных и, естественно, требующее дополнительного финансирования. Например, Росстат предлагает «создание единого межведомственного координационного центра по использованию Больших данных в официальной статистике», «обеспечение Росстатом единого методологического контроля (надзора) за использованием Больших данных в официальной статистике», «разработку и принятие комплекса законодательных и НПА, обеспечивающих возможность и устанавливающих порядок использования Больших данных в официальной статистике». Подозреваю, что «Большие данные» у Росстата уже есть, правда, они об этом не догадываются.

Хотя по Росстату, судя по моему опыту, основная проблема сегодня заключается в том, что данные не предоставляются в формате открытых данных. Муниципальную статистику в виде датасетов скачать нельзя, массивы, выгружаемые на федеральный портал, сильно раздроблены (за счет чего увеличивается их количество, которое так важно для рейтингов), а статистические сборники, состоящие в основном из таблиц, публикуются в формате doc и сверстаны для печати, а не для работы с данными.

2. Обсуждение порталов Казначейства

После Росстата «докладывалось» Казначейство. Их доклад можно назвать образцовым выступлением госоргана – красочная презентация с необходимыми поясняющими фразами, грамотная речь, понятное и интересное содержание. Были представлены ресурсы bus.gov.ru [4] и budget.gov.ru [5], а также приказы, на основании которых госорганы, государственные и муниципальные учреждения должны публиковать данные о себе. Интересно, что минут 20 на заседании шло обсуждение того, нужно ли менять один из приказов Минфина России и добавлять в перечень обязательных данных координаты фактического расположения учреждения или все же пользоваться API Яндекса/Google для генерации координат. Благодаря аргументации руководителя Департамента ИТ Минфина России Елены Черняковой, сотни тысяч муниципальных учреждений не будут задаваться вопросом, какие у них координаты и где их найти. Впрочем, это не было удивительным, т.к. интересные и адекватные выступления и ответы на вопросы Е. Черняковой – это то, чего я жду на каждом мероприятии.

image
Портал bus.gov.ru [4] для размещения данных о государственных учреждениях

Хотя также, как и с Росстатом, в процессе работы с рассматриваемыми порталами Казначейства, мы выявили куда существенные проблемы чем те, которые обсуждались на совете:

  • На портале bus.gov.ru [4] неправильно преобразуется в структурированный формат финансовая отчетность: отображаемые на сайте данные не соответствуют тому, что указано в прикрепленных оригиналах;
  • На портале bus.gov.ru [4] отсутствует документированное API, и блокировка IP-адреса осуществляется при просмотре данных всего 50 учреждений, то есть бесполезно выкладывать и обсуждать новые данные, если даже то, что есть, скачать/использовать практически невозможно;
  • На портале budget.gov.ru [5] в конструкторах данных много багов, например, теряется выбор пунктов при переносе фильтра в раздел «Показатели» или показываются удвоенные суммы доходов/расходов, если отметить пункт «выбрать все» в фильтре «Уровень бюджета»;
  • Важно уточнить, проводится ли каким-то образом верификация данных, вводимых представителями госучреждений на портале bus.gov.ru [4]: о том, как представители госзаказчиков формируют данные по госконтрактам, мы знаем уже давно, а ошибки в финансовой отчетности выявили недавно, но «исправляет» их Казначейство уже несколько месяцев.

Интересно, что при обсуждении геолокации учреждений, Михаил Абызов поднял вопрос о том, можно ли заставить учреждения (школы) публиковать все данные по ЕГЭ, — теперь мы знаем, кто из государственных служащих поддерживает открытость образовательных данных и с кем стоит коммуницировать «Российским школам» [6].

В этом пункте повестки Елена Чернякова из Минфина России раскрыла тайну многочисленных ошибок в данных ЕГРЮЛ, о работе над которым Татьяна Нестеренко рассказывала на Московском финансовом форуме [7] в сентябре (на исправление данных в ЕГРЮЛ у Минфина России ушло полгода, 600 млн рублей и 200 000 человекочасов). Проблема в том, что подача данных в ЕГРЮЛ носит заявительный характер, поэтому, например, фактический адрес, указанный индивидуальным предпринимателем, проверить практически невозможно. Поэтому, когда Минфин России занялся обновлением своих информационных систем, 80% государственных и муниципальных учреждений пошли править свои данные в ЕГРЮЛ.

3. Предложения Аналитического центра при Правительстве по публикации данных госкорпораций и публичных акционерных обществ

Третьим пунктом Аналитический центр при Правительстве РФ представил доклад «О совершенствовании работы государственных корпораций и публичных акционерных обществ с открытыми данными». Основная идея заключалась в том, чтобы обязать указанные организации публиковать в машиночитаемых форматах ту информацию, которую они уже обязаны раскрывать (общие сведения об организации, вакансии, сведения об охране окружающей среды и т.д.). На это один из участников заседания справедливо заметил, что тогда мы получим миллион датасетов в разных форматах на разных сайтах, и намного логичнее опубликовать открытую часть ЕГРЮЛ и другие данные, которые собирает у тех же учреждений Росстат или Росприродназдор. Замечание про ЕГРЮЛ было одним из самых ценных комментариев на совете, поскольку мы давно об этом говорим ФНС, но, к сожалению, в проекте протокола этого комментария нет.

4. Саммит по открытым данным и конкурс Открытого Правительства

Четвертым пунктом было обсуждение саммита [8], перенесенного на февраль, и конкурса по открытым данным [9]. Вряд ли что-то можно рассказывать об этом пункте до подведения итогов конкурса, но к статистике по прошлому конкурсу это не относится. Было озвучено, что большое количество проектов, поданных на прошлый конкурс (или 50 проектов, или 50%), продолжают развиваться. Хотелось бы посмотреть на этот список, потому что обычно через год после проведения конкурса или хакатона практически все проекты становятся недоступными или заброшенными.

5. О работе федеральных органов исполнительной власти по открытым данным в 2016 году

Пятым пунктом было перенесенное на февраль подведение итогов работы органов государственной власти по раскрытию информации в форме открытых данных. Примечательно, что в материалах к заседанию в качестве лидеров среди ФОИВ указаны далеко не финансовые госорганы (Казначейство, Минфин России, ФНС), чья работа в области открытости не вызывает сомнений, а, на первый взгляд, выбранные случайным образом. Возможно, этот список составлен на основе рейтинга, подготовленного недавно Открытым Правительством и ВЦИОМ [10].

image
«Безусловно открытые ведомства» по результатам рейтинга Открытого Правительства и ВЦИОМ

image
«Аутсайдеры» рейтинга Проектного центра «Инфометр» [11]

В отличие от прозрачного, понятного и основанного на законодательстве рейтинга Инфометра [11], рейтинг ВЦИОМа и ОП вызывает много вопросов. Во-первых, за основу в нем принимается количество датасетов, при этом Росстат, целью деятельности которого является сбор данных, оценивается наравне с остальными ведомствами. Во-вторых, значительной составляющей итоговой оценки является «востребованность» наборов, которая определяется как количество скачиваний с федерального портала data.gov.ru. Специально перед советом просмотрела ТОП-7 федеральных ведомств по количеству датасетов на этом портале. Общее количество скачиваний за все время существования портала у «лидирующих» ведомств составляет примерно 100-150 раз (это суммарное количество скачиваний всех датасетов одного ведомства), то есть вместо того, чтобы судить о невостребованности наборов, нужно судить о невостребованности данного портала. В-третьих, этот рейтинг оценивает только данные, размещенные на федеральном портале, не принимая во внимание активность ведомств на своих сайтах, за счет чего госорганы вынуждены дублировать свои данные и на федеральном портале (причем иногда вручную).

image
статистика количества скачиваний с портала data.gov.ru [12] датасетов Ростуризма (154), Росавтодора (70) и Минпромторга России (61). По количеству датасетов среди ФОИВ они на 3, 2 и 4 месте.

Подводя итоги...

Шестой пункт о схеме взаимодействия Минкомсвязи России с Советом по открытым данным зачитан не был и не обсуждался (а у меня терпение во время чтения материалов закончилось раньше).

В целом, совет вызывает двойственное впечатление: что-то было адекватно и интересно: например, доклад Казначейства и некоторые комментарии; также порадовало участие в мероприятии компетентных людей. Что-то, с другой стороны, было слишком формальное и напоминающее «обязаловку», в чем-то проглядывало непонимание ни работы с данными, ни специфики открытых или больших данных. Непосредственно обсуждению докладов уделяется очень мало времени – какие-то незапланированные в повестке комментарии вставить сложно, и, конечно, обсуждение открытых данных в закрытом режиме выглядит довольно странным. Посмотрим, что будет дальше.

Автор: «Информационная культура»

Источник [13]


Сайт-источник PVSM.RU: http://www.pvsm.ru

Путь до страницы источника: http://www.pvsm.ru/otkry-ty-e-danny-e/226581

Ссылки в тексте:

[1] сайт Открытого Правительства: http://open.gov.ru/events/5515680/

[2] Совета по открытым данным: http://opendata.open.gov.ru/sovet/about/

[3] Госзатраты: https://clearspending.ru/contract/2590229320215000009/

[4] bus.gov.ru: http://bus.gov.ru

[5] budget.gov.ru: http://budget.gov.ru

[6] «Российским школам»: http://russianschools.ru

[7] Московском финансовом форуме: http://www.ff.msk.ru

[8] саммита: http://opendatasummit.ru

[9] конкурса по открытым данным: http://opendatacontest.ru

[10] рейтинга, подготовленного недавно Открытым Правительством и ВЦИОМ: http://wciom.ru/index.php?id=236&uid=115980

[11] Проектного центра «Инфометр»: http://read.infometer.org/foivod2016

[12] data.gov.ru: http://data.gov.ru

[13] Источник: https://habrahabr.ru/post/318596/?utm_source=habrahabr&utm_medium=rss&utm_campaign=best