- PVSM.RU - https://www.pvsm.ru -

Открытые репозитории кода по открытым данным и открытому государству

Для всех кто работает с открытыми данными, делает свои проекты для себя, людей, для участия в конкурсах всегда бывает бывает полезен исходный код примеров того как данные собирались и что с ними делалось.

Я предлагаю составить список открытых репозиториев кода нацеленного именно на решение задач по работе с открытыми данными и примеры проектов которые на них основаны.

Вот список репозиториев зарубежных инициатив которые мне известны:
огромное количество проектов Open Knowledge Foundation [1] — CKAN, расширения к нему, утилиты по преобразованию данных
репозитории исходного кода Sunlight Labs [2] — очень много примеров того как распарсены многие американские сайты и базы данных, а также библиотеки по работе с данными разного вида
репозитории OpenGovernment.org [3] — много примеров проектов на Ruby
репозитории департамента ИТ Оксфорда [4] — их проекты по открытым данным такие как DataVerse;
открытый код Белого Дома (США) [5] — проекты по петициям, стандартам API и всяким штукам для Drupal
репозиторий AlphaGov (UK) [6] — материалы проекта www.gov.uk [7] много кода самого проекта и подпроектов

Мы в Информационной Культуре работаем с открытыми данными постоянно и часть того кода что мы производим вполне может быть полезна и другим. Да что уж там, точно будет полезна.

Поэтому мы выложили много материалов в виде публичных репозиториев в которых каждый может найти что-то для себя и свободно использовать.

А вот и то что есть:

исходный код OpenGovData.ru [8] - он не очень актуален и сыроват, поскольку мы постепенно мигрируем на CKAN, но вполне пригоден для тех кто хочет быстро и без чьей-либо помощи развернуть портал открытых данных в своем городе не спрашивая никого.
Открытые данные Мосгорздрава [9] - данные и скрипты для их извлечения с сайта Московского департамента здравоохранения mosgorzdrav.ru [10]. Данные собраны и обработаны по ежедневным сводкам и вполне любопытны для визуализации. Конечно же важно не забыть их обновить.
Открытые данные ЦБ РФ [11] - проект по преобразованию данных из API веб-сервисов Центробанка в базу данных. Довольно старое API, для работы с веб-сервисом тогда приходилось испольховать утилиту на .NET, но возможно у кого-то найдется время и желание поработать над этими данными.
Госонтологии [12] - набор RDF/OWL данных по различным областям деятельности государства. Незавершенные онтологии, но вполне пригодные для работы.
Открытая госдума [13] - скрипты и данные полученные при работе с данными депутатов. Как я и говорил ранее — ими не очень интересно заниматься, там сплошная политика.
Монитор сайтов [14] - небольшой Django проект по мониторингу сайтов на доступность. На нем работает сайт http://sitemon.opengovdata.ru/ [15] мониторящий zakupki.gov.ru [16]
Открытые данные Москвы [17] - парсер данных с data.mos.ru (Официального Московского портала) и загрузчик их в CKAN hub.opengovdata.ru
Открытые данные МЧС [18] — скрипты по извлечению открытых данных и сами данные МЧС. Собирает информацию о телефонах, сводках и адресах подразделений.
Открытые данные МИД [19] - скрипты и данные по послам. Недоделанное так как там много ошибок при парсинге. Поэтому приложены дампы анализа из Google Refine / Open Refine
Открытый Кремль [20] — данные с сайта kremlin.ru по Президенту и Администрации. В основном исторические в виде дампа блога Медведева и всех комментариев к нему. Там же есть идеи по тому как использовать их данные вот тут они собраны в виде Excel таблички https://github.com/infoculture/openkremlin/blob/master/docs/kremlin_ru_opendata.xls [21]

Есть много и других полезных проектов по анализу данных, их сбору с сайтов, преобразованию данных и многому другому. Что-то мы будем выкладывать по мере готовности  (в первую очередь код надо описывать, делать README и тд), но наверняка есть и другие полезные репозитории. Если знаете такие — присылайте. Будем составлять их список.

Автор: ibegtin

Источник [22]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/e-lektronnoe-pravitel-stvo/31468

Ссылки в тексте:

[1] огромное количество проектов Open Knowledge Foundation: https://github.com/okfn

[2] репозитории исходного кода Sunlight Labs: https://github.com/sunlightlabs

[3] репозитории OpenGovernment.org: https://github.com/opengovernment

[4] репозитории департамента ИТ Оксфорда: https://github.com/ox-it

[5] открытый код Белого Дома (США): https://github.com/WhiteHouse

[6] репозиторий AlphaGov (UK): https://github.com/alphagov

[7] www.gov.uk: http://www.gov.uk

[8] исходный код OpenGovData.ru: https://github.com/infoculture/opengovdataru

[9] Открытые данные Мосгорздрава: https://github.com/infoculture/mosgorzdrav

[10] mosgorzdrav.ru: http://mosgorzdrav.ru

[11] Открытые данные ЦБ РФ: https://github.com/infoculture/cbr_opendata

[12] Госонтологии: https://github.com/infoculture/ruegovontologies

[13] Открытая госдума: https://github.com/infoculture/opengosduma

[14] Монитор сайтов: https://github.com/infoculture/ogd_sitemon

[15] http://sitemon.opengovdata.ru/: http://sitemon.opengovdata.ru/

[16] zakupki.gov.ru: http://zakupki.gov.ru

[17] Открытые данные Москвы: https://github.com/infoculture/mosopendata

[18] Открытые данные МЧС: https://github.com/infoculture/mchsopendata

[19] Открытые данные МИД: https://github.com/infoculture/openmid

[20] Открытый Кремль: https://github.com/infoculture/openkremlin

[21] https://github.com/infoculture/openkremlin/blob/master/docs/kremlin_ru_opendata.xls: https://github.com/infoculture/openkremlin/blob/master/docs/kremlin_ru_opendata.xls

[22] Источник: http://habrahabr.ru/post/175855/