- PVSM.RU - https://www.pvsm.ru -
Для всех кто работает с открытыми данными, делает свои проекты для себя, людей, для участия в конкурсах всегда бывает бывает полезен исходный код примеров того как данные собирались и что с ними делалось.
Я предлагаю составить список открытых репозиториев кода нацеленного именно на решение задач по работе с открытыми данными и примеры проектов которые на них основаны.
Вот список репозиториев зарубежных инициатив которые мне известны:
— огромное количество проектов Open Knowledge Foundation [1] — CKAN, расширения к нему, утилиты по преобразованию данных
— репозитории исходного кода Sunlight Labs [2] — очень много примеров того как распарсены многие американские сайты и базы данных, а также библиотеки по работе с данными разного вида
— репозитории OpenGovernment.org [3] — много примеров проектов на Ruby
— репозитории департамента ИТ Оксфорда [4] — их проекты по открытым данным такие как DataVerse;
— открытый код Белого Дома (США) [5] — проекты по петициям, стандартам API и всяким штукам для Drupal
— репозиторий AlphaGov (UK) [6] — материалы проекта www.gov.uk [7] много кода самого проекта и подпроектов
Мы в Информационной Культуре работаем с открытыми данными постоянно и часть того кода что мы производим вполне может быть полезна и другим. Да что уж там, точно будет полезна.
Поэтому мы выложили много материалов в виде публичных репозиториев в которых каждый может найти что-то для себя и свободно использовать.
А вот и то что есть:
— исходный код OpenGovData.ru [8] - он не очень актуален и сыроват, поскольку мы постепенно мигрируем на CKAN, но вполне пригоден для тех кто хочет быстро и без чьей-либо помощи развернуть портал открытых данных в своем городе не спрашивая никого.
— Открытые данные Мосгорздрава [9] - данные и скрипты для их извлечения с сайта Московского департамента здравоохранения mosgorzdrav.ru [10]. Данные собраны и обработаны по ежедневным сводкам и вполне любопытны для визуализации. Конечно же важно не забыть их обновить.
— Открытые данные ЦБ РФ [11] - проект по преобразованию данных из API веб-сервисов Центробанка в базу данных. Довольно старое API, для работы с веб-сервисом тогда приходилось испольховать утилиту на .NET, но возможно у кого-то найдется время и желание поработать над этими данными.
— Госонтологии [12] - набор RDF/OWL данных по различным областям деятельности государства. Незавершенные онтологии, но вполне пригодные для работы.
- Открытая госдума [13] - скрипты и данные полученные при работе с данными депутатов. Как я и говорил ранее — ими не очень интересно заниматься, там сплошная политика.
— Монитор сайтов [14] - небольшой Django проект по мониторингу сайтов на доступность. На нем работает сайт http://sitemon.opengovdata.ru/ [15] мониторящий zakupki.gov.ru [16]
— Открытые данные Москвы [17] - парсер данных с data.mos.ru (Официального Московского портала) и загрузчик их в CKAN hub.opengovdata.ru
— Открытые данные МЧС [18] — скрипты по извлечению открытых данных и сами данные МЧС. Собирает информацию о телефонах, сводках и адресах подразделений.
— Открытые данные МИД [19] - скрипты и данные по послам. Недоделанное так как там много ошибок при парсинге. Поэтому приложены дампы анализа из Google Refine / Open Refine
— Открытый Кремль [20] — данные с сайта kremlin.ru по Президенту и Администрации. В основном исторические в виде дампа блога Медведева и всех комментариев к нему. Там же есть идеи по тому как использовать их данные вот тут они собраны в виде Excel таблички https://github.com/infoculture/openkremlin/blob/master/docs/kremlin_ru_opendata.xls [21]
Есть много и других полезных проектов по анализу данных, их сбору с сайтов, преобразованию данных и многому другому. Что-то мы будем выкладывать по мере готовности (в первую очередь код надо описывать, делать README и тд), но наверняка есть и другие полезные репозитории. Если знаете такие — присылайте. Будем составлять их список.
Автор: ibegtin
Источник [22]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/e-lektronnoe-pravitel-stvo/31468
Ссылки в тексте:
[1] огромное количество проектов Open Knowledge Foundation: https://github.com/okfn
[2] репозитории исходного кода Sunlight Labs: https://github.com/sunlightlabs
[3] репозитории OpenGovernment.org: https://github.com/opengovernment
[4] репозитории департамента ИТ Оксфорда: https://github.com/ox-it
[5] открытый код Белого Дома (США): https://github.com/WhiteHouse
[6] репозиторий AlphaGov (UK): https://github.com/alphagov
[7] www.gov.uk: http://www.gov.uk
[8] исходный код OpenGovData.ru: https://github.com/infoculture/opengovdataru
[9] Открытые данные Мосгорздрава: https://github.com/infoculture/mosgorzdrav
[10] mosgorzdrav.ru: http://mosgorzdrav.ru
[11] Открытые данные ЦБ РФ: https://github.com/infoculture/cbr_opendata
[12] Госонтологии: https://github.com/infoculture/ruegovontologies
[13] Открытая госдума: https://github.com/infoculture/opengosduma
[14] Монитор сайтов: https://github.com/infoculture/ogd_sitemon
[15] http://sitemon.opengovdata.ru/: http://sitemon.opengovdata.ru/
[16] zakupki.gov.ru: http://zakupki.gov.ru
[17] Открытые данные Москвы: https://github.com/infoculture/mosopendata
[18] Открытые данные МЧС: https://github.com/infoculture/mchsopendata
[19] Открытые данные МИД: https://github.com/infoculture/openmid
[20] Открытый Кремль: https://github.com/infoculture/openkremlin
[21] https://github.com/infoculture/openkremlin/blob/master/docs/kremlin_ru_opendata.xls: https://github.com/infoculture/openkremlin/blob/master/docs/kremlin_ru_opendata.xls
[22] Источник: http://habrahabr.ru/post/175855/
Нажмите здесь для печати.