- PVSM.RU - https://www.pvsm.ru -
Друзья, под закат уходящего 2014 года и начала 2015 есть отличная новость для всех кто любит работать с открытыми данными, участвовать в конкурсах для разработчиков.
А также, я уверен, что есть и те кто любит историю и исторические данные.
С 23 декабря Минфин России с нашей помощью Информационной культуры открывает конкурс приложений BudgetApps http://budgetapps.ru/contest [1] на открытых данных которые Минфин России публиковал последние несколько лет.
Данные самые разные. Это данные о бюджетах, данные об аудиторских организациях, государственном долге, государственных резервах и многое другое.
Ну и, так оказалось, что меня зовут Иван Бегтин и я член жюри этого конкурса.
Все они есть по ссылке на сайте Минфина — http://minfin.ru/ru/opendata/ [3]
И много бюджетных данных есть на Едином портале бюджетной системы — http://budget.gov.ru/data/opendata [4] там есть структура бюджета в CSV формате, сами данные, справочники и многое и многое другое. А также данные по всем официальным учреждениям вот тут http://bus.gov.ru/public/opendata.html [5]. На этот ресурс обратите особое внимание. Там опубликованы индикаторы, бюджеты, уставы и многое другое по каждой государственной организации и муниципальном учреждении в России. Если Вы задумаете любой региональный проект, то эти данные будут просто бесценны.
Это не значит, что нельзя использовать какие-либо другие данные, безусловно можно и нужно, однако поскольку это конкурс Минфина России, то конечно ожидается что другие данные будут использоваться вместе с этими.
Я лично считаю, что не стоит ограничиваться только теми данными которые уже переведены в машиночитаемый вид. Есть также данные которые можно превратить в открытые данные самостоятельно.
Многие умеют писать парсеры, но для тех кто этого не делал раньше, хорошее подпорье может быть ScraperWiki (https://scraperwiki.com/ [6]) чтобы собрать информацию со страниц, а также разные библиотеки для разбора Excel файлов, извлечение таблиц из PDF документов — с помощью pdftables.com/ [7] или сервисов Abbyy или их Abbyy Finereader.
На сайте и других ресурсах Минфина кроме данных есть множество другого интересного что можно превратить в данные. Начиная просто от новостей которые стали особенно актуальны в последние дни, продолжая всем остальным.
Есть огромное направление в открытии данных которое мы столь долго упускали – это направление исторических данных. Тех которые хранятся в архивах в виде больших томов справочников с мириадами таблиц и которые просто необходимы в тот момент когда мы начинаем обращаться к истории, ссылаясь на факты, создавая спецпроекты посвящённые какому-либо событию.
В самые ближайшие дни будут опубликованы первые сканированные бюджеты Российской Империи и Советского Союза. Чуть позже, но тоже очень скоро, появятся все сканированные бюджеты Российской Империи, СССР и РСФСР которые только существуют.
Кроме сканов будут опубликованы и сами данные, преобразованные в таблицы Excel и CSV, реконструированные из справочников в первичном виде и приведенные нами в порядок для последующей визуализации или проекта.
Скажу честно, не будь я членом жюри этого конкурса, я бы лично сделал спецпроект на этих данных. А может быть его еще и сделаю когда конкурс закончится, а может быть кто-то сделает это до меня.
Уже готовы данные бюджетных росписей по нескольким годам, как первичные данные, полученные из текстов книг, так и обработанные и сопоставленные по разным годам.
Поэтому исторические данные вот-вот уже скоро будут, а пока можно начать использовать имеющиеся и заглянуть на общественный проект «Исторические материалы» (istmat.info [8]) где собраны многие бюджетные справочники СССР и Российской Империи.
Какие дополнительные источники данных у нас есть.
И многое другое.
Я знаю что многие используют данные из Википедии и DBPedia, кто-то собирает их сам, а кто придумывает что-то своё.
Во первых и в главных – это проекты по понятности государственных финансов. Наглядно представить как устроен бюджет или государственный долг или какая-то отдельная область финансов.
Во вторых, конечно же, бесконечное количество проектов может быть сделано на данных из bus.gov.ru.
Хотите сделать реестр больниц и сравнить их? Они все там.
Хотите сравнить между собой все государственные университеты? И они все там.
Хотите сделать карту доступности госуслуг и такие данные там есть.
Хотите визуализировать бюджеты МГУ, СПБГУ, МИФИ, МИРЭА или любого Вашего любимого университета? И это возможно.
А по историческим данным – просто даже визуализировать их и сравнить с тем что было и тем что есть сейчас – это уже большая и интересная задача.
Помимо возможности получить вполне материальный приз, а призовой фонд составляет 400 тысяч рублей, конечно же этим всё не ограничивается. Если проект окажется хорошим и интересным то, конечно, он будет упомянут на сайте Минфина и это само по себе дополнительная реклама любому хорошему проекту.
Конкурс начался с 23-го декабря и его сайт находится по адресу www.budgetapps.ru [15]. Там есть всё описание, несколько номинаций. Описание того как будет работать жюри и многое другое. Посмотрите, подумайте, и конечно же задавайте вопросы мне. Я буду отвечать тут и или напрямую пишите мне на почту — ibegtin@infoculture.ru [16]
Автор: ibegtin
Источник [17]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/api/78467
Ссылки в тексте:
[1] http://budgetapps.ru/contest: http://budgetapps.ru/contest
[2] Image: http://budgetapps.ru
[3] http://minfin.ru/ru/opendata/: http://minfin.ru/ru/opendata/
[4] http://budget.gov.ru/data/opendata: http://budget.gov.ru/data/opendata
[5] http://bus.gov.ru/public/opendata.html: http://bus.gov.ru/public/opendata.html
[6] https://scraperwiki.com/: https://scraperwiki.com/
[7] pdftables.com/: https://pdftables.com/
[8] istmat.info: http://istmat.info/statistics
[9] hubofdata.ru: http://hubofdata.ru
[10] http://roskazna.ru/opendata/: http://roskazna.ru/opendata/
[11] http://cbr.ru/scripts/Root.asp: http://cbr.ru/scripts/Root.asp
[12] http://data.gov.ru/ : http://data.gov.ru/
[13] http://data.worldbank.org/: http://data.worldbank.org/
[14] http://data.un.org/: http://data.un.org/
[15] www.budgetapps.ru: http://www.budgetapps.ru
[16] ibegtin@infoculture.ru: mailto:ibegtin@infoculture.ru
[17] Источник: http://habrahabr.ru/post/247117/
Нажмите здесь для печати.