- PVSM.RU - https://www.pvsm.ru -

Toolbox для исследователей — третий выпуск: поиск источников и работа с ними

Работа над любым исследовательским проектом включает в себя поиск и изучение множества источников информации. Организация этого процесса — непростая задача. Сегодня мы расскажем об инструментах, которые призваны оптимизировать различные ее составляющие.

Toolbox для исследователей — третий выпуск: поиск источников и работа с ними - 1
Фото João Silas [3] — Unsplash

Вендоры академического ПО часто работают по принципу сотрудничества с образовательными учреждениями. Если ваша организация не приобрела интересующий вас продукт — организовать доступ к нему может быть тяжело. Если и существуют индивидуальные планы, платить за них из собственного кармана готовы не все. С другой стороны, открытые или бесплатные продукты, созданные академиками, нередко страдают от неудобного дизайна и отсутствия поддержки.

Можно попробовать много разных инструментов, прежде чем остановиться на рабочем варианте. Мы решили рассказать о наиболее заметных на Hacker News и в подборках на GitHub.

Поиск источников

DOAJ [4] — курируемый каталог открытых научных журналов. В его базе — более 4 миллионов статей из 13 тысяч изданий, представляющих 130 стран. В ближайшем будущем площадка планирует [5] значительно увеличить количество гуманитарных, узкоспециализированных и неанглоязычных журналов. Что интересно, DOAJ предоставляют открытый API [6] для автоматизации поиска по различным параметрам.

Peerus [7] — помогает отслеживать свежие тематические публикации. Каждый день архив пополняется в среднем на 7 тысяч новых материалов. Peerus предоставляет [8] интеграцию с университетскими прокси для загрузки материалов в один клик.

Crossref [9] — открытый архив для публикации и поиска научных работ. Цель проекта — объединить ученых со всего мира на одной площадке, чтобы они могли совместно решать исследовательские задачи. На сайте уже собрали сто миллионов записей. Найти нужный контент можно по метаданным и ключевым словам.

SciRate [10] — веб-приложение для поиска исследований на arXiv.org [11]. Есть фильтры по научным областям и дате публикации. Дополнительно реализована система пользовательских оценок, на базе которой каждой статье присваивается рейтинг.

ArXiv Sanity Preserver [12] — ускоряет поиск по arXiv.org с помощью алгоритмов машинного обучения. На стартовой странице отображаются самые новые материалы вместе с аннотацией. Искать публикации можно по ключевым словам — в поисковой строке, а также по похожим признакам — с помощью ссылки show similar, которая расположена в правом верхнем углу возле каждого документа.

OSF [13] — открытый хаб для поиска и создания научных проектов. Тут можно структурировать исследовательскую работу — наладить контроль за версиями и добавить тэги, чтобы публикацию нашли другие люди. Платформа предполагает работу в облаке, что облегчает доступ к своим проектам. Наработками можно заниматься самостоятельно и делиться с членами сообщества.

Организация и цитирование

doi2bib [14] — поисковой движок для работы со списками источников. В строку поиска вводится цифровой идентификатор объекта (DOI), и система отображает метаданные по найденному материалу для организации списка библиографии в формате BibTeX [15].

JabRef [16] — приложение, которое оптимизирует работу с библиографическими списками в формате BibTeX. Сгенерированный список экспортируется в HTML, Docbook, BibTeXML, MODS, RTF, Refer/Endnote, OpenOffice и LibreOffice. Запустить утилиту можно на Java VM (версия 8 [17]), под Win, Linux и OS X.

Mendeley [18] — менеджер библиографических списков и облачная платформа, которая позволяет получить доступ к файлам по проекту с любого устройства. Mendeley также предлагает рекомендательные возможности и инструменты для общения.

Docear [19] — открытый инструмент для организации источников и построения научной работы на их основе. Пользователю нужно указать папку, которая будет играть роль «библиотеки» материалов по определенному проекту. Программа будет автоматически сканировать ее и добавлять найденные файлы в свою базу данных. Базу данных можно структурировать в виде «дерева», объединяя в одну ветку работы одной направленности. Комментарии и выделения в pdf-файлах автоматически импортируются и также отображаются в интерфейсе. Когда работа с источниками закончится, Docear поможет сформировать итоговый «mind map» и предоставит необходимые цитирования.

Duecredit [20] — цитировать можно не только текст, но и код. Если ваша программа заимствует алгоритмы или методы из научных работ, эта библиотека поможет вам корректно на них сослаться. На данный момент библиотека доступна на Python.

Работа с документами

Sphinx [21] — инструмент для «компиляции» документов в reStructuredText'е [22] в HTML, ePub, Texinfo, man-страницы и plain-text. Поддерживает 50 расширений [23], автоматическую индексацию программных компонентов, создание ссылок для функций, классов, цитат, терминов и проч. Для новичков разработчики подготовили туториал [24] и гайд для быстрого старта [25]. Дополнительно предлагаем посмотреть следующие темы для работы в Sphinx: rtd [26] — поддерживает как Sphinx, так и Read the Docs [27]; Bootstrap [28] — тема, где CSS-шаблоны и JavaScript-расширения фреймворка Bootstrap интегрировали с функционалом Sphinx: навигацией, иерархическим меню и проч.

Toolbox для исследователей — третий выпуск: поиск источников и работа с ними - 2
Фото freddie marriage [29] — Unsplash

Git-scribe [30] — открытый инструмент, заточенный под создание электронных книг. Предоставляет функционал для структурирования текста, редактуры, вычитки, коррекции, совместной работы, а также публикации и экспорта в PDF, mobi и epub.

Jupyter Notebook [31] — текстовой редактор со встроенной средой для интерактивного программирования на Python. Ранее был известен под именем iPython Notebook. Можно установить как локально, так и на VPS [32], существуют [33] облачные версии продукта.

Texture [34] — интерфейс этого редактора дает доступ к широкому ряду специализированных функций — таких, как создание графиков, формул и разных способов цитирования. Программа использует специальный файловый формат, который при желании можно «распаковать» и разобрать на составляющие. По словам создателей Texture, это позволяет издателям упростить процесс редактирования и рецензирования.


Что внутри Университета ИТМО:

Автор: itmo

Источник [40]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/gtd/320654

Ссылки в тексте:

[1] Toolbox для исследователей #2: подборка из 15 тематических банков данных: https://habr.com/ru/company/spbifmo/blog/453408/

[2] Toolbox для исследователей #1: самоорганизация и визуализация данных: https://habr.com/ru/company/spbifmo/blog/451126/

[3] João Silas: https://unsplash.com/photos/I_LgQ8JZFGE

[4] DOAJ: https://doaj.org/

[5] планирует: https://drive.google.com/file/d/1gVGp6aXtrOCp9z5qeNi413RZc0Vs5UQn/view

[6] открытый API: https://doaj.org/api/v1/docs

[7] Peerus: https://peer.us/

[8] предоставляет: https://peer.us/faq/#pdf-dowload

[9] Crossref: https://www.crossref.org/

[10] SciRate: https://scirate.com/

[11] arXiv.org: https://arxiv.org/

[12] ArXiv Sanity Preserver: http://arxiv-sanity.com/

[13] OSF: https://osf.io/

[14] doi2bib: https://www.doi2bib.org/

[15] BibTeX: https://ru.wikipedia.org/wiki/BibTeX

[16] JabRef: https://www.jabref.org/

[17] версия 8: https://github.com/JabRef/jabref/issues/2594

[18] Mendeley: https://www.mendeley.com/

[19] Docear: http://www.docear.org/

[20] Duecredit: https://github.com/duecredit/duecredit

[21] Sphinx: http://sphinx-doc.org/

[22] reStructuredText'е: https://ru.wikipedia.org/wiki/ReStructuredText

[23] 50 расширений: http://www.sphinx-doc.org/en/master/develop.html#extensions

[24] туториал: https://matplotlib.org/sampledoc/

[25] гайд для быстрого старта: http://www.sphinx-doc.org/en/master/usage/quickstart.html

[26] rtd: https://github.com/rtfd/sphinx_rtd_theme

[27] Read the Docs: https://readthedocs.org/

[28] Bootstrap: https://ryan-roemer.github.io/sphinx-bootstrap-theme/

[29] freddie marriage: https://unsplash.com/photos/vSchPA-YA_A

[30] Git-scribe: https://github.com/schacon/git-scribe

[31] Jupyter Notebook: https://jupyter.org/about

[32] VPS: https://www.reg.ru/?rlink=reflink-717

[33] существуют: https://notebooks.azure.com/

[34] Texture: https://substance.io/texture/

[35] Показываем лабораторию «Перспективные наноматериалы и оптоэлектронные устройства»: https://habr.com/ru/company/spbifmo/blog/450552/

[36] Что делают в лаборатории квантовых материалов Университета ИТМО: https://habr.com/ru/company/spbifmo/blog/449778/

[37] Механизированные руки и манипуляторы — чем занимается лаборатория робототехники: https://habr.com/en/company/spbifmo/blog/441458/

[38] Экскурсия по нашей лаборатории киберфизических систем: https://habr.com/ru/company/spbifmo/blog/435250/

[39] Фаблаб Университета ИТМО: DIY-коворкинг для творческих людей — показываем, что внутри: https://habr.com/en/company/spbifmo/blog/434976/

[40] Источник: https://habr.com/ru/post/455850/?utm_source=habrahabr&utm_medium=rss&utm_campaign=455850