Toolbox для исследователей — третий выпуск: поиск источников и работа с ними

в 14:31, , рубрики: gtd, Блог компании Университет ИТМО, подборка инструментов, работа с иточниками, Университет ИТМО

Работа над любым исследовательским проектом включает в себя поиск и изучение множества источников информации. Организация этого процесса — непростая задача. Сегодня мы расскажем об инструментах, которые призваны оптимизировать различные ее составляющие.

Toolbox для исследователей — третий выпуск: поиск источников и работа с ними - 1
Фото João Silas — Unsplash

Вендоры академического ПО часто работают по принципу сотрудничества с образовательными учреждениями. Если ваша организация не приобрела интересующий вас продукт — организовать доступ к нему может быть тяжело. Если и существуют индивидуальные планы, платить за них из собственного кармана готовы не все. С другой стороны, открытые или бесплатные продукты, созданные академиками, нередко страдают от неудобного дизайна и отсутствия поддержки.

Можно попробовать много разных инструментов, прежде чем остановиться на рабочем варианте. Мы решили рассказать о наиболее заметных на Hacker News и в подборках на GitHub.

Поиск источников

DOAJ — курируемый каталог открытых научных журналов. В его базе — более 4 миллионов статей из 13 тысяч изданий, представляющих 130 стран. В ближайшем будущем площадка планирует значительно увеличить количество гуманитарных, узкоспециализированных и неанглоязычных журналов. Что интересно, DOAJ предоставляют открытый API для автоматизации поиска по различным параметрам.

Peerus — помогает отслеживать свежие тематические публикации. Каждый день архив пополняется в среднем на 7 тысяч новых материалов. Peerus предоставляет интеграцию с университетскими прокси для загрузки материалов в один клик.

Crossref — открытый архив для публикации и поиска научных работ. Цель проекта — объединить ученых со всего мира на одной площадке, чтобы они могли совместно решать исследовательские задачи. На сайте уже собрали сто миллионов записей. Найти нужный контент можно по метаданным и ключевым словам.

SciRate — веб-приложение для поиска исследований на arXiv.org. Есть фильтры по научным областям и дате публикации. Дополнительно реализована система пользовательских оценок, на базе которой каждой статье присваивается рейтинг.

ArXiv Sanity Preserver — ускоряет поиск по arXiv.org с помощью алгоритмов машинного обучения. На стартовой странице отображаются самые новые материалы вместе с аннотацией. Искать публикации можно по ключевым словам — в поисковой строке, а также по похожим признакам — с помощью ссылки show similar, которая расположена в правом верхнем углу возле каждого документа.

OSF — открытый хаб для поиска и создания научных проектов. Тут можно структурировать исследовательскую работу — наладить контроль за версиями и добавить тэги, чтобы публикацию нашли другие люди. Платформа предполагает работу в облаке, что облегчает доступ к своим проектам. Наработками можно заниматься самостоятельно и делиться с членами сообщества.

Организация и цитирование

doi2bib — поисковой движок для работы со списками источников. В строку поиска вводится цифровой идентификатор объекта (DOI), и система отображает метаданные по найденному материалу для организации списка библиографии в формате BibTeX.

JabRef — приложение, которое оптимизирует работу с библиографическими списками в формате BibTeX. Сгенерированный список экспортируется в HTML, Docbook, BibTeXML, MODS, RTF, Refer/Endnote, OpenOffice и LibreOffice. Запустить утилиту можно на Java VM (версия 8), под Win, Linux и OS X.

Mendeley — менеджер библиографических списков и облачная платформа, которая позволяет получить доступ к файлам по проекту с любого устройства. Mendeley также предлагает рекомендательные возможности и инструменты для общения.

Docear — открытый инструмент для организации источников и построения научной работы на их основе. Пользователю нужно указать папку, которая будет играть роль «библиотеки» материалов по определенному проекту. Программа будет автоматически сканировать ее и добавлять найденные файлы в свою базу данных. Базу данных можно структурировать в виде «дерева», объединяя в одну ветку работы одной направленности. Комментарии и выделения в pdf-файлах автоматически импортируются и также отображаются в интерфейсе. Когда работа с источниками закончится, Docear поможет сформировать итоговый «mind map» и предоставит необходимые цитирования.

Duecredit — цитировать можно не только текст, но и код. Если ваша программа заимствует алгоритмы или методы из научных работ, эта библиотека поможет вам корректно на них сослаться. На данный момент библиотека доступна на Python.

Работа с документами

Sphinx — инструмент для «компиляции» документов в reStructuredText'е в HTML, ePub, Texinfo, man-страницы и plain-text. Поддерживает 50 расширений, автоматическую индексацию программных компонентов, создание ссылок для функций, классов, цитат, терминов и проч. Для новичков разработчики подготовили туториал и гайд для быстрого старта. Дополнительно предлагаем посмотреть следующие темы для работы в Sphinx: rtd — поддерживает как Sphinx, так и Read the Docs; Bootstrap — тема, где CSS-шаблоны и JavaScript-расширения фреймворка Bootstrap интегрировали с функционалом Sphinx: навигацией, иерархическим меню и проч.

Toolbox для исследователей — третий выпуск: поиск источников и работа с ними - 2
Фото freddie marriage — Unsplash

Git-scribe — открытый инструмент, заточенный под создание электронных книг. Предоставляет функционал для структурирования текста, редактуры, вычитки, коррекции, совместной работы, а также публикации и экспорта в PDF, mobi и epub.

Jupyter Notebook — текстовой редактор со встроенной средой для интерактивного программирования на Python. Ранее был известен под именем iPython Notebook. Можно установить как локально, так и на VPS, существуют облачные версии продукта.

Texture — интерфейс этого редактора дает доступ к широкому ряду специализированных функций — таких, как создание графиков, формул и разных способов цитирования. Программа использует специальный файловый формат, который при желании можно «распаковать» и разобрать на составляющие. По словам создателей Texture, это позволяет издателям упростить процесс редактирования и рецензирования.


Что внутри Университета ИТМО:

Автор: itmo

Источник

* - обязательные к заполнению поля