- PVSM.RU - https://www.pvsm.ru -
Прошло достаточно времени с упоминания в предыдущей публикации [1] об использовании RStudio Connect в боевых условиях для того, чтобы поделиться результатами. Краткое резюме — «дайте два!». И подумайте про оптимизацию отдела «аналитиков». Ниже приведены подробности.
В качестве дополнительного чтения рекомендую взглянуть детальную публикацию «Data at GDS (Government Digital Service). Reproducible Analytical Pipeline» [2] в блоге аналитической службы гос.органов UK по аналогичной теме.
RStudio Connect [3] — немного платный [4] продукт для публикации аналитической информации как внутри компании, так и для всего остального мира. Аналитическая обработка и подготовка отчетных представлений производится средствами R. Сервер работает on-premise на *nix платформе, что автоматически устраняет 3 повода для головной боли: нет облаков, нет лицензирования Win Server (а еще вдруг и SQL) и отстутствие проблем с Unicode.
Я сознательно написал «аналитическая информация», потому что представления, генерируемые R+RStudio Connect очень далеки от классических отчетов типа JasperBO… Основные практически полезные публикуемые результатаnы (отчеты) можно отнести к трем основным классам:

html и pdf документы формируются в парадигме literate programming из R Markdown [5] исходных файлов, содержащих текстовое описание и включения кода для динамического расчета и визуализации результатов этих расчетов в виде таблиц, рисунков и интерактивных js виджетов. В последнем релизе RStudio Connect отчеты могут быть параметризированы [6] (пока не было необходимости проверять), что добавляет дополнительной гибкости.

Преимущества такого подхода очевидны:
Поскольку RStudio Connect является enterprise-ориентированным, то в базе есть все обязательные функции:
Каждому опубликованному документу могут быть разные права доступа. Начиная от «только автор» и заканчивая «просмотр всем кто знает ссылку».

А вот почему термин «отчеты» использован в кавычках. Интересный вытекающий вывод из связки функций запуск по расписанию + literate programming + e-mail уведомления следующий:
по сути, мы можем по расписанию выполнять любые R скрипты, встроенные исполняемыми блоками в .Rmd файлы. Эти скрипты могут выполнять абсолютно любые действия, например, брать данные из файловБД, заниматься web scrapping-ом вести расчеты, публиковать данные во внешние системы запускать внешние скрипты и пр., при этом ведется подробный «story-лог» в виде комбинации текста, таблиц, графиков. И этот «story-лог» по завершению работы может быть автоматически отправлен заинтересованным лицам. Т.е. система в популярном ныне жанре «комиксов» может докладывать о результатах работы весьма сложных процессов!
Фактически, идеальный инструмент для практической реализации концепции операционой аналитики.

Прикладываю сам PDF файл [8]. Бусские буквы находятся в Adobe Reader и в таблицах, созданных вставкой R-кода, и в рисунках и в тексте.
С технической точки зрения pdf версия готовится посредством цепочки R markdown → LaTeX → PDF. Так что на выходе получается полиграфически качественный документ с огромными возможностями по кастомизации.
Тут все просто. Встроенный Shiny Server c enterprise функциями. Все, что было написано про Shiny ранее доступно в полном объеме.
А публикация приложений в «одно нажатие» позволяет легко и просто делать всевозможные дашборды, интерактивные приложения, включая онлайн аналитику на сервере и кастомные представления для любого сотрудника под его текущие потребности.
Нет никаких ограничений на количество опубликованных приложений. Не нужен никакой администратор для публикации. Не надо записываться в очередь к разработчикам. Бери, да делай.

Более того, интеграция с корпоративным LDAP легко позволяет управлять зоной видимости этих приложений.
Несмотря на то, что продукт вышел недавно, он по своей сути является enterprise оберткой для многократно апробированных кубиков Shiny + RMarkdown + R + LaTeX.
В промышленной эксплуатации он показал себя превосходно. Более того, в воздухе повис вопрос «зачем нам теперь нужны прочие n+1 установленные 'системы отчетности'» на который убедительных ответов пока не найдено.
P.S.
Предыдущий пост: «'Пятый элемент' в экосистеме R. WYSIWYG интерфейс для аналитиков» [1]
Автор: Илья Шутов
Источник [9]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/data-mining/252431
Ссылки в тексте:
[1] предыдущей публикации: https://habrahabr.ru/post/325108/
[2] «Data at GDS (Government Digital Service). Reproducible Analytical Pipeline»: https://gdsdata.blog.gov.uk/2017/03/27/reproducible-analytical-pipeline/
[3] RStudio Connect: https://www.rstudio.com/products/connect/
[4] немного платный: https://www.rstudio.com/pricing/
[5] R Markdown: http://rmarkdown.rstudio.com
[6] параметризированы: http://rmarkdown.rstudio.com/developer_parameterized_reports.html
[7] здесь: http://gallery.htmlwidgets.org/
[8] сам PDF файл: https://www.dropbox.com/s/1908q69kftfkvxg/ru-tex-pdf-examples.pdf?dl=0
[9] Источник: https://habrahabr.ru/post/326238/
Нажмите здесь для печати.