- PVSM.RU - https://www.pvsm.ru -
По профилю работы DevOps-инженером я часто занимаюсь автоматизацией установки и настройки разнообразных IT-систем в различных средах: от контейнеров до облака. Приходилось работать со многими системами, основанными на Java-стеке: от небольших (вроде Tomcat), до масштабных (Hadoop, Cassandra и др.).
При этом почти каждая такая система, даже самая простая, почему-то имела сложную неповторимую систему запуска. Как минимум, это были многострочные shell-скрипты, как в Tomcat [1], а то и целые фреймворки, как в Hadoop [2]. Мой нынешний "пациент" из этой серии, вдохновивший меня на написание этой статьи — хранилище артефактов Nexus OSS 3 [3], скрипт запуска [4] которого занимает ~400 строк кода.
Непрозрачность, избыточность, запутанность startup-скриптов создает проблемы даже при ручной установке одного компонента на локальной системе. А теперь представьте, что набор таких компонентов и сервисов нужно запаковать в Docker-контейнер, попутно написав еще один слой абстракции для мало-мальски адекватного оркестрирования, развернуть в Kubernetes-кластере и реализовать этот процесс в виде CI/CD-пайплайна...
Короче говоря, давайте на примере упомянутого Nexus 3 разберемся, как вернуться из лабиринта shell-скриптов к чему-то более похожему на java -jar <program.jar>, учитывая наличие удобных современных DevOps-инструментов.
Если в двух словах, то в древние времена, когда при упоминании UNIX не переспрашивали: "в смысле, Linux?", не было Systemd и Docker и др., для управления процессами использовались переносимые shell-скрипты (init-скрипты) и PID-файлы. Init-скрипты задавали необходимые настройки окружения, которые в разных UNIX-ах были свои, и, в зависимости от аргументов, запускали процесс или перезапускали/останавливали его с помощью ID из PID-файла. Подход простой и понятный, но эти скрипты переставали работать при каждой нестандартной ситуации, требуя ручного вмешательства, не позволяли запустить несколько копий процесса… но не суть.
Так вот, если внимательно посмотреть на упомянутые выше startup-скрипты в Java-проектах, то можно в них разглядеть явные признаки этого доисторического подхода, включая даже упоминания SunOS, HP-UX и других UNIX-ов. Как правило, такие скрипты делают примерно следующее:
uname, /etc/*release и т.п.-Xms, -Xmx), количество потоков GC и др.-XX-параметры с учетом специфики выбранной версии JRE/JDKfor f in $path/*.jar; do CLASSPATH="${CLASSPATH}:$f"; donestart|stop|restart|reload|status|...&, nohup, специальные TCP-порты и прочие трюки из прошлого столетия (см. пример из Karaf [5])Упомянутый скрипт запуска Nexus 3 [4] — подходящий пример такого скрипта.
По сути, вся перечисленная выше скриптовая логика, как бы, пытается заменить системного администратора, который бы установил и настроил все вручную под конкретную систему от начала до конца. Но вообще любые требования самых разнообразных систем учесть, в принципе, невозможно. Поэтому получается, наоборот, головная боль, как для разработчиков, которым нужно поддерживать эти скрипты, так и для системных инженеров, которым в этих скриптах потом нужно разбираться. С моей точки зрения, системному инженеру гораздо проще один раз разобраться в параметрах JVM и настроить ее как надо, чем каждый раз при установке новой системы разбираться в тонкостях ее startup-скриптов.
У — про — щать! KISS [6] и YAGNI [7] нам в руки. Тем более, что на дворе 2018-й год, а это значит, что:
Так что давайте снова пройдемся по функционалу startup-скриптов еще раз с учетом перечисленных пунктов, не пытаясь при этом делать работу за системного инженера, и уберем оттуда все "лишнее".
/bin/bashjava и компания есть в стандартном системном пути-cp path/to/my/jars/* или даже, вообще, Uber-JAR [15]В итоге, нам нужно просто собрать и выполнить Java-команду вида java <opts> -jar <program.jar> с помощью выбранного менеджера процессов (Systemd, Docker и т.п.). Все параметры и опции (<opts>) мы оставляем на усмотрение системного инженера, который подстроит их под конкретную среду. Если список опций <opts> довольно длинный, можно вновь вернуться к идее startup-скрипта, но, в этом случае, максимально компактного и декларативного, т.е. не содержащего никакой программной логики.
В качестве примера давайте посмотрим, как можно упростить скрипт запуска Nexus 3 [4].
Самый простой вариант, чтобы не залезать в дебри этого скрипта — просто запустить его в реальных условиях (./nexus start) и посмотреть на результат. Например, можно найти полный список аргументов запущенного приложения в таблице процессов (через ps -ef), или запустить скрипт в режиме отладки (bash -x ./nexus start), чтобы наблюдать весь процесс его выполнения и в самом конце — команду запуска.
/usr/java/jdk1.8.0_171-amd64/bin/java -server -Dinstall4j.jvmDir=/usr/java/jdk1.8.0_171-amd64 -Dexe4j.moduleName=/home/nexus/nexus-3.12.1-01/bin/nexus -XX:+UnlockDiagnosticVMOptions -Dinstall4j.launcherId=245 -Dinstall4j.swt=false -Di4jv=0 -Di4jv=0 -Di4jv=0 -Di4jv=0 -Di4jv=0 -Xms1200M -Xmx1200M -XX:MaxDirectMemorySize=2G -XX:+UnlockDiagnosticVMOptions -XX:+UnsyncloadClass -XX:+LogVMOutput -XX:LogFile=../sonatype-work/nexus3/log/jvm.log -XX:-OmitStackTraceInFastThrow -Djava.net.preferIPv4Stack=true -Dkaraf.home=. -Dkaraf.base=. -Dkaraf.etc=etc/karaf -Djava.util.logging.config.file=etc/karaf/java.util.logging.properties -Dkaraf.data=../sonatype-work/nexus3 -Djava.io.tmpdir=../sonatype-work/nexus3/tmp -Dkaraf.startLocalConsole=false -Di4j.vpt=true -classpath /home/nexus/nexus-3.12.1-01/.install4j/i4jruntime.jar:/home/nexus/nexus-3.12.1-01/lib/boot/nexus-main.jar:/home/nexus/nexus-3.12.1-01/lib/boot/org.apache.karaf.main-4.0.9.jar:/home/nexus/nexus-3.12.1-01/lib/boot/org.osgi.core-6.0.0.jar:/home/nexus/nexus-3.12.1-01/lib/boot/org.apache.karaf.diagnostic.boot-4.0.9.jar:/home/nexus/nexus-3.12.1-01/lib/boot/org.apache.karaf.jaas.boot-4.0.9.jar com.install4j.runtime.launcher.UnixLauncher start 9d17dc87 '' '' org.sonatype.nexus.karaf.NexusMain
Вначале применим к ней пару простых приемов:
/the/long/and/winding/road/to/my/java на java, ведь она есть в системном путиJAVA_OPTS = (
'-server'
'-Dexe4j.moduleName=/home/nexus/nexus-3.12.1-01/bin/nexus'
'-Di4j.vpt=true'
'-Di4jv=0'
'-Dinstall4j.jvmDir=/usr/java/jdk1.8.0_171-amd64'
'-Dinstall4j.launcherId=245'
'-Dinstall4j.swt=false'
'-Djava.io.tmpdir=../sonatype-work/nexus3/tmp'
'-Djava.net.preferIPv4Stack=true'
'-Djava.util.logging.config.file=etc/karaf/java.util.logging.properties'
'-Dkaraf.base=.'
'-Dkaraf.data=../sonatype-work/nexus3'
'-Dkaraf.etc=etc/karaf'
'-Dkaraf.home=.'
'-Dkaraf.startLocalConsole=false'
'-XX:+LogVMOutput'
'-XX:+UnlockDiagnosticVMOptions'
'-XX:+UnlockDiagnosticVMOptions'
'-XX:+UnsyncloadClass'
'-XX:-OmitStackTraceInFastThrow'
'-XX:LogFile=../sonatype-work/nexus3/log/jvm.log'
'-XX:MaxDirectMemorySize=2G'
'-Xms1200M'
'-Xmx1200M'
'-classpath /home/nexus/nexus-3.12.1-01/.install4j/i4jruntime.jar:/home/nexus/nexus-3.12.1-01/lib/boot/nexus-main.jar:/home/nexus/nexus-3.12.1-01/lib/boot/org.apache.karaf.main-4.0.9.jar:/home/nexus/nexus-3.12.1-01/lib/boot/org.osgi.core-6.0.0.jar:/home/nexus/nexus-3.12.1-01/lib/boot/org.apache.karaf.diagnostic.boot-4.0.9.jar:/home/nexus/nexus-3.12.1-01/lib/boot/'
)
java ${JAVA_OPTS[*]} com.install4j.runtime.launcher.UnixLauncher start 9d17dc87 '' '' org.sonatype.nexus.karaf.NexusMain
Теперь можно идти в глубину.
Install4j [17] — это такой графический Java-инсталлятор. Похоже, что он используется для начальной установки системы. На сервере он нам не нужен, убираем.
Договоримся о размещении компоненты и данные Nexus на файловой системе:
/opt/nexus-<version>/opt/nexus -> /opt/nexus-<version>/opt/nexus/bin/nexus/data/nexusСамо создание каталогов и ссылок — удел систем управления конфигурациями (на все про все 5-10 строчек в Ansible), поэтому оставим эту задачу системным инженерам.
Пусть наш скрипт при запуске меняет рабочий каталог на /opt/nexus — тогда мы сможем поменять пути к компонентам Nexus на относительные.
Опции вида -Dkaraf.* — это настройки Apache Karaf [18], OSGi-контейнера, в который, очевидно, "запакован" наш Nexus. Поменяем karaf.home, karaf.base, karaf.etc и karaf.data соответственно размещению компонентов, по возможности используя относительные пути.
Видя, что CLASSPATH состоит из списка jar-файлов, которые лежат в одном каталоге lib/, заменим весь этот список на lib/*.
Поменяем java на exec java, чтобы наш скрипт на запускал java как дочерний процесс (менеджер процессов этот дочерний процесс просто не увидит), а "заменял" себя на java (описание exec [19]).
Посмотрим, что нас получилось:
#!/bin/bash
JAVA_OPTS=(
'-Xms1200M'
'-Xmx1200M'
'-XX:+UnlockDiagnosticVMOptions'
'-XX:+LogVMOutput'
'-XX:+UnsyncloadClass'
'-XX:LogFile=/data/nexus/log/jvm.log'
'-XX:MaxDirectMemorySize=2G'
'-XX:-OmitStackTraceInFastThrow'
'-Djava.io.tmpdir=/data/nexus/tmp'
'-Djava.net.preferIPv4Stack=true'
'-Djava.util.logging.config.file=etc/karaf/java.util.logging.properties'
'-Dkaraf.home=.'
'-Dkaraf.base=.'
'-Dkaraf.etc=etc/karaf'
'-Dkaraf.data=/data/nexus/data'
'-Dkaraf.startLocalConsole=false'
'-server'
'-cp lib/boot/*'
)
cd /opt/nexus
&& exec java ${JAVA_OPTS[*]} org.sonatype.nexus.karaf.NexusMain
Итого всего 25 строчек вместо >400, прозрачно, понятно, декларативно, никакой лишней логики. При необходимости этот скрипт легко превратить в темплейт для Ansible/Puppet/Chef и добавить туда только ту логику, которая нужна для конкретной ситуации.
Этот скрипт можно использовать в качестве ENTRYPOINT в Dockerfile или вызывать в unit-файле Systemd, заодно подстроив там ulimits и другие системные параметры, например:
[Unit]
Description=Nexus
After=network.target
[Service]
Type=simple
LimitNOFILE=1048576
ExecStart=/opt/nexus/bin/nexus
User=nexus
Restart=on-abort
[Install]
WantedBy=multi-user.target
Какие выводы можно сделать из этой статьи? В принципе, все сводится к паре пунктов:
Спасибо за внимание! Буду рад обратной связи и конструктивной дискуссии в комментариях.
Автор: tagirb
Источник [20]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/java/284720
Ссылки в тексте:
[1] Tomcat: https://github.com/apache/tomcat/tree/trunk/bin
[2] Hadoop: https://github.com/apache/hadoop/tree/trunk/hadoop-common-project/hadoop-common/src/main/bin
[3] Nexus OSS 3: https://www.sonatype.com/nexus-repository-oss
[4] скрипт запуска: https://github.com/sonatype/nexus-public/blob/master/assemblies/nexus-base-template/src/main/resources/overlay/bin/nexus
[5] пример из Karaf: https://github.com/apache/karaf/blob/master/main/src/main/java/org/apache/karaf/main/Status.java
[6] KISS: https://ru.wikipedia.org/wiki/KISS_(%D0%BF%D1%80%D0%B8%D0%BD%D1%86%D0%B8%D0%BF)
[7] YAGNI: https://ru.wikipedia.org/wiki/YAGNI
[8] Systemd: https://ru.wikipedia.org/wiki/Systemd
[9] Docker: https://ru.wikipedia.org/wiki/Docker
[10] Kubernetes: https://ru.wikipedia.org/wiki/Kubernetes
[11] Ansible: https://ru.wikipedia.org/wiki/Ansible
[12] "серверов-снежинок": https://martinfowler.com/bliki/SnowflakeServer.html
[13] пример: https://github.com/prometheus/jmx_exporter
[14] пример: https://metrics.dropwizard.io/4.0.0/
[15] Uber-JAR: https://imagej.net/Uber-JAR
[16] массив: http://tldp.org/LDP/Bash-Beginners-Guide/html/sect_10_02.html
[17] Install4j: https://www.ej-technologies.com/products/install4j/overview.html
[18] Apache Karaf: https://en.wikipedia.org/wiki/Apache_Karaf
[19] описание exec: http://wiki.bash-hackers.org/commands/builtin/exec
[20] Источник: https://habr.com/post/415893/?utm_campaign=415893
Нажмите здесь для печати.