Рубрика «PDF»

GraphCompose: как я приволок ECS из геймдева и снапшот-тесты из фронта в PDF-генерацию на Java

2026-05-03 в 8:15, admin, рубрики: backend, document generation, graphcompose, java, layout engine, open source, pagination, PDF, PDFBox, visual regression

С чего всё началось: проблема, которая бесила

В мире Java для генерации PDF исторически есть три лагеря:

Низкоуровневые рисовалки — iText, PDFBox. Быстро, мощно, но ты буквально пишешь на бумаге пиксели координатами. Любой инвойс превращается в 200 строк contentStream.beginText() / setFont() / newLineAtOffset(...). А потом приходит дизайнер и говорит: «отступ должен быть 14, а не 12».
Шаблонные движки — JasperReports, OpenPDF. Удобно для отчётов, но XML-шаблон — это отдельный язык, отдельный инструментарий, отдельная боль на ревью. Изменения логики растекаются между Java-кодом, JRXML и DTO.
HTML→PDFЧитать полностью »

Создал с нуля библиотеку для JasperReports, которая делает работу с ним легкой

2026-04-03 в 9:25, admin, рубрики: jasper, jasperreports, java, library, PDF, reporting, reports

Если вы когда-нибудь работали с JasperReports в Java-проекте, вы знаете это чувство: всё вроде работает, но каждое изменение в отчёте - это боль. Данные передаются через хрупкие механизмы, бизнес-логика утекает в XML, а субрепорты - единственный способ навести порядок - сами по себе настолько неудобны, что проще не трогать.

За последние пару лет я несколько раз столкнулся с репортингом на JasperReports. Каждый раз одни и те же проблемы: монолитные шаблоны, неочевидный поток данных, ручная синхронизация между Java и JRXML. В какой-то момент я решил это системно исправить - и написал библиотеку jasper-modular, которая решает две ключевые проблемы:Читать полностью »

Рубрикатор клинических рекомендаций Минздрава РФ: почему врачу неудобно работать с PDF

2026-03-20 в 18:12, admin, рубрики: medtech, nlp, PDF, sematic search, клинические рекомендации, медицинский поиск, Минздрав РФ, МКБ-10, офлайн-доступ, рубрикатор

Когда смотришь на поисковые запросы вокруг клинических рекомендаций, быстро становится видно, что пользователю нужен не «еще один каталог PDF», а нормальный слой доступа к знаниям.

В одном кластере живут запросы вроде «рубрикатор клинических рекомендаций», «клинические рекомендации Минздрав», «клинические рекомендации 2025» и «клинические рекомендации 2026». В другом — «клинические рекомендации у детей», «клинические рекомендации у взрослых», «новорожденный клинические рекомендации». В третьем — «тесты по клиническим рекомендациям», Читать полностью »

Как я перестал верстать чеки в коде и написал визуальный редактор шаблонов для Flutter

2026-03-10 в 8:46, admin, рубрики: dart, flutter, iOS, PDF, windows, мобильная разработка, утилита

Привет!

Если вы хоть раз писали приложение для ритейла, склада или кафе на Flutter, то наверняка сталкивались с «тихим ужасом» — версткой документов для печати. Пакет pdfЧитать полностью »

Как уместить опыт в одностраничный PDF

2026-03-10 в 5:16, admin, рубрики: CV, llm, n8n, open source, PDF, адаптация резюме, карьерный опыт, поиск работы в it, резюме

Что-то пошло не так

Читать полностью »

Как написать конвертер веб-страниц в PDF и не сойти с ума

2026-02-24 в 15:16, admin, рубрики: PDF, PDFViewer, расширения chrome

Вам когда-нибудь хотелось сохранить статью в PDF без лишних деталей, только в виде текста? Или сохранить только определённый элемент страницы? И чтобы всё это было на одной длинной странице, без разрывов?

Читать полностью »

Как гуманитарий за 2 месяца с нуля RAG систему построил, или Парсинг PDF по-хардкору

2026-02-13 в 9:15, admin, рубрики: bm25, embeddings, faiss, nlp, ocr, PDF, rag, tesseract, машинное обучение. нейросети python, Построение поисковых систем

Введение

Добрый день. Сегодня я расскажу о том, как я за 2 месяца с полного нуля создал доменную RAG систему с корпусом в 20+ книг. В статье затрону проблемы парсинга данных (особенно PDF документов, с которыми приходилось иметь дело), чанкинга, создания и индексации эмбеддингов, а также самого интересного – ретривера. Расскажу о latency, трейд-оффах, и сложностях реализации подобных систем локально на ноутбуке (хоть и «игровом») без использования API LLM.

Вся система делалась мной самостоятельно без использования LangChain Читать полностью »

Docs-as-Code на практике: автоматизация сборки документации в проекте ODS

2025-12-26 в 11:16, admin, рубрики: asciidoc, asciidoctor, docs as code, documentation, PDF, генератор статических сайтов, техническая документация, технический писатель

В статье приводится практический опыт перехода от “офисных” документов к подходу Docs‑as‑Code на примере проекта ODS (Open Documentation Standard). Рассматриваются причины отказа от MS Word и выбор AsciiDoc, версионирование документации в Git, автоматизацию сборки PDF и публикацию документации на сайте, используя генератор статических сайтов – Antora.

Эта статья о проекте ODS (Open Documentation Standard) – открытом стандарте и инструментарии для автоматизации процессов создания и поддержки технической документации в ИТ и других проектах.
(Не связан с форматом OpenDocument Spreadsheet (.ods) или проектами Open Data.)

В открытом доступе находятся Читать полностью »