Метка «PDF»

Долго ли, коротко ли, вместе с новой Visual Studio 2017 в релиз вышел ASP.NET Core. Тулинг лишился приставки preview, как и все инфраструктурные сборки, поставляемые Microsoft'ом. На мой взгляд, фреймворк получился отличным, а история с cjproj=>xproj=>project.json=>csproj и поломанная совместимость при переходе с RC1 на RC2 — это всё же разумная плата за скорость развития. Ну да ладно, опустим дела минувших дней, и вернёмся к текущим реалиям.

А реалии таковы, что есть задачи, и есть инструменты которые их решают. В частности, передо мной встала задача генерирования PDF-документов средствами ASP.NET Core. «Хмм… Наверняка уже есть что-то готовое...», — подумал я. Как бы не так. Вернее готовые библиотеки для этого есть, но платные, а вот чего-то OpenSource'ного нет. «А как же iText?», — спросите вы. «AGPL», — ответит вам страничка с лицензией на гитхабе. Для OpenSource проектов бесплатно, а для коммерческого использования, извольте заплатить. Ну что ж, раз нет инструмента, решающего мою задачу, значит я сделаю его сам.
Читать полностью »

Zathura, просмоторщик документов - 1

— В KDE есть Okular.
А у вас?
— А у GNOME есть Evince.
А у вас?

Для просмотра того текста, что Вы скомпилировали в PostScript или PDF или отсканировали в DjVu можно использовать огромное количество программ, и каждый выбирает по своему вкусу.

Морис Липп (Moritz Lipp) и Себастьян Рамашер (Sebastian Ramacher) из Грацского технического университета объединились в команду pwmt и написали программу Zathura. Думаю, она может понравится любителям минимализма и vim-подобных интерфейсов.
Читать полностью »

Вы купили книгу, а в стандартном ридере её не открыть. Позже узнаете, что нужна непростая программа Adobe Digital Editions, которая сможет открыть некий файл-ссылку вида URLLink.acsm. Вы устанавливаете, создаете Adobe ID. Открываете файл и вроде бы с облегчением вздыхаете, ведь долгожданная книга вот она — прямо перед вашим носом. Нажимаете клавишу вправо — на нажатие которой программа не откликается. Пробуете провести по сенсорному экрану — и тут недопонимание. Вводите номер страницы и после паузы в несколько мгновений понимаете, что перед вами брат-недоносок Adobe Acrobat'a.
Читать полностью »

Где-то около года назад набрел на довольно быстрый PDF-просмотрщик PDFMaster. Его очевидными преимуществами были заявленные разработчиками функции:

  • Чтение, открытие и просмотр PDF;
  • Поддержка форматов PDF, DJVU, CHM, EPUB, FB2;
  • Масшабируемость документа и удобный просмотр.

Особенно импонировало мне возможность также просмотра форматов epub и djvu, столь любимых сердцу всякого отечественного ученого и книголюба.

Поддавшись соблазну, пользовался им до недавнего времени — до тех пор, пока не получил следующее замечательное сообщение, установив антивирус AVG:

Мистер PDF мастер, вы случайно не с Суматры?

Что же это такая за угроза притаилась в данной программе?
Читать полностью »

в 8:24, , рубрики: itext, java, PDF, метки: , ,

image

Доброе время суток!

Недавно столкнулся с задачей: научиться вытаскивать текст из PDF запоминая его позицию на странице. И, конечно же, в несложной поначалу задаче вылезли подводные камни. Как же в итоге получилось это решить? Ответ под катом.
Читать полностью »

Всем доброго времени суток!

Хочу поделиться интересным знанием и новостью: журнал LinuxFormat объявил о расширении своей wiki-энциклопедии wiki.linuxformat.ru, где публикуются материалы из выпусков LinuxFormat — технологические статьи, приемы программирования, разработки с открытым кодом и многое другое по темам: Arduino‏‎, Blender‏‎, Cmake‏‎, Cairo‏‎, Debian,‏‎ Django‏‎, Fedora‏‎, Firefox‏‎, GIMP‏‎, GTK+‏, ‎Gambas‏‎, Gnome‏‎, Go‏‎, Hardcore Linux‏‎, Inkscape‏‎, Java‏‎, Lua‏‎, Maxima‏‎, Mono‏‎, Ogre‏‎, OpenOffice‏‎.org‏‎, PHP‏‎, Perl‏‎, PostgreSQL‏‎, Python‏‎, Qt‏‎, Raspberry PI, Samba‏‎, Scribus‏‎, TeX‏‎, Ubuntu‏‎ и т.д. и т.п.

Для задачи пополнения wiki-энциклопедии wiki.linuxformat.ru необходима поддержка сообщества, поскольку проект реализуется на полностью бесплатной для участников основе. Запущена краудфандинговая кампания на IndieGogo, где каждый желающий может внести свой вклад в развитие сообщества Open Source и помочь российским специалистам и подрастающему поколению получить доступ к масштабной базе знаний на русском языке!

Читать полностью »

Опубликован код движка для рендеринга PDF в браузере ChromeКомпания Google опубликовала под свободной лицензией BSD исходный код PDFium — движка, который осуществляет рендеринг PDF в браузере Chrome. Он осуществляет очень точный и быстрый рендеринг документов, не уступая Acrobat Reader.

Движок PDFium разработан при участии коммерческой компании Foxit Software, которая выпускает много проприетарных программ для работы с PDF, в том числе редакторы документов, быстрые индексаторы архивов, SDK для внедрения в сторонние продукты. Разработчики заявляют, что их программное обеспечение по производительности примерно в три раза превосходит любой другой софт для работы с PDF, включая фирменные программы от Adobe.

Судя по всему, Google лицензировала у Foxit Software движок рендеринга и добилась разрешения выложить исходный код в общественное пользование.
Читать полностью »

Как web страницу легко превратить в PDF?
Для меня было очень неожиданно то, что в хабе по Java практически нет информации по работе с PDF документами, поэтому я, из личного опыта, хочу на примере сервлета показать как легко можно любую web-страницу превратить в PDF документ.
Читать полностью »

Несколько месяцев назад я столкнулся с интересной задачей по анализу подозрительного pdf файла. К слову сказать, обычно я занимаюсь анализом защищенности веб приложений и не только веб, и не являюсь большим экспертом в направлении malware analysis, но случай представился довольно любопытный.

Практически все инструменты представленные в данной статье содержаться в дистрибутиве Remnux, созданном специально в целях reverse engineering malware. Вы можете сами загрузить себе образ виртуальной машины для VirtualBox или Vmware.
Читать полностью »

Доброго времени суток!

Экспорт Избранного на Хабре в PDF
Думаю многих из вас когда-либо посещала мысль «вот бы сохранить статьи с Хабра».
Такая же мысль посетила и меня два дня назад. Сохранить захотел не просто каждую статью, а только те, что в избранном, да не поштучно, а сразу всё скопом.
Первая мысль — надо написать скрипт, который всё это вытянет. Python я уже подучил, но вот с генерацией PDF на нем сталкиваться ещё не приходилось.

Закручинился я было… Но OpenSource и Хабр спасли меня!

Краткая суть статьи для тех, кому не интересно много читать

В статье описан доработанный скрипт на Python fav2pdf.
Изначальный автор скрипта vrtx, за что ему большое спасибо.
«Usage — лучше тысячи слов!»

usage: fav2pdf.py [-h] [-d OUTPUT_DIR] [--from-date FROM_DATE]
                  [--to-date TO_DATE] [--all-in-one]
                  [--only-hubs [ONLY_HUBS [ONLY_HUBS ...]]] [--no-comments]
                  [--no-symlinks]
                  user

Tool for save favorite posts from habrahabr.ru in pdfs

positional arguments:
  user                  habrahabr.ru username

optional arguments:
  -h, --help            show this help message and exit
  -d OUTPUT_DIR, --output-dir OUTPUT_DIR
                        Directory for output
  --from-date FROM_DATE
                        From date
  --to-date TO_DATE     To date
  --all-in-one          Save all posts in one PDF-file
  --only-hubs [ONLY_HUBS [ONLY_HUBS ...]]
                        Save only posts from hubs. For multiple: "--only-hubs
                        Hub1 Hub2 --"
  --no-comments         Dont save comments from posts
  --no-symlinks         Dont create symlinks to posts

Читать полностью »