From 04391b1ba45ef2d64c059afec495be3704019f7a Mon Sep 17 00:00:00 2001 From: Sergey Matveev Date: Tue, 13 Oct 2020 19:51:04 +0300 Subject: [PATCH] =?utf8?q?PDF=20=D1=84=D0=BE=D1=80=D0=BC=D0=B0=D1=82=20?= =?utf8?q?=D1=81=20=D1=82=D0=BE=D1=87=D0=BA=D0=B8=20=D0=B7=D1=80=D0=B5?= =?utf8?q?=D0=BD=D0=B8=D1=8F=20=D0=BF=D1=80=D0=BE=D0=B3=D1=80=D0=B0=D0=BC?= =?utf8?q?=D0=BC=D0=B8=D1=81=D1=82=D0=B0?= MIME-Version: 1.0 Content-Type: text/plain; charset=utf8 Content-Transfer-Encoding: 8bit https://habr.com/ru/post/523288/ https://habr.com/ru/company/abbyy/blog/108459/ Я не силён в деталях PDF, ни PostScript, ни DVI, ни других, но если о PDF что и можно услышать от понимающих людей, то только сильно не лестное. В основном, в качестве более suckless решения предлагают PostScript. А ещё очень много пишут о недостатках PDF как формата для возможного редактирования. Ну это сразу я считаю глупостью -- он никогда и не предназначался для редактирования или чего-то такого, поэтому не нужно от него хотеть странного. Он для конечного представления, для печати и отображения, точка. С одной стороны, очевидно, читая хотя бы просто даже Wikipedia, что PDF это дико сложный и переусложнённый формат. PostScript явно лучше. Хочется сразу PDF в топку выбросить. С другой стороны: PS является полноценным языком программирования и это означает что добавляет вектор атаки на компьютер, ибо PS это просто программа. Хочется сразу PS в топку. Тогда как ограниченность PDF делает его, как бы, более безопасным. DVI не умеет хранить в себе изображения и шрифты -- поэтому не может являться portable форматом, который бы открывался везде одинаково. Хотя, а если сделать tarball с шрифтами, DVI и EPS? Некоторые почему то упорно хотят сравнивать PDF с DjVu. Опять же, я не сведущ, но... первый поддерживает полностью векторные примитивы, а второй это чисто растровый -- как их вообще можно сравнивать? Они для совершенно разных задач. Сравнивать их можно только если вопрос хранения сканированных документов -- DjVu безусловно лучше (для lossy). Или сторонники DjVu считают что вообще документы должны быть сканированными/отрендеренными -- мол простота и эффективность? Что-то в этом есть, но high-quality то вектор тоже хочется, особенно когда речь про просто текст. В комментариях в первые увидел упоминание XPS формата от Microsoft. Вообще не слышал о нём. Но... раз Microsoft, то наверное гиблое дело, не стоящее рассмотрения. Буквально на днях секретариат отправлял Word файл, который надо распечатать и заполнить. Пошёл к ним, чтобы они же мне его и распечатали -- в итоге на Windows/Microsoft Office он открылся как-то криво и при мне его руками чуть переформатировали. То есть, даже в своей экосистеме Microsoft не в состоянии сделать формат который бы одинаково везде отобразился (речь только про отображение). Во всяких сравнениях, если я вижу что PDF is more advanced, more powerful и всякое такое прочее чем PostScript, то сразу закрываю этот бред. Как можно говорить о более продвинутом формате, когда на другой чаше весов буквально язык программирования? Насколько понимаю, изначально первые версии PDF были типа урезанной версией PostScript -- где нет полноценного языка, но достаточно возможностей для текста, картинок, разбиения на страницы (с нужными размерами). В PDF первой версии (1993!) сразу же была даже поддержка гиперссылок и закладок. Все последующие нафиг уже нужны. В итоге, среди всего разнообразия форматов для гарантированного отображения/чтения/печати есть только PostScript и PDF. И оба всё равно зависят от того, есть ли встроенные шрифты, как минимум. Первый ужасен с точки зрения безопасности. Второй с точки зрения сложности, но тут я не силён и не знаю -- может быть речь идёт о всех последующих модификациях формата? PostScript на всяких проприетарных системах не откроется, ибо из коробки ничего нет. PDF всё же поддерживается для отображения везде (из коробки в Windows, насколько помню, конечно же, не было). Пусть он и кака, но пока это вроде меньшее из зол. Ну и я бегло посмотрел на объяснения и примеры PDF документов (только базовый функционал, 1.0) -- не тривиальный, но вроде и не архисложный формат, с точки зрения программиста (если считать что рендеринг шрифтов это отдельная и не связанная задача). -- 2.48.1