]> Sergey Matveev's repositories - stargrave-blog.git/commit
Сканирование кучи документов
authorSergey Matveev <stargrave@stargrave.org>
Sun, 5 Jul 2020 14:46:21 +0000 (17:46 +0300)
committerSergey Matveev <stargrave@stargrave.org>
Sun, 5 Jul 2020 14:46:21 +0000 (17:46 +0300)
commit5d5b6aaedbd8625378e32c11b43b4c5b26a4d059
tree4b825dc642cb6eb9a060e54bf8d69288fbee4904
parent50b9f7b04279fb6a729b199db41a09f941c92059
Сканирование кучи документов

http://git.stargrave.org/cgit.cgi/dotfiles.git/tree/bin/bin/scan.sh
Впервые задумался есть ли какие простые утилиты для отрезания фона
после сканирования. Оказалось что pnmcrop, как ни странно, как-раз для
этой задачи и хорошо с ней справляется. Но время от времени требуется
корректировка уровня чувствительности для неё. А ещё нужно
переворачивать в разных направлениях сканы. Написал вот простейший
скрипт для автоматизации всего этого.

Не уверен ещё, но пока хочется сохранить это в lossless формате. WebP
(lossless, который VP8L) не поддерживает большие разрешения,
получающиеся на 1600 DPI -- сразу же обломался на попытке его
использования. PNG всеяден оказался. Но вспомнил про JPEG2000.
opj_compress по умолчанию сразу же имеет lossless параметры для сжатия.
Но какие-то изображения он сжимает, а какие-то, большего разрешения, уже
нет -- падает или не создаёт файл. Тоже звучит как облом, но нет: я ж
помню про его возможность бить на tile-ы как-раз чтобы их независимо
друг от друга обрабатывать. И после указания tile-ов всё успешно жмётся.
Примерно в два раза, ощутимо лучше PNG. Но открывается/декодируется он
значительно дольше.