]> Sergey Matveev's repositories - stargrave-blog.git/commit
Впервые использовал Tesseract OCR
authorSergey Matveev <stargrave@stargrave.org>
Sun, 11 Feb 2024 20:17:49 +0000 (23:17 +0300)
committerSergey Matveev <stargrave@stargrave.org>
Sun, 11 Feb 2024 20:17:49 +0000 (23:17 +0300)
commit8fcb5b8860eae6e0ba253f4c78997ae31fa33670
tree4b825dc642cb6eb9a060e54bf8d69288fbee4904
parentf382a94968b75805bf1b4a287b122a58dce57c55
Впервые использовал Tesseract OCR

https://en.wikipedia.org/wiki/Tesseract_(software)
В девятом классе (20+ лет назад) я на подработке использовал FineReader
для распознавания текста. С тех пор ни разу не трогал подобный софт. А
тут надо один документ заново "набрать". Установил из портов Tesseract,
сделал на цифровую мыльницу фотографию документа, просто указал путь к
JPEG файлу и .txt файлу, подождал несколько секунд -- получил текст. Не
абсолютно всё распозналось, но почти всё. Существенно сэкономило время,
нежели пришлось бы набирать всё с нуля. Полностью свободное ПО, не много
зависимостей. Приятная штука оказалась, ожидал куда большего геморроя.