From 8fcb5b8860eae6e0ba253f4c78997ae31fa33670 Mon Sep 17 00:00:00 2001 From: Sergey Matveev Date: Sun, 11 Feb 2024 23:17:49 +0300 Subject: [PATCH] =?utf8?q?=D0=92=D0=BF=D0=B5=D1=80=D0=B2=D1=8B=D0=B5=20?= =?utf8?q?=D0=B8=D1=81=D0=BF=D0=BE=D0=BB=D1=8C=D0=B7=D0=BE=D0=B2=D0=B0?= =?utf8?q?=D0=BB=20Tesseract=20OCR?= MIME-Version: 1.0 Content-Type: text/plain; charset=utf8 Content-Transfer-Encoding: 8bit https://en.wikipedia.org/wiki/Tesseract_(software) В девятом классе (20+ лет назад) я на подработке использовал FineReader для распознавания текста. С тех пор ни разу не трогал подобный софт. А тут надо один документ заново "набрать". Установил из портов Tesseract, сделал на цифровую мыльницу фотографию документа, просто указал путь к JPEG файлу и .txt файлу, подождал несколько секунд -- получил текст. Не абсолютно всё распозналось, но почти всё. Существенно сэкономило время, нежели пришлось бы набирать всё с нуля. Полностью свободное ПО, не много зависимостей. Приятная штука оказалась, ожидал куда большего геморроя. -- 2.48.1