From 6d71ef8896b7602a334a0d107a2c8cacb98aed9c Mon Sep 17 00:00:00 2001 From: Sergey Matveev Date: Sat, 26 Mar 2016 11:36:19 +0300 Subject: [PATCH] =?utf8?q?Unicode=20=D0=B2=D1=81=D1=82=D0=B0=D0=B2=D0=BA?= =?utf8?q?=D0=B0=20=D1=81=D1=82=D1=80=D0=BE=D0=BA?= MIME-Version: 1.0 Content-Type: text/plain; charset=utf8 Content-Transfer-Encoding: 8bit Натравил я на одну PDF-ку pdftottext и выделил одну из строчек и передал в интерпретатор Python. Визуально она ASCII, но длина равна 33 байтам. Если её набрать руками, то визуально она опять же не отличается, но равна уже 32 байтам. >>> len("a5940000000000000000000000000000") 32 >>> len("а5940000000000000000000000000000") 33 >>> repr("a5940000000000000000000000000000") "'a5940000000000000000000000000000'" >>> repr("а5940000000000000000000000000000") "'\\xd0\\xb05940000000000000000000000000000'" В общем на экране одно и всё пиксель-в-пиксель идентично, но не работает :-) -- 2.50.0