]> Sergey Matveev's repositories - stargrave-blog.git/commit
Unicode вставка строк
authorSergey Matveev <stargrave@stargrave.org>
Sat, 26 Mar 2016 08:36:19 +0000 (11:36 +0300)
committerSergey Matveev <stargrave@stargrave.org>
Sat, 26 Mar 2016 08:36:19 +0000 (11:36 +0300)
commit6d71ef8896b7602a334a0d107a2c8cacb98aed9c
tree4b825dc642cb6eb9a060e54bf8d69288fbee4904
parent0d9803067186304828c57446d3cb3189c4140f37
Unicode вставка строк

Натравил я на одну PDF-ку pdftottext и выделил одну из строчек и передал
в интерпретатор Python. Визуально она ASCII, но длина равна 33 байтам.
Если её набрать руками, то визуально она опять же не отличается, но
равна уже 32 байтам.

>>> len("a5940000000000000000000000000000")
32
>>> len("а5940000000000000000000000000000")
33
>>> repr("a5940000000000000000000000000000")
"'a5940000000000000000000000000000'"
>>> repr("а5940000000000000000000000000000")
"'\\xd0\\xb05940000000000000000000000000000'"

В общем на экране одно и всё пиксель-в-пиксель идентично, но не работает :-)