]> Sergey Matveev's repositories - stargrave-blog.git/commit
Rutracker API и XML
authorSergey Matveev <stargrave@stargrave.org>
Wed, 9 Mar 2022 15:53:37 +0000 (18:53 +0300)
committerSergey Matveev <stargrave@stargrave.org>
Wed, 9 Mar 2022 16:10:38 +0000 (19:10 +0300)
commit4d19c66cf2a24f6d1875bb90b2caa70577141875
tree4b825dc642cb6eb9a060e54bf8d69288fbee4904
parentddb36609add639cf4146309f6eeec060c706b53f
Rutracker API и XML

http://api.rutracker.org/v1/docs/swagger.json
https://rutracker.org/forum/viewtopic.php?t=5591249
В комментарии к 4f2673f6010a28c6ab4037ed2fb1dfca74075a9b мне указали на
наличие API у Rutracker. Функционал не богатый, но, как минимум, можно
узнать хэш торрента зная идентификатор раздачи (раздела форума), так как
многие раздачи регулярно обновляются. Попробовал
https://github.com/raitonoberu/rutracker-api утилиту, но поиск не даёт
делать, ибо не позволяет мне авторизоваться (лень разбираться в чём дело).

Но есть раздача XML-ки всего содержимого этого трэкера, которая у меня
была скачана даже когда-то прежде. Вполне себе годный вариант для
поиска, а затем API для узнавания точного (актуального) хэша торрента,
чтобы через DHT он мог найтись.

Попробовал ещё https://github.com/Snawoot/trusearch утилитку на Go,
которая JavaScript выражением позволяет искать в XML-ке всякое. Но, на
момент написания, "total dos collection" так и не был найден, не
дождался. Просто GNU grep -i "..." и less с переходом на нужную строку
отрабатывают быстрее.

    $ curl -v "http://api.rutracker.org/v1/get_tor_hash?by=topic_id&val=5591249"
    {"result":{"5591249":"FE63F7FA266E8F3F812FF637EB9025413CB58D51"}}

И в очередной раз убеждаюсь насколько же важно иметь быстрый
декомпрессор. Wikipedia дампы делаются в bzip2 -- фиг дождёшься
декомпрессии. xz, который используется для XML-ки Rutracker --
вполне хороший вариант, хотя и не такой стремительный как zstd.