]> Sergey Matveev's repositories - stargrave-blog.git/commit
Написал утилиту для дедупликации файлов sgodup
authorSergey Matveev <stargrave@stargrave.org>
Fri, 20 Mar 2020 11:17:45 +0000 (14:17 +0300)
committerSergey Matveev <stargrave@stargrave.org>
Fri, 20 Mar 2020 11:17:45 +0000 (14:17 +0300)
commitaa85cb4318d211ca16c9f273acdbefb1344f9f86
tree4b825dc642cb6eb9a060e54bf8d69288fbee4904
parent8081858bb50754fe1fb985672f0f5c180a793d03
Написал утилиту для дедупликации файлов sgodup

https://git.stargrave.org/cgit.cgi/sgodup.git/tree/README
Есть у меня задачи где имеются несколько директорий, между которыми есть
множество одинаковых файлов, возможно с отличающимися именами. Посмотрел
я на множество предлагаемых для этой задачи утилит, но что-то никто не
понравился: то сравнивается содержимое файлов полностью, то MD5
используется, то низкая производительность или недостаточная гибкость,
не позволяющая делать symlink-и или направлять их только из одной
директории в другую.

Решил написать своё. Очень хорошая производительность (я даже не знаю
можно ли быстрее -- всё-равно упираюсь в ФС), старается не делать ничего
лишнего, красивенький real-time прогресс. Можно и для symlink-ов
использовать, можно и hardlink-и, можно и в пределах одной директории
дедуплицировать данные.