]> Sergey Matveev's repositories - tofuproxy.git/blobdiff - doc/warcs.texi
Missing copying
[tofuproxy.git] / doc / warcs.texi
index b86e3f3b8be9a3d09e72b8c8b1140bea93304c71..681354ea6b41ed11ba95efe61554a461004c0087 100644 (file)
@@ -81,7 +81,7 @@ without expensive WARC parsing.
 @code{redo warc-extract.cmd} utility uses exactly the same code for
 parsing WARCs. It can be used to check if WARCs can be successfully
 loaded, to list all URIs after, to extract some specified URI and to
-pre-generate @file{.idx.gob} indexes.
+pre-generate @file{.idx.gob} indices.
 
 @example
 $ warc-extract.cmd -idx \
@@ -112,3 +112,6 @@ $ wget ... [--page-requisites] [--recursive] \
     --no-warc-keep-log --no-warc-digests [--warc-max-size=XXX] \
     --warc-file smth.warc ...
 @end example
+
+Or even more simpler @url{https://git.jordan.im/crawl/tree/README.md, crawl}
+utility written on Go too.