]> Sergey Matveev's repositories - public-inbox.git/blobdiff - examples/grok-pull.post_update_hook.sh
treewide: replace /^I: / prefix with /^# /
[public-inbox.git] / examples / grok-pull.post_update_hook.sh
index 3ead394408eb68f80950f78b6326f2ee5e1f471c..4d303c0326abc6ebfc3bd2863cf3678a6cad9e0d 100755 (executable)
@@ -1,4 +1,9 @@
 #!/bin/sh
+
+# use flock(1) from util-linux to avoid seek contention on slow HDDs
+# when using multiple `pull_threads' with grok-pull:
+# [ "${FLOCKER}" != "$0" ] && exec env FLOCKER="$0" flock "$0" "$0" "$@" || :
+
 # post_update_hook for repos.conf as used by grok-pull, takes a full
 # git repo path as it's first and only arg.
 full_git_dir="$1"
@@ -20,11 +25,13 @@ then
        inbox_dir=$(expr "$full_git_dir" : "$EPOCH2MAIN")
        inbox_name=$(basename "$inbox_dir")
        msgmap="$inbox_dir"/msgmap.sqlite3
+       inbox_lock="$inbox_dir"/inbox.lock
 else
        inbox_fmt=1
        inbox_dir="$full_git_dir"
        inbox_name=$(basename "$inbox_dir" .git)
        msgmap="$inbox_dir"/public-inbox/msgmap.sqlite3
+       inbox_lock="$inbox_dir"/ssoma.lock
 fi
 
 # run public-inbox-init iff unconfigured
@@ -103,8 +110,8 @@ case $cfg_dir in
                git config -f "$PI_CONFIG" \
                        "publicinbox.$inbox_name.infourl" "$url"
        done
-       curl -sSfv "remote_inbox_url"/description >"$inbox_dir"/description
-       echo "I: $inbox_name at $inbox_dir ($addresses) $local_url"
+       curl -sSfv "$remote_inbox_url"/description >"$inbox_dir"/description
+       echo "# $inbox_name at $inbox_dir ($addresses) $local_url"
        ;;
 esac
 
@@ -113,12 +120,26 @@ esac
 # don't know what indexlevel a user wants
 if test -f "$msgmap"
 then
-       n=$(echo 'SELECT COUNT(*) FROM msgmap' | sqlite3 -readonly "$msgmap")
+       # We need to use flock(1) (from util-linux) to avoid timeouts
+       # and SQLite locking problems.
+       # FreeBSD has a similar lockf(1) utility, but it unlinks by
+       # default so we use `-k' to keep the lock on the FS.
+       FLOCK=flock
+       case $(uname -s) in
+       FreeBSD) FLOCK='lockf -k' ;;
+       # ... other OSes here
+       esac
+
+       n=$(echo 'SELECT COUNT(*) FROM msgmap' | \
+               $FLOCK $inbox_lock sqlite3 -readonly "$msgmap")
        case $n in
        0|'')
                : v2 inboxes may be init-ed with an empty msgmap
                ;;
        *)
+               # if on HDD and limited RAM, add `--sequential-shard'
+               # and possibly a large `--batch-size' if you have much
+               # memory in public-inbox 1.6.0+
                $EATMYDATA public-inbox-index -v "$inbox_dir"
                ;;
        esac