]> Sergey Matveev's repositories - public-inbox.git/blobdiff - lib/PublicInbox/LEI.pm
update copyrights for 2021
[public-inbox.git] / lib / PublicInbox / LEI.pm
index c28c9b5996d4c38752ef024284542ab05bf0983a..320a2bfc28695e9f513a8bcb85a438ebdf4b90f7 100644 (file)
@@ -1,4 +1,4 @@
-# Copyright (C) 2020 all contributors <meta@public-inbox.org>
+# Copyright (C) 2020-2021 all contributors <meta@public-inbox.org>
 # License: AGPL-3.0+ <https://www.gnu.org/licenses/agpl-3.0.txt>
 
 # Backend for `lei' (local email interface).  Unlike the C10K-oriented
@@ -8,7 +8,7 @@
 package PublicInbox::LEI;
 use strict;
 use v5.10.1;
-use parent qw(PublicInbox::DS);
+use parent qw(PublicInbox::DS PublicInbox::LeiExternal);
 use Getopt::Long ();
 use Socket qw(AF_UNIX SOCK_STREAM pack_sockaddr_un);
 use Errno qw(EAGAIN ECONNREFUSED ENOENT);
@@ -16,10 +16,10 @@ use POSIX ();
 use IO::Handle ();
 use Sys::Syslog qw(syslog openlog);
 use PublicInbox::Config;
-use PublicInbox::Syscall qw($SFD_NONBLOCK EPOLLIN EPOLLONESHOT);
+use PublicInbox::Syscall qw(SFD_NONBLOCK EPOLLIN EPOLLONESHOT);
 use PublicInbox::Sigfd;
-use PublicInbox::DS qw(now);
-use PublicInbox::Spawn qw(spawn);
+use PublicInbox::DS qw(now dwaitpid);
+use PublicInbox::Spawn qw(spawn run_die);
 use PublicInbox::OnDestroy;
 use Text::Wrap qw(wrap);
 use File::Path qw(mkpath);
@@ -68,23 +68,23 @@ sub _config_path ($) {
 # TODO: generate shell completion + help using %CMD and %OPTDESC
 # command => [ positional_args, 1-line description, Getopt::Long option spec ]
 our %CMD = ( # sorted in order of importance/use:
-'query' => [ 'SEARCH_TERMS...', 'search for messages matching terms', qw(
-       save-as=s output|o=s format|f=s dedupe|d=s thread|t augment|a
-       sort|s=s@ reverse|r offset=i remote local! extinbox!
+'q' => [ 'SEARCH_TERMS...', 'search for messages matching terms', qw(
+       save-as=s output|mfolder|o=s format|f=s dedupe|d=s thread|t augment|a
+       sort|s=s@ reverse|r offset=i remote local! external!
        since|after=s until|before=s), opt_dash('limit|n=i', '[0-9]+') ],
 
 'show' => [ 'MID|OID', 'show a given object (Message-ID or object ID)',
        qw(type=s solve! format|f=s dedupe|d=s thread|t remote local!),
        pass_through('git show') ],
 
-'add-extinbox' => [ 'URL_OR_PATHNAME',
+'add-external' => [ 'URL_OR_PATHNAME',
        'add/set priority of a publicinbox|extindex for extra matches',
-       qw(prio=i) ],
-'ls-extinbox' => [ '[FILTER...]', 'list publicinbox|extindex locations',
-       qw(format|f=s z local remote) ],
-'forget-extinbox' => [ '{URL_OR_PATHNAME|--prune}',
+       qw(boost=i quiet|q) ],
+'ls-external' => [ '[FILTER...]', 'list publicinbox|extindex locations',
+       qw(format|f=s z|0 local remote quiet|q) ],
+'forget-external' => [ '{URL_OR_PATHNAME|--prune}',
        'exclude further results from a publicinbox|extindex',
-       qw(prune) ],
+       qw(prune quiet|q) ],
 
 'ls-query' => [ '[FILTER...]', 'list saved search queries',
                qw(name-only format|f=s z) ],
@@ -98,7 +98,7 @@ our %CMD = ( # sorted in order of importance/use:
        'set/unset flags on message(s) from stdin',
        qw(stdin| oid=s exact by-mid|mid:s) ],
 'forget' => [ '[--stdin|--oid=OID|--by-mid=MID]',
-       'exclude message(s) on stdin from query results',
+       "exclude message(s) on stdin from `q' search results",
        qw(stdin| oid=s exact by-mid|mid:s quiet|q) ],
 
 'purge-mailsource' => [ '{URL_OR_PATHNAME|--all}',
@@ -107,7 +107,7 @@ our %CMD = ( # sorted in order of importance/use:
 
 # code repos are used for `show' to solve blobs from patch mails
 'add-coderepo' => [ 'PATHNAME', 'add or set priority of a git code repo',
-       qw(prio=i) ],
+       qw(boost=i) ],
 'ls-coderepo' => [ '[FILTER_TERMS...]',
                'list known code repos', qw(format|f=s z) ],
 'forget-coderepo' => [ 'PATHNAME',
@@ -172,10 +172,10 @@ my %OPTDESC = (
 
 'type=s' => [ 'any|mid|git', 'disambiguate type' ],
 
-'dedupe|d=s' => ['STRAT|content|oid|mid',
+'dedupe|d=s' => ['STRAT|content|oid|mid|none',
                'deduplication strategy'],
 'show  thread|t' => 'display entire thread a message belongs to',
-'query thread|t' =>
+'q     thread|t' =>
        'return all messages in the same thread as the actual match(es)',
 'augment|a' => 'augment --output destination instead of clobbering',
 
@@ -186,10 +186,10 @@ my %OPTDESC = (
                        'message/object output format' ],
 'mark  format|f=s' => $stdin_formats,
 'forget        format|f=s' => $stdin_formats,
-'query format|f=s' => [ 'OUT|maildir|mboxrd|mboxcl2|mboxcl|html|oid',
+'q     format|f=s' => [ 'OUT|maildir|mboxrd|mboxcl2|mboxcl|html|oid|json',
                'specify output format, default depends on --output'],
 'ls-query      format|f=s' => $ls_format,
-'ls-extinbox   format|f=s' => $ls_format,
+'ls-external   format|f=s' => $ls_format,
 
 'limit|n=i@' => ['NUM', 'limit on number of matches (default: 10000)' ],
 'offset=i' => ['OFF', 'search result offset (default: 0)'],
@@ -197,7 +197,7 @@ my %OPTDESC = (
 'sort|s=s@' => [ 'VAL|internaldate,date,relevance,docid',
                "order of results `--output'-dependent"],
 
-'prio=i' => 'priority of query source',
+'boost=i' => 'increase/decrease priority of results (default: 0)',
 
 'local' => 'limit operations to the local filesystem',
 'local!' => 'exclude results from the local filesystem',
@@ -217,8 +217,7 @@ my %OPTDESC = (
 'by-mid|mid:s' => [ 'MID', 'match only by Message-ID, ignoring contents' ],
 'jobs:i' => 'set parallelism level',
 
-# xargs, env, use "-0", git(1) uses "-z".  Should we support z|0 everywhere?
-'z' => 'use NUL \\0 instead of newline (CR) to delimit lines',
+# xargs, env, use "-0", git(1) uses "-z".  We support z|0 everywhere
 'z|0' => 'use NUL \\0 instead of newline (CR) to delimit lines',
 
 # note: no "--ignore-environment" / "-i" support like env(1) since that
@@ -250,18 +249,13 @@ sub x_it ($$) { # pronounced "exit"
 
 sub puts ($;@) { print { shift->{1} } map { "$_\n" } @_ }
 
-sub emit {
-       my ($self, $channel) = @_; # $buf = $_[2]
-       print { $self->{$channel} } $_[2] or die "print FD[$channel]: $!";
-}
+sub out ($;@) { print { shift->{1} } @_ }
 
-sub err {
-       my ($self, $buf) = @_;
-       $buf .= "\n" unless $buf =~ /\n\z/s;
-       emit($self, 2, $buf);
+sub err ($;@) {
+       print { shift->{2} } @_, (substr($_[-1], -1, 1) eq "\n" ? () : "\n");
 }
 
-sub qerr { $_[0]->{opt}->{quiet} or err(@_) }
+sub qerr ($;@) { $_[0]->{opt}->{quiet} or err(shift, @_) }
 
 sub fail ($$;$) {
        my ($self, $buf, $exit_code) = @_;
@@ -341,8 +335,7 @@ EOF
                $msg .= $rhs;
                $msg .= "\n";
        }
-       my $channel = $errmsg ? 2 : 1;
-       emit($self, $channel, $msg);
+       print { $self->{$errmsg ? 2 : 1} } $msg;
        x_it($self, $errmsg ? 1 << 8 : 0); # stderr => failure
        undef;
 }
@@ -404,7 +397,6 @@ sub optparse ($$$) {
                }
                last if $err;
        }
-       # warn "inf=$inf ".scalar(@$argv). ' '.scalar(@args)."\n";
        if (!$inf && scalar(@$argv) > scalar(@args)) {
                $err //= 'too many arguments';
        }
@@ -413,7 +405,7 @@ sub optparse ($$$) {
 
 sub dispatch {
        my ($self, $cmd, @argv) = @_;
-       local $SIG{__WARN__} = sub { err($self, "@_") };
+       local $SIG{__WARN__} = sub { err($self, @_) };
        return _help($self, 'no command given') unless defined($cmd);
        my $func = "lei_$cmd";
        $func =~ tr/-/_/;
@@ -462,7 +454,9 @@ sub _lei_store ($;$) {
        $cfg->{-lei_store} //= do {
                require PublicInbox::LeiStore;
                PublicInbox::SearchIdx::load_xapian_writable();
-               defined(my $dir = $cfg->{'leistore.dir'}) or return;
+               my $dir = $cfg->{'leistore.dir'};
+               $dir //= _store_path($self->{env}) if $creat;
+               return unless $dir;
                PublicInbox::LeiStore->new($dir, { creat => $creat });
        };
 }
@@ -488,8 +482,7 @@ sub lei_config {
        my $cfg = _lei_cfg($self, 1);
        my $cmd = [ qw(git config -f), $cfg->{'-f'}, @argv ];
        my %rdr = map { $_ => $self->{$_} } (0..2);
-       require PublicInbox::Import;
-       PublicInbox::Import::run_die($cmd, $env, \%rdr);
+       run_die($cmd, $env, \%rdr);
 }
 
 sub lei_init {
@@ -525,7 +518,7 @@ E: leistore.dir=$cur already initialized and it is not $dir
        return qerr($self, $exists);
 }
 
-sub lei_daemon_pid { emit($_[0], 1, "$$\n") }
+sub lei_daemon_pid { puts shift, $$ }
 
 sub lei_daemon_kill {
        my ($self) = @_;
@@ -547,7 +540,7 @@ sub lei_daemon_env {
                my $eor = $opt->{z} ? "\0" : "\n";
                my $buf = '';
                while (my ($k, $v) = each %ENV) { $buf .= "$k=$v$eor" }
-               emit($self, 1, $buf)
+               out $self, $buf;
        }
 }
 
@@ -611,7 +604,7 @@ sub lei_git { # support passing through random git commands
        my ($self, @argv) = @_;
        my %rdr = map { $_ => $self->{$_} } (0..2);
        my $pid = spawn(['git', @argv], $self->{env}, \%rdr);
-       PublicInbox::DS::dwaitpid($pid, \&reap_exec, $self);
+       dwaitpid($pid, \&reap_exec, $self);
 }
 
 sub accept_dispatch { # Listener {post_accept} callback
@@ -682,7 +675,7 @@ sub lazy_start {
        require IO::FDPass;
        require PublicInbox::Listener;
        require PublicInbox::EOFpipe;
-       (-p STDOUT && -p STDERR) or die "E: stdout+stderr must be pipes\n";
+       (-p STDOUT) or die "E: stdout must be a pipe\n";
        open(STDIN, '+<', '/dev/null') or die "redirect stdin failed: $!";
        POSIX::setsid() > 0 or die "setsid: $!";
        my $pid = fork // die "fork: $!";
@@ -711,7 +704,7 @@ sub lazy_start {
                USR1 => \&noop,
                USR2 => \&noop,
        };
-       my $sigfd = PublicInbox::Sigfd->new($sig, $SFD_NONBLOCK);
+       my $sigfd = PublicInbox::Sigfd->new($sig, SFD_NONBLOCK);
        local %SIG = (%SIG, %$sig) if !$sigfd;
        if ($sigfd) { # TODO: use inotify/kqueue to detect unlinked sockets
                PublicInbox::DS->SetLoopTimeout(5000);
@@ -747,17 +740,16 @@ sub lazy_start {
                $n; # true: continue, false: stop
        });
 
-       # STDIN was redirected to /dev/null above, closing STDOUT and
-       # STDERR will cause the calling `lei' client process to finish
-       # reading <$daemon> pipe.
-       open STDOUT, '>&STDIN' or die "redirect stdout failed: $!";
+       # STDIN was redirected to /dev/null above, closing STDERR and
+       # STDOUT will cause the calling `lei' client process to finish
+       # reading the <$daemon> pipe.
        openlog($path, 'pid', 'user');
        local $SIG{__WARN__} = sub { syslog('warning', "@_") };
-       my $owner_pid = $$;
-       my $on_destroy = PublicInbox::OnDestroy->new(sub {
-               syslog('crit', "$@") if $@ && $$ == $owner_pid;
+       my $on_destroy = PublicInbox::OnDestroy->new($$, sub {
+               syslog('crit', "$@") if $@;
        });
        open STDERR, '>&STDIN' or die "redirect stderr failed: $!";
+       open STDOUT, '>&STDIN' or die "redirect stdout failed: $!";
        # $daemon pipe to `lei' closed, main loop begins:
        PublicInbox::DS->EventLoop;
        @$on_destroy = (); # cancel on_destroy if we get here