]> Sergey Matveev's repositories - public-inbox.git/blobdiff - lib/PublicInbox/LeiXSearch.pm
lei: q: lock stdout on overview output
[public-inbox.git] / lib / PublicInbox / LeiXSearch.pm
index 7d251afdbf6ece8eb09ff544e447716926b3f3dd..ee93e074b1cacca62055cff1d507399ea5c224c5 100644 (file)
@@ -1,4 +1,4 @@
-# Copyright (C) 2020 all contributors <meta@public-inbox.org>
+# Copyright (C) 2020-2021 all contributors <meta@public-inbox.org>
 # License: AGPL-3.0+ <https://www.gnu.org/licenses/agpl-3.0.txt>
 
 # Combine any combination of PublicInbox::Search,
@@ -7,7 +7,7 @@
 package PublicInbox::LeiXSearch;
 use strict;
 use v5.10.1;
-use parent qw(PublicInbox::LeiSearch);
+use parent qw(PublicInbox::LeiSearch PublicInbox::IPC);
 
 sub new {
        my ($class) = @_;
@@ -20,9 +20,16 @@ sub new {
 
 sub attach_external {
        my ($self, $ibxish) = @_; # ibxish = ExtSearch or Inbox
-       if (!$ibxish->can('over')) {
-               push @{$self->{remotes}}, $ibxish
+
+       if (!$ibxish->can('over') || !$ibxish->over) {
+               return push(@{$self->{remotes}}, $ibxish)
        }
+       my $desc = $ibxish->{inboxdir} // $ibxish->{topdir};
+       my $srch = $ibxish->search or
+               return warn("$desc not indexed for Xapian\n");
+       my @shards = $srch->xdb_shards_flat or
+               return warn("$desc has no Xapian shardsXapian\n");
+
        if (delete $self->{xdb}) { # XXX: do we need this?
                # clobber existing {xdb} if amending
                my $expect = delete $self->{nshard};
@@ -41,13 +48,18 @@ sub attach_external {
                $nr == $expect or die
                        "BUG: reloaded $nr shards, expected $expect"
        }
-       my @shards = $ibxish->search->xdb_shards_flat;
        push @{$self->{shards_flat}}, @shards;
        push(@{$self->{shard2ibx}}, $ibxish) for (@shards);
 }
 
+# returns a list of local inboxes (or count in scalar context)
+sub locals {
+       my %uniq = map {; "$_" => $_ } @{$_[0]->{shard2ibx} // []};
+       values %uniq;
+}
+
 # called by PublicInbox::Search::xdb
-sub xdb_shards_flat { @{$_[0]->{shards_flat}} }
+sub xdb_shards_flat { @{$_[0]->{shards_flat} // []} }
 
 # like over->get_art
 sub smsg_for {
@@ -69,4 +81,120 @@ sub recent {
        $self->mset($qstr //= 'bytes:1..', $opt);
 }
 
+sub over {}
+
+sub _mset_more ($$) {
+       my ($mset, $mo) = @_;
+       my $size = $mset->size;
+       $size && (($mo->{offset} += $size) < ($mo->{limit} // 10000));
+}
+
+sub query_thread_mset { # for --thread
+       my ($self, $lei, $ibxish) = @_;
+       my %sig = $lei->atfork_child_wq($self);
+       local @SIG{keys %sig} = values %sig;
+
+       my ($srch, $over) = ($ibxish->search, $ibxish->over);
+       unless ($srch && $over) {
+               my $desc = $ibxish->{inboxdir} // $ibxish->{topdir};
+               warn "$desc not indexed by Xapian\n";
+               return;
+       }
+       my $mo = { %{$lei->{mset_opt}} };
+       my $mset;
+       my $each_smsg = $lei->{ovv}->ovv_each_smsg_cb($lei);
+       my $dd = $lei->{dd};
+       $dd->prepare_dedupe;
+       do {
+               $mset = $srch->mset($mo->{qstr}, $mo);
+               my $ids = $srch->mset_to_artnums($mset, $mo);
+               my $ctx = { ids => $ids };
+               my $i = 0;
+               my %n2item = map { ($ids->[$i++], $_) } $mset->items;
+               while ($over->expand_thread($ctx)) {
+                       for my $n (@{$ctx->{xids}}) {
+                               my $smsg = $over->get_art($n) or next;
+                               next if $dd->is_smsg_dup($smsg);
+                               my $mitem = delete $n2item{$smsg->{num}};
+                               $each_smsg->($smsg, $mitem);
+                               # $self->out($buf .= $ORS);
+                               # $emit_cb->($smsg);
+                       }
+                       @{$ctx->{xids}} = ();
+               }
+       } while (_mset_more($mset, $mo));
+       $lei->{ovv}->ovv_atexit_child($lei);
+}
+
+sub query_mset { # non-parallel for non-"--thread" users
+       my ($self, $lei, $srcs) = @_;
+       my %sig = $lei->atfork_child_wq($self);
+       local @SIG{keys %sig} = values %sig;
+       my $mo = { %{$lei->{mset_opt}} };
+       my $mset;
+       $self->attach_external($_) for @$srcs;
+       my $each_smsg = $lei->{ovv}->ovv_each_smsg_cb($lei);
+       my $dd = $lei->{dd};
+       $dd->prepare_dedupe;
+       do {
+               $mset = $self->mset($mo->{qstr}, $mo);
+               for my $it ($mset->items) {
+                       my $smsg = smsg_for($self, $it) or next;
+                       next if $dd->is_smsg_dup($smsg);
+                       $each_smsg->($smsg, $it);
+                       # $self->out($buf .= $ORS) if defined $buf;
+                       #$emit_cb->($smsg);
+               }
+       } while (_mset_more($mset, $mo));
+       $lei->{ovv}->ovv_atexit_child($lei);
+}
+
+sub query_done { # PublicInbox::EOFpipe callback
+       my ($lei) = @_;
+       $lei->{ovv}->ovv_end($lei);
+       $lei->dclose;
+}
+
+sub do_query {
+       my ($self, $lei_orig, $srcs) = @_;
+       my ($lei, @io) = $lei_orig->atfork_parent_wq($self);
+       my $remotes = $self->{remotes} // [];
+       pipe(my ($eof_wait, $qry_done)) or die "pipe $!";
+       $io[0] = $qry_done; # don't need stdin
+
+       if ($lei->{opt}->{thread}) {
+               $lei->{-parallel} = scalar(@$remotes) + scalar(@$srcs) - 1;
+               for my $ibxish (@$srcs) {
+                       $self->wq_do('query_thread_mset', \@io, $lei, $ibxish);
+               }
+       } else {
+               $lei->{-parallel} = scalar(@$remotes);
+               $self->wq_do('query_mset', \@io, $lei, $srcs);
+       }
+       # TODO
+       for my $rmt (@$remotes) {
+               $self->wq_do('query_thread_mbox', \@io, $lei, $rmt);
+       }
+       @io = ();
+       close $qry_done; # fully closed when children are done
+
+       # query_done will run when query_*mset close $qry_done
+       if ($lei_orig->{sock}) { # watch for client premature exit
+               require PublicInbox::EOFpipe;
+               PublicInbox::EOFpipe->new($eof_wait, \&query_done, $lei_orig);
+               $lei_orig->{lxs} = $self;
+               $lei_orig->event_step_init;
+       } else {
+               $self->wq_close;
+               read($eof_wait, my $buf, 1); # wait for close($lei->{0})
+               query_done($lei_orig); # may SIGPIPE
+       }
+}
+
+sub ipc_atfork_prepare {
+       my ($self) = @_;
+       $self->wq_set_recv_modes(qw[+<&= >&= >&= +<&=]);
+       $self->SUPER::ipc_atfork_prepare; # PublicInbox::IPC
+}
+
 1;