]> Sergey Matveev's repositories - public-inbox.git/blobdiff - lib/PublicInbox/Search.pm
searchidx: support indexing multiple MIDs
[public-inbox.git] / lib / PublicInbox / Search.pm
index 3a27512b5bcf79472330388211e7b2c3763466db..fb7a126a781ccb199471891cd146517bfcd3423b 100644 (file)
@@ -56,7 +56,7 @@ my %bool_pfx_internal = (
 );
 
 my %bool_pfx_external = (
-       mid => 'XMID', # Message-ID (full/exact)
+       mid => 'Q', # Message-ID (full/exact), this is mostly uniQue
 );
 
 my %prob_prefix = (
@@ -158,9 +158,8 @@ sub new {
                                $xdb = $sub;
                        }
                }
-               warn "v2 repo with $parts found in $dir\n";
                $self->{xdb} = $xdb;
-               $self->{skel} = Search::Xapian::Database->new("$dir/all");
+               $self->{skel} = Search::Xapian::Database->new("$dir/skel");
        } else {
                $self->{xdb} = Search::Xapian::Database->new($self->xdir);
        }
@@ -207,7 +206,7 @@ sub get_thread {
        # always sort threads by timestamp, this makes life easier
        # for the threading algorithm (in SearchThread.pm)
        $opts->{asc} = 1;
-
+       $opts->{enquire} = enquire_skel($self);
        _do_enquire($self, $qtid, $opts);
 }
 
@@ -235,7 +234,7 @@ sub _do_enquire {
 
 sub _enquire_once {
        my ($self, $query, $opts) = @_;
-       my $enquire = $self->enquire;
+       my $enquire = $opts->{enquire} || enquire($self);
        if (defined $query) {
                $query = Search::Xapian::Query->new(OP_AND,$query,$mail_query);
        } else {
@@ -317,18 +316,24 @@ sub num_range_processor {
 sub query_xover {
        my ($self, $beg, $end, $offset) = @_;
        my $qp = Search::Xapian::QueryParser->new;
-       $qp->set_database($self->{xdb});
+       $qp->set_database($self->{skel} || $self->{xdb});
        $qp->add_valuerangeprocessor($self->num_range_processor);
        my $query = $qp->parse_query("$beg..$end", QP_FLAGS);
 
-       _do_enquire($self, $query, {num => 1, limit => 200, offset => $offset});
+       my $opts = {
+               enquire => enquire_skel($self),
+               num => 1,
+               limit => 200,
+               offset => $offset,
+       };
+       _do_enquire($self, $query, $opts);
 }
 
 sub lookup_skeleton {
        my ($self, $mid) = @_;
        my $skel = $self->{skel} or return lookup_message($self, $mid);
        $mid = mid_clean($mid);
-       my $term = 'XMID' . $mid;
+       my $term = 'Q' . $mid;
        my $smsg;
        my $beg = $skel->postlist_begin($term);
        if ($beg != $skel->postlist_end($term)) {
@@ -347,7 +352,7 @@ sub lookup_message {
        my ($self, $mid) = @_;
        $mid = mid_clean($mid);
 
-       my $doc_id = $self->find_first_doc_id('XMID' . $mid);
+       my $doc_id = $self->find_first_doc_id('Q' . $mid);
        my $smsg;
        if (defined $doc_id) {
                # raises on error:
@@ -366,6 +371,21 @@ sub lookup_mail { # no ghosts!
        });
 }
 
+sub each_smsg_by_mid {
+       my ($self, $mid, $cb) = @_;
+       my $xdb = $self->{xdb};
+       # XXX retry_reopen isn't necessary for V2Writable, but the PSGI
+       # interface will need it...
+       my ($head, $tail) = $self->find_doc_ids('Q' . $mid);
+       for (; $head->nequal($tail); $head->inc) {
+               my $doc_id = $head->get_docid;
+               my $doc = $xdb->get_document($doc_id);
+               my $smsg = PublicInbox::SearchMsg->wrap($doc, $mid);
+               $smsg->{doc_id} = $doc_id;
+               $cb->($smsg) or return;
+       }
+}
+
 sub find_unique_doc_id {
        my ($self, $termval) = @_;
 
@@ -423,6 +443,15 @@ sub enquire {
        $self->{enquire} ||= Search::Xapian::Enquire->new($self->{xdb});
 }
 
+sub enquire_skel {
+       my ($self) = @_;
+       if (my $skel = $self->{skel}) {
+               $self->{enquire_skel} ||= Search::Xapian::Enquire->new($skel);
+       } else {
+               enquire($self);
+       }
+}
+
 sub help {
        my ($self) = @_;
        $self->qp; # parse altids