]> Sergey Matveev's repositories - public-inbox.git/commitdiff
search: add YYYYMMDD search range via "d:" prefix
authorEric Wong <e@80x24.org>
Tue, 16 Aug 2016 08:49:26 +0000 (08:49 +0000)
committerEric Wong <e@80x24.org>
Tue, 16 Aug 2016 21:30:57 +0000 (21:30 +0000)
This is similar to mairix in that it uses a "d:" prefix; but
only takes YYYYMMDD, for now.  Using custom date/time parsers
via Perl will be much more work:

nntp://news.gmane.org/20151005222157.GE5880@survex.com

Anyhow, this ought to be more human-friendly than searching by
Unix timestamps, but it requires reindexing to take advantage of.

lib/PublicInbox/Search.pm
lib/PublicInbox/SearchIdx.pm
t/search.t

index 61f033834949e4fede837ffc7188a34905224ca7..7561ef447ec8b6f07add73152e086495075bbcbc 100644 (file)
@@ -12,6 +12,7 @@ use constant TS => 0; # timestamp
 use constant NUM => 1; # NNTP article number
 use constant BYTES => 2; # :bytes as defined in RFC 3977
 use constant LINES => 3; # :lines as defined in RFC 3977
+use constant YYYYMMDD => 4; # for searching in the WWW UI
 
 use Search::Xapian qw/:standard/;
 use PublicInbox::SearchMsg;
@@ -179,6 +180,8 @@ sub qp {
        $qp->set_database($self->{xdb});
        $qp->set_stemmer($self->stemmer);
        $qp->set_stemming_strategy(STEM_SOME);
+       $qp->add_valuerangeprocessor(
+               Search::Xapian::StringValueRangeProcessor->new(YYYYMMDD, 'd:'));
 
        while (my ($name, $prefix) = each %bool_pfx_external) {
                $qp->add_boolean_prefix($name, $prefix);
index f8155ecc0f916a8733ce96cca50686882112bef4..f54f5f2f112c8510d209ffea95b19513d1b9609b 100644 (file)
@@ -17,6 +17,7 @@ use base qw(PublicInbox::Search);
 use PublicInbox::MID qw/mid_clean id_compress mid_mime/;
 use PublicInbox::MsgIter;
 use Carp qw(croak);
+use POSIX qw(strftime);
 require PublicInbox::Git;
 *xpfx = *PublicInbox::Search::xpfx;
 
@@ -128,7 +129,8 @@ sub add_message {
                        $doc->add_term(xpfx('path') . id_compress($path));
                }
 
-               add_val($doc, &PublicInbox::Search::TS, $smsg->ts);
+               my $ts = $smsg->ts;
+               add_val($doc, &PublicInbox::Search::TS, $ts);
 
                defined($num) and
                        add_val($doc, &PublicInbox::Search::NUM, $num);
@@ -139,6 +141,9 @@ sub add_message {
                add_val($doc, &PublicInbox::Search::LINES,
                                $mime->body_raw =~ tr!\n!\n!);
 
+               my $yyyymmdd = strftime('%Y%m%d', gmtime($ts));
+               $doc->add_value(&PublicInbox::Search::YYYYMMDD, $yyyymmdd);
+
                my $tg = $self->term_generator;
 
                $tg->set_document($doc);
index 2685348c9a7950f22cbe188e8a8eac2593850dac..db94c0a351153d350ff07219148abb7922b4cf0c 100644 (file)
@@ -315,6 +315,15 @@ sub filter_mids {
                'UTF-8 subject preserved');
 }
 
+{
+       my $res = $ro->query('d:19931002..20101002');
+       ok(scalar @{$res->{msgs}} > 0, 'got results within range');
+       $res = $ro->query('d:20101003..');
+       is(scalar @{$res->{msgs}}, 0, 'nothing after 20101003');
+       $res = $ro->query('d:..19931001');
+       is(scalar @{$res->{msgs}}, 0, 'nothing before 19931001');
+}
+
 done_testing();
 
 1;