]> Sergey Matveev's repositories - public-inbox.git/blobdiff - t/search.t
qspawn: allow configurable limiters
[public-inbox.git] / t / search.t
index 17e9eaf43aea8e764de4e618539d7108e0947e43..d5f9d95cd0f63c001d4b819980a13bfb5e0153b6 100644 (file)
@@ -1,4 +1,4 @@
-# Copyright (C) 2015, all contributors <meta@public-inbox.org>
+# Copyright (C) 2015 all contributors <meta@public-inbox.org>
 # License: AGPLv3 or later (https://www.gnu.org/licenses/agpl-3.0.txt)
 use strict;
 use warnings;
@@ -7,8 +7,7 @@ eval { require PublicInbox::SearchIdx; };
 plan skip_all => "Xapian missing for search" if $@;
 use File::Temp qw/tempdir/;
 use Email::MIME;
-use Data::Dumper;
-my $tmpdir = tempdir(CLEANUP => 1);
+my $tmpdir = tempdir('pi-search-XXXXXX', TMPDIR => 1, CLEANUP => 1);
 my $git_dir = "$tmpdir/a.git";
 my ($root_id, $last_id);
 
@@ -16,11 +15,31 @@ is(0, system(qw(git init -q --bare), $git_dir), "git init (main)");
 eval { PublicInbox::Search->new($git_dir) };
 ok($@, "exception raised on non-existent DB");
 
+{
+       my $orig = "FOO " x 30;
+       my $summ = PublicInbox::Search::subject_summary($orig);
+
+       $summ = length($summ);
+       $orig = length($orig);
+       ok($summ < $orig && $summ > 0, "summary shortened ($orig => $summ)");
+
+       $orig = "FOO" x 30;
+       $summ = PublicInbox::Search::subject_summary($orig);
+
+       $summ = length($summ);
+       $orig = length($orig);
+       ok($summ < $orig && $summ > 0,
+          "summary shortened but not empty: $summ");
+}
+
 my $rw = PublicInbox::SearchIdx->new($git_dir, 1);
 my $ro = PublicInbox::Search->new($git_dir);
+$rw = undef;
 my $rw_commit = sub {
+       $rw->{xdb}->commit_transaction if $rw;
        $rw = undef;
        $rw = PublicInbox::SearchIdx->new($git_dir, 1);
+       $rw->{xdb}->begin_transaction;
 };
 
 {
@@ -70,6 +89,7 @@ my $rw_commit = sub {
                body => "goodbye forever :<\n");
 
        my $rv;
+       $rw_commit->();
        $root_id = $rw->add_message($root);
        is($root_id, int($root_id), "root_id is an integer: $root_id");
        $last_id = $rw->add_message($last);
@@ -118,15 +138,6 @@ sub filter_mids {
        my $second = $res->{msgs}->[0];
 
        isnt($first, $second, "offset returned different result from limit");
-
-       foreach my $f (qw(inreplyto references)) {
-               $res = $ro->query($f . ':root@s');
-               @res = filter_mids($res);
-               is_deeply(\@res, [ 'last@s' ],
-                         "got expected results for $f: match");
-               $res = $ro->query($f . ':root');
-               is($res->{total}, 0, "no partial mid match");
-       }
 }
 
 # ghost vivication
@@ -184,7 +195,6 @@ sub filter_mids {
        $rw_commit->();
        $ro->reopen;
        my $long_mid = 'last' . ('x' x 60). '@s';
-       my $long_midc = Digest::SHA::sha1_hex($long_mid);
 
        my $long = Email::MIME->create(
                header_str => [
@@ -202,14 +212,8 @@ sub filter_mids {
 
        $rw_commit->();
        $ro->reopen;
-       my $res = $ro->query('references:root@s');
-       my @res = filter_mids($res);
-       is_deeply(\@res, [ sort('last@s', $long_midc) ],
-                 "got expected results for references: match");
-
-       my $followups = $ro->get_followups('root@s');
-       $followups = [ filter_mids($followups) ];
-       is_deeply($followups, [ filter_mids($res) ], "get_followups matches");
+       my $res;
+       my @res;
 
        my $long_reply_mid = 'reply-to-long@1';
        my $long_reply = Email::MIME->create(
@@ -230,7 +234,7 @@ sub filter_mids {
        $ro->reopen;
        my $t = $ro->get_thread('root@s');
        is($t->{total}, 4, "got all 4 mesages in thread");
-       my @exp = sort($long_reply_mid, 'root@s', 'last@s', $long_midc);
+       my @exp = sort($long_reply_mid, 'root@s', 'last@s', $long_mid);
        @res = filter_mids($t);
        is_deeply(\@res, \@exp, "get_thread works");
 }
@@ -270,10 +274,11 @@ sub filter_mids {
 
 # circular references
 {
+       my $s = 'foo://'. ('Circle' x 15).'/foo';
        my $doc_id = $rw->add_message(Email::MIME->create(
+               header => [ Subject => $s ],
                header_str => [
                        Date => 'Sat, 02 Oct 2010 00:00:01 +0000',
-                       Subject => 'Circle',
                        'Message-ID' => '<circle@a>',
                        'References' => '<circle@a>',
                        'In-Reply-To' => '<circle@a>',
@@ -284,7 +289,29 @@ sub filter_mids {
        ok($doc_id > 0, "doc_id defined with circular reference");
        my $smsg = $rw->lookup_message('circle@a');
        $smsg->ensure_metadata;
-       is($smsg->{references}, undef, "no references created");
+       is($smsg->references, '', "no references created");
+       my $msg = PublicInbox::SearchMsg->load_doc($smsg->{doc});
+       is($s, $msg->mini_mime->header('Subject'), 'long subject not rewritten');
+}
+
+{
+       my $str = eval {
+               my $mbox = 't/utf8.mbox';
+               open(my $fh, '<', $mbox) or die "failed to open mbox: $mbox\n";
+               local $/;
+               <$fh>
+       };
+       $str =~ s/\AFrom [^\n]+\n//s;
+       my $mime = Email::MIME->new($str);
+       my $doc_id = $rw->add_message($mime);
+       ok($doc_id > 0, 'message indexed doc_id with UTF-8');
+       my $smsg = $rw->lookup_message('testmessage@example.com');
+       my $msg = PublicInbox::SearchMsg->load_doc($smsg->{doc});
+
+       # mini_mime technically not valid (I think),
+       # but good enough for displaying HTML:
+       is($mime->header('Subject'), $msg->mini_mime->header('Subject'),
+               'UTF-8 subject preserved');
 }
 
 done_testing();