]> Sergey Matveev's repositories - public-inbox.git/blob - t/search-thr-index.t
overidx: preserve `tid' column on re-indexing
[public-inbox.git] / t / search-thr-index.t
1 # Copyright (C) 2017-2018 all contributors <meta@public-inbox.org>
2 # License: AGPL-3.0+ <https://www.gnu.org/licenses/agpl-3.0.txt>
3 use strict;
4 use warnings;
5 use Test::More;
6 use File::Temp qw/tempdir/;
7 use PublicInbox::MID qw(mids);
8 use Email::MIME;
9 eval { require PublicInbox::SearchIdx; };
10 plan skip_all => "Xapian missing for search" if $@;
11 my $tmpdir = tempdir('pi-search-thr-index.XXXXXX', TMPDIR => 1, CLEANUP => 1);
12 my $git_dir = "$tmpdir/a.git";
13
14 is(0, system(qw(git init -q --bare), $git_dir), "git init (main)");
15 my $rw = PublicInbox::SearchIdx->new($git_dir, 1);
16 ok($rw, "search indexer created");
17 my $data = <<'EOF';
18 Subject: [RFC 00/14]
19 Message-Id: <1-bw@g>
20
21 Subject: [RFC 09/14]
22 Message-Id: <10-bw@g>
23 In-Reply-To: <1-bw@g>
24 References: <1-bw@g>
25
26 Subject: [RFC 03/14]
27 Message-Id: <4-bw@g>
28 In-Reply-To: <1-bw@g>
29 References: <1-bw@g>
30
31 EOF
32
33 my $num = 0;
34 # nb. using internal API, fragile!
35 my $xdb = $rw->begin_txn_lazy;
36 my @mids;
37
38 foreach (reverse split(/\n\n/, $data)) {
39         $_ .= "\n";
40         my $mime = Email::MIME->new(\$_);
41         $mime->header_set('From' => 'bw@g');
42         $mime->header_set('To' => 'git@vger.kernel.org');
43         my $bytes = bytes::length($mime->as_string);
44         my $mid = mids($mime->header_obj)->[0];
45         my $doc_id = $rw->add_message($mime, $bytes, ++$num, 'ignored', $mid);
46         push @mids, $mid;
47         ok($doc_id, 'message added: '. $mid);
48 }
49
50 my $prev;
51 my %tids;
52 my $dbh = $rw->{over}->connect;
53 foreach my $mid (@mids) {
54         my $msgs = $rw->{over}->get_thread($mid);
55         is(3, scalar(@$msgs), "got all messages from $mid");
56         foreach my $m (@$msgs) {
57                 my $tid = $dbh->selectrow_array(<<'', undef, $m->{num});
58 SELECT tid FROM over WHERE num = ? LIMIT 1
59
60                 $tids{$tid}++;
61         }
62 }
63
64 is(scalar keys %tids, 1, 'all messages have the same tid');
65
66 $rw->commit_txn_lazy;
67
68 $xdb = $rw->begin_txn_lazy;
69 {
70         my $mime = Email::MIME->new(<<'');
71 Subject: [RFC 00/14]
72 Message-Id: <1-bw@g>
73 From: bw@g
74 To: git@vger.kernel.org
75
76         my $dbh = $rw->{over}->connect;
77         my ($id, $prev);
78         my $reidx = $rw->{over}->next_by_mid('1-bw@g', \$id, \$prev);
79         ok(defined $reidx);
80         my $num = $reidx->{num};
81         my $tid0 = $dbh->selectrow_array(<<'', undef, $num);
82 SELECT tid FROM over WHERE num = ? LIMIT 1
83
84         my $bytes = bytes::length($mime->as_string);
85         my $mid = mids($mime->header_obj)->[0];
86         my $doc_id = $rw->add_message($mime, $bytes, $num, 'ignored', $mid);
87         ok($doc_id, 'message reindexed'. $mid);
88         is($doc_id, $num, "article number unchanged: $num");
89
90         my $tid1 = $dbh->selectrow_array(<<'', undef, $num);
91 SELECT tid FROM over WHERE num = ? LIMIT 1
92
93         is($tid1, $tid0, 'tid unchanged on reindex');
94 }
95
96 $rw->commit_txn_lazy;
97
98 done_testing();
99
100 1;