]> Sergey Matveev's repositories - public-inbox.git/blobdiff - lib/PublicInbox/OverIdx.pm
wwwstream: subclass off GzipFilter
[public-inbox.git] / lib / PublicInbox / OverIdx.pm
index 2d71956d592938bc3f8a9df17e09671b29893a6b..008a5d1a936fd981786c2a7158aa2f9271e6f187 100644 (file)
@@ -15,15 +15,24 @@ use IO::Handle;
 use DBI qw(:sql_types); # SQL_BLOB
 use PublicInbox::MID qw/id_compress mids_for_index references/;
 use PublicInbox::Smsg qw(subject_normalized);
-use PublicInbox::MsgTime qw(msg_timestamp msg_datestamp);
 use Compress::Zlib qw(compress);
 use PublicInbox::Search;
 
 sub dbh_new {
        my ($self) = @_;
        my $dbh = $self->SUPER::dbh_new(1);
+
+       # TRUNCATE reduces I/O compared to the default (DELETE)
+       # We do not use WAL since we're optimized for read-only ops,
+       # (and read-only requires SQLite 3.22.0 (2018-01-22)).
        $dbh->do('PRAGMA journal_mode = TRUNCATE');
+
+       # 80000 pages (80MiB on SQLite <3.12.0, 320MiB on 3.12.0+)
+       # was found to be good in 2018 during the large LKML import
+       # at the time.  This ought to be configurable based on HW
+       # and inbox size; I suspect it's overkill for many inboxes.
        $dbh->do('PRAGMA cache_size = 80000');
+
        create_tables($dbh);
        $dbh;
 }
@@ -245,13 +254,12 @@ sub subject_path ($) {
 }
 
 sub add_overview {
-       my ($self, $mime, $smsg, $times) = @_;
+       my ($self, $mime, $smsg) = @_;
        $smsg->{lines} = $mime->body_raw =~ tr!\n!\n!;
-       $smsg->{mime} = $mime; # XXX temporary?
        my $hdr = $mime->header_obj;
        my $mids = mids_for_index($hdr);
        my $refs = parse_references($smsg, $hdr, $mids);
-       my $subj = $smsg->subject;
+       my $subj = $smsg->{subject};
        my $xpath;
        if ($subj ne '') {
                $xpath = subject_path($subj);
@@ -260,10 +268,7 @@ sub add_overview {
        my $dd = $smsg->to_doc_data;
        utf8::encode($dd);
        $dd = compress($dd);
-       my $ds = msg_timestamp($hdr, $times->{autime});
-       my $ts = msg_datestamp($hdr, $times->{cotime});
-       my $values = [ $ts, $ds, $smsg->{num}, $mids, $refs, $xpath, $dd ];
-       add_over($self, $values);
+       add_over($self, [ @$smsg{qw(ts ds num)}, $mids, $refs, $xpath, $dd ]);
 }
 
 sub add_over {