]> Sergey Matveev's repositories - public-inbox.git/blob - lib/PublicInbox/SearchIdxSkeleton.pm
v2writable: support "barrier" operation to avoid reforking
[public-inbox.git] / lib / PublicInbox / SearchIdxSkeleton.pm
1 # Copyright (C) 2018 all contributors <meta@public-inbox.org>
2 # License: AGPL-3.0+ <https://www.gnu.org/licenses/agpl-3.0.txt>
3 package PublicInbox::SearchIdxSkeleton;
4 use strict;
5 use warnings;
6 use base qw(PublicInbox::SearchIdx);
7 use Storable qw(freeze thaw);
8
9 sub new {
10         my ($class, $v2writable) = @_;
11         my $self = $class->SUPER::new($v2writable->{-inbox}, 1, 'skel');
12         # create the DB:
13         $self->_xdb_acquire;
14         $self->_xdb_release;
15
16         my ($r, $w);
17         pipe($r, $w) or die "pipe failed: $!\n";
18         my ($barrier_wait, $barrier_note);
19         pipe($barrier_wait, $barrier_note) or die "pipe failed: $!\n";
20         binmode $_, ':raw' foreach ($r, $w, $barrier_wait, $barrier_note);
21         my $pid = fork;
22         defined $pid or die "fork failed: $!\n";
23         if ($pid == 0) {
24                 $v2writable->atfork_child;
25                 $v2writable = undef;
26                 close $w;
27                 close $barrier_wait;
28                 eval { skeleton_worker_loop($self, $r, $barrier_note) };
29                 die "skeleton worker died: $@\n" if $@;
30                 exit;
31         }
32         $self->{w} = $w;
33         $self->{pid} = $pid;
34         close $r;
35         close $barrier_note;
36         $self->{barrier_wait} = $barrier_wait;
37
38         $w->autoflush(1);
39
40         # lock on only exists in parent, not in worker
41         my $l = $self->{lock_path} = $self->xdir . '/pi-v2-skeleton.lock';
42         open my $fh, '>>', $l or die "failed to create $l: $!\n";
43         $self;
44 }
45
46 sub skeleton_worker_loop {
47         my ($self, $r, $barrier_note) = @_;
48         $barrier_note->autoflush(1);
49         $0 = 'pi-v2-skeleton';
50         my $xdb = $self->_xdb_acquire;
51         $xdb->begin_transaction;
52         my $txn = 1;
53         my $barrier = undef;
54         while (my $line = $r->getline) {
55                 if ($line eq "commit\n") {
56                         $xdb->commit_transaction if $txn;
57                         $txn = undef;
58                 } elsif ($line eq "close\n") {
59                         $self->_xdb_release;
60                         $xdb = $txn = undef;
61                 } elsif ($line =~ /\Abarrier_init (\d+)\n\z/) {
62                         my $n = $1 - 1;
63                         die "barrier in-progress\n" if defined $barrier;
64                         $barrier = { map { $_ => 1 } (0..$n) };
65                 } elsif ($line =~ /\Abarrier (\d+)\n\z/) {
66                         my $part = $1;
67                         die "no barrier in-progress\n" unless defined $barrier;
68                         delete $barrier->{$1} or die "unknown barrier: $part\n";
69                         if ((scalar keys %$barrier) == 0) {
70                                 $barrier = undef;
71                                 $xdb->commit_transaction if $txn;
72                                 $txn = undef;
73                                 print $barrier_note "barrier_done\n" or die
74                                         "print failed to barrier note: $!";
75                         }
76                 } else {
77                         my $len = int($line);
78                         my $n = read($r, my $msg, $len) or die "read: $!\n";
79                         $n == $len or die "short read: $n != $len\n";
80                         $msg = thaw($msg); # should raise on error
81                         defined $msg or die "failed to thaw buffer\n";
82                         $xdb ||= $self->_xdb_acquire;
83                         if (!$txn) {
84                                 $xdb->begin_transaction;
85                                 $txn = 1;
86                         }
87                         eval { index_skeleton_real($self, $msg) };
88                         warn "failed to index message <$msg->[-1]>: $@\n" if $@;
89                 }
90         }
91         die "xdb not released\n" if $xdb;
92         die "in transaction\n" if $txn;
93 }
94
95 # called by a partition worker
96 sub index_skeleton {
97         my ($self, $values) = @_;
98         my $w = $self->{w};
99         my $err;
100         my $str = freeze($values);
101         $str = length($str) . "\n" . $str;
102
103         # multiple processes write to the same pipe, so use flock
104         # We can't avoid this lock for <=PIPE_BUF writes, either,
105         # because those atomic writes can break up >PIPE_BUF ones
106         $self->_lock_acquire;
107         print $w $str or $err = $!;
108         $self->_lock_release;
109
110         die "print failed: $err\n" if $err;
111 }
112
113 # values: [ TS, NUM, BYTES, LINES, MID, XPATH, doc_data ]
114 sub index_skeleton_real ($$) {
115         my ($self, $values) = @_;
116         my $doc_data = pop @$values;
117         my $xpath = pop @$values;
118         my $mids = pop @$values;
119         my $ts = $values->[PublicInbox::Search::TS];
120         my $smsg = PublicInbox::SearchMsg->new(undef);
121         my $doc = $smsg->{doc};
122         PublicInbox::SearchIdx::add_values($doc, $values);
123         $doc->set_data($doc_data);
124         $smsg->{ts} = $ts;
125         $smsg->load_from_data($doc_data);
126         my $num = $values->[PublicInbox::Search::NUM];
127         my @refs = ($smsg->references =~ /<([^>]+)>/g);
128         $self->link_and_save($doc, $mids, \@refs, $num, $xpath);
129 }
130
131 # write to the subprocess
132 sub barrier_init {
133         my ($self, $nparts) = @_;
134         my $w = $_[0]->{w};
135         print $w "barrier_init $nparts\n" or die "failed to write: $!";
136         $w->flush or die "failed to flush: $!";
137 }
138
139 sub barrier_wait {
140         my ($self) = @_;
141         my $l = $self->{barrier_wait}->getline;
142         $l eq "barrier_done\n" or die "bad response from barrier_wait: $l\n";
143 }
144
145 1;