]> Sergey Matveev's repositories - public-inbox.git/blobdiff - lib/PublicInbox/LeiToMail.pm
lei_to_mail: reduce spew on Maildir removal
[public-inbox.git] / lib / PublicInbox / LeiToMail.pm
index 244bfb6746a914f6436ab3ec9d7a5696a712d0da..c6c5f84b7a08b0a0a16a89ee3ce32d002de0fb20 100644 (file)
@@ -12,11 +12,16 @@ use PublicInbox::ProcessPipe;
 use PublicInbox::Spawn qw(which spawn popen_rd);
 use PublicInbox::LeiDedupe;
 use PublicInbox::OnDestroy;
+use PublicInbox::Git;
+use PublicInbox::GitAsyncCat;
 use Symbol qw(gensym);
 use IO::Handle; # ->autoflush
 use Fcntl qw(SEEK_SET SEEK_END O_CREAT O_EXCL O_WRONLY);
-use Errno qw(EEXIST ESPIPE ENOENT);
-use PublicInbox::Git;
+use Errno qw(EEXIST ESPIPE ENOENT EPIPE);
+
+# struggles with short-lived repos, Gcf2Client makes little sense with lei;
+# but we may use in-process libgit2 in the future.
+$PublicInbox::GitAsyncCat::GCF2C = 0;
 
 my %kw2char = ( # Maildir characters
        draft => 'D',
@@ -63,14 +68,16 @@ sub _mbox_hdr_buf ($$$) {
 }
 
 sub atomic_append { # for on-disk destinations (O_APPEND, or O_EXCL)
-       my ($fh, $buf) = @_;
-       defined(my $w = syswrite($fh, $$buf)) or die "write: $!";
-       $w == length($$buf) or die "short write: $w != ".length($$buf);
-}
-
-sub _print_full {
-       my ($fh, $buf) = @_;
-       print $fh $$buf or die "print: $!";
+       my ($lei, $buf) = @_;
+       if (defined(my $w = syswrite($lei->{1} // return, $$buf))) {
+               return if $w == length($$buf);
+               $buf = "short atomic write: $w != ".length($$buf);
+       } elsif ($! == EPIPE) {
+               return $lei->note_sigpipe(1);
+       } else {
+               $buf = "atomic write: $!";
+       }
+       $lei->fail($buf);
 }
 
 sub eml2mboxrd ($;$) {
@@ -243,24 +250,19 @@ sub _mbox_write_cb ($$) {
        my $ovv = $lei->{ovv};
        my $m = 'eml2'.$ovv->{fmt};
        my $eml2mbox = $self->can($m) or die "$self->$m missing";
-       my $out = $lei->{1} // die "no stdout ($m, $ovv->{dst})"; # redirected earlier
-       $out->autoflush(1);
-       my $write = $ovv->{lock_path} ? \&_print_full : \&atomic_append;
+       $lei->{1} // die "no stdout ($m, $ovv->{dst})"; # redirected earlier
+       $lei->{1}->autoflush(1);
+       my $atomic_append = !defined($ovv->{lock_path});
        my $dedupe = $lei->{dedupe};
        $dedupe->prepare_dedupe;
        sub { # for git_to_mail
                my ($buf, $smsg, $eml) = @_;
-               return unless $out;
                $eml //= PublicInbox::Eml->new($buf);
-               if (!$dedupe->is_dup($eml, $smsg->{blob})) {
-                       $buf = $eml2mbox->($eml, $smsg);
-                       my $lk = $ovv->lock_for_scope;
-                       eval { $write->($out, $buf) };
-                       if ($@) {
-                               die $@ if ref($@) ne 'PublicInbox::SIGPIPE';
-                               undef $out
-                       }
-               }
+               return if $dedupe->is_dup($eml, $smsg->{blob});
+               $buf = $eml2mbox->($eml, $smsg);
+               return atomic_append($lei, $buf) if $atomic_append;
+               my $lk = $ovv->lock_for_scope;
+               $lei->out($$buf);
        }
 }
 
@@ -294,14 +296,14 @@ sub _buf2maildir {
        my $kw = $smsg->{kw} // [];
        my $sfx = join('', sort(map { $kw2char{$_} // () } @$kw));
        my $rand = ''; # chosen by die roll :P
-       my ($tmp, $fh, $final);
+       my ($tmp, $fh, $final, $ok);
        my $common = $smsg->{blob} // _rand;
        if (defined(my $pct = $smsg->{pct})) { $common .= "=$pct" }
        do {
                $tmp = $dst.'tmp/'.$rand.$common;
-       } while (!sysopen($fh, $tmp, O_CREAT|O_EXCL|O_WRONLY) &&
+       } while (!($ok = sysopen($fh, $tmp, O_CREAT|O_EXCL|O_WRONLY)) &&
                $! == EEXIST && ($rand = _rand.','));
-       if (print $fh $$buf and close($fh)) {
+       if ($ok && print $fh $$buf and close($fh)) {
                # ignore new/ and write only to cur/, otherwise MUAs
                # with R/W access to the Maildir will end up doing
                # a mass rename which can take a while with thousands
@@ -314,9 +316,10 @@ sub _buf2maildir {
                        ($rand = _rand.','));
                unlink($tmp) or warn "W: failed to unlink $tmp: $!\n";
        } else {
-               my $err = $!;
+               my $err = "Error writing $smsg->{blob} to $dst: $!\n";
+               $_[0] = undef; # clobber dst
                unlink($tmp);
-               die "Error writing $smsg->{blob} to $dst: $err";
+               die $err;
        }
 }
 
@@ -327,6 +330,7 @@ sub _maildir_write_cb ($$) {
        my $dst = $lei->{ovv}->{dst};
        sub { # for git_to_mail
                my ($buf, $smsg, $eml) = @_;
+               $dst // return $lei->fail; # dst may be undef-ed in last run
                $buf //= \($eml->as_string);
                return _buf2maildir($dst, $buf, $smsg) if !$dedupe;
                $eml //= PublicInbox::Eml->new($$buf); # copy buf
@@ -462,32 +466,21 @@ sub write_mail { # via ->wq_do
        my ($self, $git_dir, $smsg, $lei) = @_;
        my $not_done = delete $self->{$lei->{each_smsg_not_done}};
        my $wcb = $self->{wcb} //= do { # first message
-               my %sig = $lei->atfork_child_wq($self);
-               @SIG{keys %sig} = values %sig; # not local
+               $lei->atfork_child_wq($self);
                $self->write_cb($lei);
        };
        my $git = $self->{"$$\0$git_dir"} //= PublicInbox::Git->new($git_dir);
-       $git->cat_async($smsg->{blob}, \&git_to_mail, [$wcb, $smsg, $not_done]);
+       git_async_cat($git, $smsg->{blob}, \&git_to_mail,
+                               [$wcb, $smsg, $not_done]);
 }
 
-# We rely on OnDestroy to run this before ->DESTROY, since ->DESTROY
-# ordering is unstable at worker exit and may cause segfaults
-sub reap_gits {
+sub wq_atexit_child {
        my ($self) = @_;
        delete $self->{wcb};
        for my $git (delete @$self{grep(/\A$$\0/, keys %$self)}) {
                $git->async_wait_all;
        }
-}
-
-sub DESTROY { delete $_[0]->{wcb} }
-
-sub ipc_atfork_child { # runs after IPC::wq_worker_loop
-       my ($self) = @_;
-       $self->SUPER::ipc_atfork_child;
-       # reap_gits needs to run before $self->DESTROY,
-       # IPC.pm will ensure that.
-       PublicInbox::OnDestroy->new($$, \&reap_gits, $self);
+       $SIG{__WARN__} = 'DEFAULT';
 }
 
 1;