]> Sergey Matveev's repositories - public-inbox.git/blobdiff - lib/PublicInbox/WatchMaildir.pm
watchmaildir: ensure I:/W:/E: prefixes in warnings
[public-inbox.git] / lib / PublicInbox / WatchMaildir.pm
index e3df85159e7d9af50d93c7ce3f9d7dd9b0701ef4..768e0efe508022a16f83e4d96a1cedf85972096f 100644 (file)
@@ -7,7 +7,7 @@ package PublicInbox::WatchMaildir;
 use strict;
 use warnings;
 use PublicInbox::Eml;
-use PublicInbox::InboxWritable;
+use PublicInbox::InboxWritable qw(eml_from_path warn_ignore_cb);
 use PublicInbox::Filter::Base qw(REJECT);
 use PublicInbox::Spamcheck;
 use PublicInbox::Sigfd;
@@ -15,7 +15,6 @@ use PublicInbox::DS qw(now);
 use PublicInbox::MID qw(mids);
 use PublicInbox::ContentHash qw(content_hash);
 use POSIX qw(_exit);
-*mime_from_path = \&PublicInbox::InboxWritable::mime_from_path;
 
 sub compile_watchheaders ($) {
        my ($ibx) = @_;
@@ -124,8 +123,10 @@ sub new {
 sub _done_for_now {
        my ($self) = @_;
        local $PublicInbox::DS::in_loop = 0; # waitpid() synchronously
-       for (values %{$self->{importers}}) {
-               $_->done if $_; # $_ may be undef during cleanup
+       for my $im (values %{$self->{importers}}) {
+               next if !$im; # $im may be undef during cleanup
+               eval { $im->done };
+               warn "$im->{ibx}->{name} ->done: $@\n" if $@;
        }
 }
 
@@ -137,43 +138,51 @@ sub remove_eml_i { # each_inbox callback
                $im->remove($eml, 'spam');
                if (my $scrub = $ibx->filter($im)) {
                        my $scrubbed = $scrub->scrub($eml, 1);
-                       $scrubbed or return;
-                       $scrubbed == REJECT() and return;
-                       $im->remove($scrubbed, 'spam');
+                       if ($scrubbed && $scrubbed != REJECT) {
+                               $im->remove($scrubbed, 'spam');
+                       }
                }
        };
-       warn "error removing spam at: $loc from $ibx->{name}: $@\n" if $@;
+       if ($@) {
+               warn "error removing spam at: $loc from $ibx->{name}: $@\n";
+               _done_for_now($self);
+       }
 }
 
 sub _remove_spam {
        my ($self, $path) = @_;
        # path must be marked as (S)een
        $path =~ /:2,[A-R]*S[T-Za-z]*\z/ or return;
-       my $eml = mime_from_path($path) or return;
+       my $eml = eml_from_path($path) or return;
+       local $SIG{__WARN__} = warn_ignore_cb();
        $self->{config}->each_inbox(\&remove_eml_i, [ $self, $eml, $path ]);
 }
 
 sub import_eml ($$$) {
        my ($self, $ibx, $eml) = @_;
-       my $im = _importer_for($self, $ibx);
 
        # any header match means it's eligible for the inbox:
        if (my $watch_hdrs = $ibx->{-watchheaders}) {
                my $ok;
-               my $hdr = $eml->header_obj;
                for my $wh (@$watch_hdrs) {
-                       my @v = $hdr->header_raw($wh->[0]);
+                       my @v = $eml->header_raw($wh->[0]);
                        $ok = grep(/$wh->[1]/, @v) and last;
                }
                return unless $ok;
        }
-
-       if (my $scrub = $ibx->filter($im)) {
-               my $ret = $scrub->scrub($eml) or return;
-               $ret == REJECT() and return;
-               $eml = $ret;
+       eval {
+               my $im = _importer_for($self, $ibx);
+               if (my $scrub = $ibx->filter($im)) {
+                       my $scrubbed = $scrub->scrub($eml) or return;
+                       $scrubbed == REJECT and return;
+                       $eml = $scrubbed;
+               }
+               $im->add($eml, $self->{spamcheck});
+       };
+       if ($@) {
+               warn "$ibx->{name} add failed: $@\n";
+               _done_for_now($self);
        }
-       $im->add($eml, $self->{spamcheck});
 }
 
 sub _try_path {
@@ -190,30 +199,39 @@ sub _try_path {
        }
        my $warn_cb = $SIG{__WARN__} || sub { print STDERR @_ };
        local $SIG{__WARN__} = sub {
-               $warn_cb->("path: $path\n");
-               $warn_cb->(@_);
+               my $pfx = ($_[0] // '') =~ /^([A-Z]: )/g ? $1 : '';
+               $warn_cb->($pfx, "path: $path\n", @_);
        };
        if (!ref($inboxes) && $inboxes eq 'watchspam') {
                return _remove_spam($self, $path);
        }
        foreach my $ibx (@$inboxes) {
-               my $eml = mime_from_path($path) or next;
+               my $eml = eml_from_path($path) or next;
                import_eml($self, $ibx, $eml);
        }
 }
 
+sub quit_done ($) {
+       my ($self) = @_;
+       return unless $self->{quit};
+
+       # don't have reliable wakeups, keep signalling
+       my $done = 1;
+       for (qw(idle_pids poll_pids)) {
+               my $pids = $self->{$_} or next;
+               for (keys %$pids) {
+                       $done = undef if kill('QUIT', $_);
+               }
+       }
+       $done;
+}
+
 sub quit {
        my ($self) = @_;
        $self->{quit} = 1;
        %{$self->{opendirs}} = ();
        _done_for_now($self);
-       if (my $imap_pid = $self->{-imap_pid}) {
-               kill('QUIT', $imap_pid);
-       }
-       for (qw(idle_pids poll_pids)) {
-               my $pids = $self->{$_} or next;
-               kill('QUIT', $_) for (keys %$pids);
-       }
+       quit_done($self);
        if (my $idle_mic = $self->{idle_mic}) {
                eval { $idle_mic->done };
                if ($@) {
@@ -270,7 +288,7 @@ sub cfg_intvl ($$$) {
 sub cfg_bool ($$$) {
        my ($cfg, $key, $url) = @_;
        my $orig = $cfg->urlmatch($key, $url) // return;
-       my $bool = PublicInbox::Config::_git_config_bool($orig);
+       my $bool = $cfg->git_bool($orig);
        warn "W: $key=$orig for $url is not boolean\n" unless defined($bool);
        $bool;
 }
@@ -376,6 +394,7 @@ sub imap_import_msg ($$$$) {
                        my $x = import_eml($self, $ibx, $eml);
                }
        } elsif ($inboxes eq 'watchspam') {
+               local $SIG{__WARN__} = warn_ignore_cb();
                my $eml = PublicInbox::Eml->new($raw);
                my $arg = [ $self, $eml, "$url UID:$uid" ];
                $self->{config}->each_inbox(\&remove_eml_i, $arg);
@@ -427,9 +446,9 @@ sub imap_fetch_all ($$$) {
        my ($uids, $batch);
        my $warn_cb = $SIG{__WARN__} || sub { print STDERR @_ };
        local $SIG{__WARN__} = sub {
+               my $pfx = ($_[0] // '') =~ /^([A-Z]: )/g ? $1 : '';
                $batch //= '?';
-               $warn_cb->("$url UID:$batch\n");
-               $warn_cb->(@_);
+               $warn_cb->("$pfx$url UID:$batch\n", @_);
        };
        my $err;
        do {
@@ -488,7 +507,8 @@ sub imap_idle_once ($$$$) {
        }
        $self->{idle_mic} = $mic; # for ->quit
        my @res;
-       until ($self->{quit} || grep(/^\* [0-9]+ EXISTS/, @res) || $i <= 0) {
+       until ($self->{quit} || !$mic->IsConnected ||
+                       grep(/^\* [0-9]+ EXISTS/, @res) || $i <= 0) {
                @res = $mic->idle_data($i);
                $i = $end - now();
        }
@@ -511,8 +531,13 @@ sub watch_imap_idle_1 ($$$) {
        local $0 = $uri->mailbox." $sec";
        until ($self->{quit}) {
                $mic //= PublicInbox::IMAPClient->new(%$mic_arg);
-               my $err = imap_fetch_all($self, $mic, $url);
-               $err //= imap_idle_once($self, $mic, $intvl, $url);
+               my $err;
+               if ($mic && $mic->IsConnected) {
+                       $err = imap_fetch_all($self, $mic, $url);
+                       $err //= imap_idle_once($self, $mic, $intvl, $url);
+               } else {
+                       $err = "not connected: $!";
+               }
                if ($err && !$self->{quit}) {
                        warn $err, "\n";
                        $mic = undef;
@@ -536,6 +561,13 @@ sub watch_atfork_parent ($) {
        _done_for_now($self);
 }
 
+sub imap_idle_requeue ($) { # DS::add_timer callback
+       my ($self, $url_intvl) = @{$_[0]};
+       return if $self->{quit};
+       push @{$self->{idle_todo}}, $url_intvl;
+       event_step($self);
+}
+
 sub imap_idle_reap { # PublicInbox::DS::dwaitpid callback
        my ($self, $pid) = @_;
        my $url_intvl = delete $self->{idle_pids}->{$pid} or
@@ -544,8 +576,8 @@ sub imap_idle_reap { # PublicInbox::DS::dwaitpid callback
        my ($url, $intvl) = @$url_intvl;
        return if $self->{quit};
        warn "W: PID=$pid on $url died: \$?=$?\n" if $?;
-       push @{$self->{idle_todo}}, $url_intvl;
-       PubicInbox::DS::requeue($self); # call ->event_step to respawn
+       PublicInbox::DS::add_timer(60,
+                               \&imap_idle_requeue, [ $self, $url_intvl ]);
 }
 
 sub imap_idle_fork ($$) {
@@ -847,7 +879,8 @@ sub nntp_fetch_all ($$$) {
        my $warn_cb = $SIG{__WARN__} || sub { print STDERR @_ };
        my ($err, $art);
        local $SIG{__WARN__} = sub {
-               $warn_cb->("$url ", $art ? ("ARTICLE $art") : (), "\n", @_);
+               my $pfx = ($_[0] // '') =~ /^([A-Z]: )/g ? $1 : '';
+               $warn_cb->("$pfx$url ", $art ? ("ARTICLE $art") : (), "\n", @_);
        };
        my $inboxes = $self->{nntp}->{$url};
        my $last_art;
@@ -921,8 +954,8 @@ sub watch {
                                                [$self, $intvl, $urls]);
        }
        watch_fs_init($self) if $self->{mdre};
-       PublicInbox::DS->SetPostLoopCallback(sub {});
-       PublicInbox::DS->EventLoop until $self->{quit};
+       PublicInbox::DS->SetPostLoopCallback(sub { !$self->quit_done });
+       PublicInbox::DS->EventLoop;
        _done_for_now($self);
 }