]> Sergey Matveev's repositories - public-inbox.git/blobdiff - script/public-inbox-mda
mda, watch: wire up List-ID header support
[public-inbox.git] / script / public-inbox-mda
index 6c76734c4a1be513cb159de6069bba69ca880464..2655a6c5ed064aad67b97f0c575a3212cde68344 100755 (executable)
 #!/usr/bin/perl -w
-# Copyright (C) 2013-2015 all contributors <meta@public-inbox.org>
-# License: AGPLv3 or later (https://www.gnu.org/licenses/agpl-3.0.txt)
+# Copyright (C) 2013-2019 all contributors <meta@public-inbox.org>
+# License: AGPL-3.0+ <https://www.gnu.org/licenses/agpl-3.0.txt>
 #
 # Mail delivery agent for public-inbox, run from your MTA upon mail delivery
 use strict;
 use warnings;
 my $usage = 'public-inbox-mda < rfc2822_message';
+my ($ems, $emm);
 
-use Email::Filter;
-use Email::MIME;
-use Email::Address;
-use File::Path::Expand qw/expand_filename/;
-use IPC::Run qw(run);
+sub do_exit {
+       my ($code) = shift;
+       $emm = $ems = undef; # trigger DESTROY
+       exit $code;
+}
+
+use Email::Simple;
+use PublicInbox::MIME;
 use PublicInbox::MDA;
-use PublicInbox::Filter;
 use PublicInbox::Config;
-use PublicInbox::Import;
-use PublicInbox::Git;
+use PublicInbox::Emergency;
+use PublicInbox::Filter::Base;
+use PublicInbox::InboxWritable;
+use PublicInbox::Spamcheck;
 
 # n.b: hopefully we can setup the emergency path without bailing due to
 # user error, we really want to setup the emergency destination ASAP
 # in case there's bugs in our code or user error.
-my $emergency = $ENV{PI_EMERGENCY} || '~/.public-inbox/emergency/';
-$emergency = expand_filename($emergency);
-
-# this reads the message from stdin
-my $filter = Email::Filter->new(emergency => $emergency);
+my $emergency = $ENV{PI_EMERGENCY} || "$ENV{HOME}/.public-inbox/emergency/";
+$ems = PublicInbox::Emergency->new($emergency);
+my $str = eval { local $/; <STDIN> };
+$str =~ s/\A[\r\n]*From [^\r\n]*\r?\n//s;
+$ems->prepare(\$str);
+my $simple = Email::Simple->new(\$str);
 my $config = PublicInbox::Config->new;
-
+my $key = 'publicinboxmda.spamcheck';
+my $default = 'PublicInbox::Spamcheck::Spamc';
+my $spamc = PublicInbox::Spamcheck::get($config, $key, $default);
+my $dst;
 my $recipient = $ENV{ORIGINAL_RECIPIENT};
-defined $recipient or die "ORIGINAL_RECIPIENT not defined in ENV\n";
-my $dst = $config->lookup($recipient); # first check
-defined $dst or exit(1);
-my $main_repo = $dst->{mainrepo} or exit(1);
-my $filtered; # string dest
-
-if (PublicInbox::MDA->precheck($filter, $dst->{address}) &&
-    do_spamc($filter->simple, \$filtered)) {
-       # update our message with SA headers (in case our filter rejects it)
-       my $msg = Email::MIME->new(\$filtered);
-       $filtered = undef;
-       $filter->simple($msg);
-
-       my $filter_arg;
-       my $fcfg = $dst->{filter};
-       if (!defined $fcfg || $filter eq 'reject') {
-               $filter_arg = $filter;
-       } elsif ($fcfg eq 'scrub') {
-               $filter_arg = undef; # the default for legacy versions
-       } else {
-               warn "publicinbox.$dst->{listname}.filter=$fcfg invalid\n";
-               warn "must be either 'scrub' or 'reject' (the default)\n";
-       }
-
-       if (PublicInbox::Filter->run($msg, $filter_arg)) {
-               # run spamc again on the HTML-free message
-               if (do_spamc($msg, \$filtered)) {
-                       $msg = Email::MIME->new(\$filtered);
-                       PublicInbox::MDA->set_list_headers($msg, $dst);
-                       $filter->simple($msg);
-
-                       END {
-                               index_sync($main_repo) if ($? == 0);
-                       };
-                       my $git = PublicInbox::Git->new($main_repo);
-                       my $im = PublicInbox::Import->new($git,
-                                               $dst->{listname}, $recipient);
-                       if (defined $im->add($msg)) {
-                               $im->done;
-                               $filter->ignore; # exits
-                       }
-                       # this message is similar to what ssoma-mda shows:
-                       print STDERR "CONFLICT: Message-ID: ",
-                               $msg->header_obj->header_raw('Message-ID'),
-                               " exists\n";
-               }
+if (defined $recipient) {
+       $dst = $config->lookup($recipient); # first check
+}
+if (!defined $dst) {
+       my $list_id = $simple->header('List-Id');
+       if (defined $list_id && $list_id =~ /<[ \t]*(.+)?[ \t]*>/) {
+               $dst = $config->lookup_list_id($1);
        }
-} else {
-       # Ensure emergency spam gets spamassassin headers.
-       # This makes it easier to prioritize obvious spam from less obvious
-       if (defined($filtered) && $filtered ne '') {
-               my $drop = Email::MIME->new(\$filtered);
-               $filtered = undef;
-               $filter->simple($drop);
+       if (!defined $dst && !defined $recipient) {
+               die "ORIGINAL_RECIPIENT not defined in ENV\n";
        }
+       defined $dst or do_exit(67); # EX_NOUSER 5.1.1 user unknown
 }
-exit 0; # goes to emergency
-
-# we depend on "report_safe 0" in /etc/spamassassin/*.cf with --headers
-# not using Email::Filter->pipe here since we want the stdout of
-# the command even on failure (spamc will set $? on error).
-sub do_spamc {
-       my ($msg, $out) = @_;
-       eval {
-               my $orig = $msg->as_string;
-               run([qw/spamc -E --headers/], \$orig, $out);
-       };
+$dst->{mainrepo} or do_exit(67);
+$dst = PublicInbox::InboxWritable->new($dst);
 
-       return ($@ || $? || !defined($$out) || $$out eq '') ? 0 : 1;
+# pre-check, MDA has stricter rules than an importer might;
+do_exit(0) unless PublicInbox::MDA->precheck($simple, $dst->{address});
+$simple = undef;
+my $spam_ok;
+if ($spamc) {
+       $str = '';
+       $spam_ok = $spamc->spamcheck($ems->fh, \$str);
+       # update the emergency dump with the new message:
+       $emm = PublicInbox::Emergency->new($emergency);
+       $emm->prepare(\$str);
+       $ems = $ems->abort;
+} else { # no spam checking configured:
+       $spam_ok = 1;
+       $emm = $ems;
+       my $fh = $emm->fh;
+       read($fh, $str, -s $fh);
 }
 
-sub index_sync {
-       my ($git_dir) = @_;
+my $mime = PublicInbox::MIME->new(\$str);
+do_exit(0) unless $spam_ok;
 
-       # potentially user-visible, ignore errors:
-       system('git', "--git-dir=$git_dir", 'update-server-info');
+my $fcfg = $dst->{filter} || '';
+# -mda defaults to the strict base filter
+if ($fcfg eq '') {
+       $dst->{filter} = 'PublicInbox::Filter::Base';
+} elsif ($fcfg eq 'scrub') { # legacy alias, undocumented, remove?
+       $dst->{filter} = 'PublicInbox::Filter::Mirror';
+}
+my $filter = $dst->filter;
+my $ret = $filter->delivery($mime);
+if (ref($ret) && $ret->isa('Email::MIME')) { # filter altered message
+       $mime = $ret;
+} elsif ($ret == PublicInbox::Filter::Base::IGNORE) {
+       do_exit(0); # chuck it to emergency
+} elsif ($ret == PublicInbox::Filter::Base::REJECT) {
+       $! = 65; # EX_DATAERR 5.6.0 data format error
+       die $filter->err, "\n";
+} # else { accept
+$filter = undef;
 
-       eval {
-               require PublicInbox::SearchIdx;
-               PublicInbox::SearchIdx->new($git_dir, 2)->index_sync;
-       };
+PublicInbox::MDA->set_list_headers($mime, $dst);
+my $im = $dst->importer(0);
+if (defined $im->add($mime)) {
+       $emm = $emm->abort;
+} else {
+       # this message is similar to what ssoma-mda shows:
+       print STDERR "CONFLICT: Message-ID: ",
+                       $mime->header_obj->header_raw('Message-ID'),
+                       " exists\n";
 }
+
+$im->done;
+do_exit(0);