]> Sergey Matveev's repositories - public-inbox.git/blobdiff - lib/PublicInbox/NNTP.pm
nntp: fix cross-newsgroup Message-ID lookups
[public-inbox.git] / lib / PublicInbox / NNTP.pm
index 5e66d077cafee16179490ddf442d0335895e8ab0..46398cd4896af40c4e550fb1e3c070c5f39d51b2 100644 (file)
-# Copyright (C) 2015-2018 all contributors <meta@public-inbox.org>
+# Copyright (C) 2015-2020 all contributors <meta@public-inbox.org>
 # License: AGPL-3.0+ <https://www.gnu.org/licenses/agpl-3.0.txt>
 #
 # Each instance of this represents a NNTP client socket
+# fields:
+# nntpd: PublicInbox::NNTPD ref
+# article: per-session current article number
+# ng: PublicInbox::Inbox ref
+# long_cb: long_response private data
 package PublicInbox::NNTP;
 use strict;
-use warnings;
-use base qw(PublicInbox::DS);
-use fields qw(nntpd article rbuf ng long_res);
-use PublicInbox::Search;
-use PublicInbox::Msgmap;
-use PublicInbox::MID qw(mid_escape);
-use PublicInbox::Git;
-require PublicInbox::EvCleanup;
-use Email::Simple;
+use parent qw(PublicInbox::DS);
+use PublicInbox::MID qw(mid_escape $MID_EXTRACT);
+use PublicInbox::Eml;
 use POSIX qw(strftime);
-use Time::HiRes qw(clock_gettime CLOCK_MONOTONIC);
+use PublicInbox::DS qw(now);
 use Digest::SHA qw(sha1_hex);
 use Time::Local qw(timegm timelocal);
+use PublicInbox::GitAsyncCat;
 use constant {
+       LINE_MAX => 512, # RFC 977 section 2.3
        r501 => '501 command syntax error',
+       r502 => '502 Command unavailable',
        r221 => '221 Header follows',
        r224 => '224 Overview information follows (multi-line)',
        r225 => '225 Headers follow (multi-line)',
        r430 => '430 No article with that message-id',
 };
-
-sub now () { clock_gettime(CLOCK_MONOTONIC) };
-
-my @OVERVIEW = qw(Subject From Date Message-ID References Xref);
-my $OVERVIEW_FMT = join(":\r\n", @OVERVIEW, qw(Bytes Lines)) . ":\r\n";
+use PublicInbox::Syscall qw(EPOLLIN EPOLLONESHOT);
+use Errno qw(EAGAIN);
+my $ONE_MSGID = qr/\A$MID_EXTRACT\z/;
+my @OVERVIEW = qw(Subject From Date Message-ID References);
+my $OVERVIEW_FMT = join(":\r\n", @OVERVIEW, qw(Bytes Lines), '') .
+               "Xref:full\r\n";
 my $LIST_HEADERS = join("\r\n", @OVERVIEW,
                        qw(:bytes :lines Xref To Cc)) . "\r\n";
+my $CAPABILITIES = <<"";
+101 Capability list:\r
+VERSION 2\r
+READER\r
+NEWNEWS\r
+LIST ACTIVE ACTIVE.TIMES NEWSGROUPS OVERVIEW.FMT\r
+HDR\r
+OVER\r
+COMPRESS DEFLATE\r
+
+sub greet ($) { $_[0]->write($_[0]->{nntpd}->{greet}) };
 
-# disable commands with easy DoS potential:
-my %DISABLED; # = map { $_ => 1 } qw(xover list_overview_fmt newnews xhdr);
-
-my $EXPMAP; # fd -> [ idle_time, $self ]
-my $expt;
-our $EXPTIME = 180; # 3 minutes
-my $nextt;
-
-my $nextq = [];
-sub next_tick () {
-       $nextt = undef;
-       my $q = $nextq;
-       $nextq = [];
-       foreach my $nntp (@$q) {
-               # for request && response protocols, always finish writing
-               # before finishing reading:
-               if (my $long_cb = $nntp->{long_res}) {
-                       $nntp->write($long_cb);
-               } else {
-                       # pipelined request, we bypassed socket-readiness
-                       # checks to get here:
-                       event_read($nntp);
-
-                       # maybe there's more pipelined data, or we'll have
-                       # to register it for socket-readiness notifications
-                       if (!$nntp->{long_res} && !$nntp->{closed}) {
-                               check_read($nntp);
-                       }
-               }
-       }
-}
-
-sub update_idle_time ($) {
-       my ($self) = @_;
-        my $sock = $self->{sock} or return;
-       my $fd = fileno($sock);
-       defined $fd and $EXPMAP->{$fd} = [ now(), $self ];
-}
-
-sub expire_old () {
-       my $now = now();
-       my $exp = $EXPTIME;
-       my $old = $now - $exp;
-       my $nr = 0;
-       my %new;
-       while (my ($fd, $v) = each %$EXPMAP) {
-               my ($idle_time, $nntp) = @$v;
-               if ($idle_time < $old) {
-                       $nntp->close; # idempotent
-               } else {
-                       ++$nr;
-                       $new{$fd} = $v;
-               }
+sub new ($$$) {
+       my ($class, $sock, $nntpd) = @_;
+       my $self = bless { nntpd => $nntpd }, $class;
+       my $ev = EPOLLIN;
+       my $wbuf;
+       if ($sock->can('accept_SSL') && !$sock->accept_SSL) {
+               return CORE::close($sock) if $! != EAGAIN;
+               $ev = PublicInbox::TLS::epollbit();
+               $wbuf = [ \&PublicInbox::DS::accept_tls_step, \&greet ];
        }
-       $EXPMAP = \%new;
-       if ($nr) {
-               $expt = PublicInbox::EvCleanup::later(*expire_old);
+       $self->SUPER::new($sock, $ev | EPOLLONESHOT);
+       if ($wbuf) {
+               $self->{wbuf} = $wbuf;
        } else {
-               $expt = undef;
-               # noop to kick outselves out of the loop ASAP so descriptors
-               # really get closed
-               PublicInbox::EvCleanup::asap(sub {});
+               greet($self);
        }
-}
-
-sub new ($$$) {
-       my ($class, $sock, $nntpd) = @_;
-       my $self = fields::new($class);
-       $self->SUPER::new($sock);
-       $self->{nntpd} = $nntpd;
-       res($self, '201 ' . $nntpd->{servername} . ' ready - post via email');
-       $self->{rbuf} = '';
-       $self->watch_read(1);
-       update_idle_time($self);
-       $expt ||= PublicInbox::EvCleanup::later(*expire_old);
+       $self->update_idle_time;
        $self;
 }
 
@@ -122,19 +78,15 @@ sub args_ok ($$) {
 # returns 1 if we can continue, 0 if not due to buffered writes or disconnect
 sub process_line ($$) {
        my ($self, $l) = @_;
-       my ($req, @args) = split(/[ \t]/, $l);
+       my ($req, @args) = split(/[ \t]+/, $l);
        return 1 unless defined($req); # skip blank line
-       $req = lc($req);
-       $req = eval {
-               no strict 'refs';
-               $req = $DISABLED{$req} ? undef : *{'cmd_'.$req}{CODE};
-       };
+       $req = $self->can('cmd_'.lc($req));
        return res($self, '500 command not recognized') unless $req;
        return res($self, r501) unless args_ok($req, scalar @args);
 
        my $res = eval { $req->($self, @args) };
        my $err = $@;
-       if ($err && !$self->{closed}) {
+       if ($err && $self->{sock}) {
                local $/ = "\n";
                chomp($l);
                err($self, 'error from: %s (%s)', $l, $err);
@@ -144,6 +96,17 @@ sub process_line ($$) {
        res($self, $res);
 }
 
+# The keyword argument is not used (rfc3977 5.2.2)
+sub cmd_capabilities ($;$) {
+       my ($self, undef) = @_;
+       my $res = $CAPABILITIES;
+       if (!$self->{sock}->can('accept_SSL') &&
+                       $self->{nntpd}->{accept_tls}) {
+               $res .= "STARTTLS\r\n";
+       }
+       $res .= '.';
+}
+
 sub cmd_mode ($$) {
        my ($self, $arg) = @_;
        $arg = uc $arg;
@@ -162,12 +125,12 @@ sub cmd_xgtitle ($;$) {
 
 sub list_overview_fmt ($) {
        my ($self) = @_;
-       do_more($self, $OVERVIEW_FMT);
+       $self->msg_more($OVERVIEW_FMT);
 }
 
 sub list_headers ($;$) {
        my ($self) = @_;
-       do_more($self, $LIST_HEADERS);
+       $self->msg_more($LIST_HEADERS);
 }
 
 sub list_active ($;$) {
@@ -206,12 +169,7 @@ sub cmd_list ($;$$) {
                my $arg = shift @args;
                $arg =~ tr/A-Z./a-z_/;
                $arg = "list_$arg";
-               return r501 if $DISABLED{$arg};
-
-               $arg = eval {
-                       no strict 'refs';
-                       *{$arg}{CODE};
-               };
+               $arg = $self->can($arg);
                return r501 unless $arg && args_ok($arg, scalar @args);
                more($self, '215 information follows');
                $arg->($self, @args);
@@ -224,22 +182,37 @@ sub cmd_list ($;$$) {
        '.'
 }
 
-sub cmd_listgroup ($;$) {
-       my ($self, $group) = @_;
+sub listgroup_range_i {
+       my ($self, $beg, $end) = @_;
+       my $r = $self->{ng}->mm->msg_range($beg, $end, 'num');
+       scalar(@$r) or return;
+       more($self, join("\r\n", map { $_->[0] } @$r));
+       1;
+}
+
+sub listgroup_all_i {
+       my ($self, $num) = @_;
+       my $ary = $self->{ng}->mm->ids_after($num);
+       scalar(@$ary) or return;
+       more($self, join("\r\n", @$ary));
+       1;
+}
+
+sub cmd_listgroup ($;$$) {
+       my ($self, $group, $range) = @_;
        if (defined $group) {
                my $res = cmd_group($self, $group);
                return $res if ($res !~ /\A211 /);
                more($self, $res);
        }
-
        $self->{ng} or return '412 no newsgroup selected';
-       my $n = 0;
-       long_response($self, sub {
-               my $ary = $self->{ng}->mm->ids_after(\$n);
-               scalar @$ary or return;
-               more($self, join("\r\n", @$ary));
-               1;
-       });
+       if (defined $range) {
+               my $r = get_range($self, $range);
+               return $r unless ref $r;
+               long_response($self, \&listgroup_range_i, @$r);
+       } else { # grab every article number
+               long_response($self, \&listgroup_all_i, \(my $num = 0));
+       }
 }
 
 sub parse_time ($$;$) {
@@ -249,16 +222,17 @@ sub parse_time ($$;$) {
                $gmt =~ /\A(?:UTC|GMT)\z/i or die "GM invalid: $gmt";
                $gmt = 1;
        }
-       my @now = $gmt ? gmtime : localtime;
        my ($YYYY, $MM, $DD);
-       if (length($date) == 8) { # RFC 3977 allows YYYYMMDD
+       if (bytes::length($date) == 8) { # RFC 3977 allows YYYYMMDD
                ($YYYY, $MM, $DD) = unpack('A4A2A2', $date);
        } else { # legacy clients send YYMMDD
-               ($YYYY, $MM, $DD) = unpack('A2A2A2', $date);
+               my $YY;
+               ($YY, $MM, $DD) = unpack('A2A2A2', $date);
+               my @now = $gmt ? gmtime : localtime;
                my $cur_year = $now[5] + 1900;
-               if ($YYYY > $cur_year) {
-                       $YYYY += int($cur_year / 1000) * 1000 - 100;
-               }
+               my $cur_cent = int($cur_year / 100) * 100;
+               $YYYY = (($YY + $cur_cent) > $cur_year) ?
+                       ($YY + 1900) : ($YY + $cur_cent);
        }
        if ($gmt) {
                timegm($ss, $mm, $hh, $DD, $MM - 1, $YYYY);
@@ -319,6 +293,26 @@ sub ngpat2re (;$) {
        $_[0] = qr/\A(?:$_[0])\z/;
 }
 
+sub newnews_i {
+       my ($self, $overs, $ts, $prev) = @_;
+       my $over = $overs->[0];
+       my $msgs = $over->query_ts($ts, $$prev);
+       if (scalar @$msgs) {
+               more($self, '<' .
+                       join(">\r\n<", map { $_->{mid} } @$msgs ).
+                       '>');
+               $$prev = $msgs->[-1]->{num};
+       } else {
+               shift @$overs;
+               if (@$overs) { # continue onto next newsgroup
+                       $$prev = 0;
+                       return 1;
+               } else { # break out of the long response.
+                       return;
+               }
+       }
+}
+
 sub cmd_newnews ($$$$;$$) {
        my ($self, $newsgroups, $date, $time, $gmt, $dists) = @_;
        my $ts = eval { parse_time($date, $time, $gmt) };
@@ -327,40 +321,25 @@ sub cmd_newnews ($$$$;$$) {
        my ($keep, $skip) = split('!', $newsgroups, 2);
        ngpat2re($keep);
        ngpat2re($skip);
-       my @over;
+       my @overs;
        foreach my $ng (@{$self->{nntpd}->{grouplist}}) {
                $ng->{newsgroup} =~ $keep or next;
                $ng->{newsgroup} =~ $skip and next;
                my $over = $ng->over or next;
-               push @over, $over;
+               push @overs, $over;
        };
-       return '.' unless @over;
+       return '.' unless @overs;
 
        my $prev = 0;
-       long_response($self, sub {
-               my $over = $over[0];
-               my $msgs = $over->query_ts($ts, $prev);
-               if (scalar @$msgs) {
-                       more($self, '<' .
-                               join(">\r\n<", map { $_->mid } @$msgs ).
-                               '>');
-                       $prev = $msgs->[-1]->{num};
-               } else {
-                       shift @over;
-                       if (@over) { # continue onto next newsgroup
-                               $prev = 0;
-                               return 1;
-                       } else { # break out of the long response.
-                               return;
-                       }
-               }
-       });
+       long_response($self, \&newnews_i, \@overs, $ts, \$prev);
 }
 
 sub cmd_group ($$) {
        my ($self, $group) = @_;
        my $no_such = '411 no such news group';
-       my $ng = $self->{nntpd}->{groups}->{$group} or return $no_such;
+       my $nntpd = $self->{nntpd};
+       my $ng = $nntpd->{groups}->{$group} or return $no_such;
+       $nntpd->idler_start;
 
        $self->{ng} = $ng;
        my ($min, $max) = $ng->mm->minmax;
@@ -403,13 +382,13 @@ sub cmd_post ($) {
 sub cmd_quit ($) {
        my ($self) = @_;
        res($self, '205 closing connection - goodbye!');
-       $self->close;
+       $self->shutdn;
        undef;
 }
 
 sub header_append ($$$) {
        my ($hdr, $k, $v) = @_;
-       my @v = $hdr->header($k);
+       my @v = $hdr->header_raw($k);
        foreach (@v) {
                return if $v eq $_;
        }
@@ -432,24 +411,43 @@ sub xref ($$$$) {
        $ret;
 }
 
-sub set_nntp_headers ($$$$$) {
-       my ($self, $hdr, $ng, $n, $mid) = @_;
+sub set_nntp_headers ($$) {
+       my ($hdr, $smsg) = @_;
+       my ($mid) = $smsg->{mid};
+
+       # why? leafnode requires a Path: header for some inexplicable
+       # reason.  We'll fake the shortest one possible.
+       $hdr->header_set('Path', 'y');
+
+       # leafnode (and maybe other NNTP clients) have trouble dealing
+       # with v2 messages which have multiple Message-IDs (either due
+       # to our own content-based dedupe or buggy git-send-email versions).
+       my @mids = $hdr->header_raw('Message-ID');
+       if (scalar(@mids) > 1) {
+               my $mid0 = "<$mid>";
+               $hdr->header_set('Message-ID', $mid0);
+               my @alt = $hdr->header_raw('X-Alt-Message-ID');
+               my %seen = map { $_ => 1 } (@alt, $mid0);
+               push(@alt, grep { !$seen{$_}++ } @mids);
+               $hdr->header_set('X-Alt-Message-ID', @alt);
+       }
 
        # clobber some
-       my $xref = xref($self, $ng, $n, $mid);
+       my $ibx = $smsg->{-ibx};
+       my $xref = xref($smsg->{nntp}, $ibx, $smsg->{num}, $mid);
        $hdr->header_set('Xref', $xref);
        $xref =~ s/:[0-9]+//g;
        $hdr->header_set('Newsgroups', (split(/ /, $xref, 2))[1]);
-       header_append($hdr, 'List-Post', "<mailto:$ng->{-primary_address}>");
-       if (my $url = $ng->base_url) {
+       header_append($hdr, 'List-Post', "<mailto:$ibx->{-primary_address}>");
+       if (my $url = $ibx->base_url) {
                $mid = mid_escape($mid);
                header_append($hdr, 'Archived-At', "<$url$mid/>");
                header_append($hdr, 'List-Archive', "<$url>");
        }
 }
 
-sub art_lookup ($$$) {
-       my ($self, $art, $set_headers) = @_;
+sub art_lookup ($$) {
+       my ($self, $art) = @_;
        my $ng = $self->{ng};
        my ($n, $mid);
        my $err;
@@ -458,7 +456,7 @@ sub art_lookup ($$$) {
                        $err = '423 no such article number in this group';
                        $n = int($art);
                        goto find_mid;
-               } elsif ($art =~ /\A<([^>]+)>\z/) {
+               } elsif ($art =~ $ONE_MSGID) {
                        $mid = $1;
                        $err = r430;
                        $n = $ng->mm->num_for($mid) if $ng;
@@ -485,26 +483,18 @@ find_mid:
        }
 found:
        my $smsg = $ng->over->get_art($n) or return $err;
-       my $msg = $ng->msg_by_smsg($smsg) or return $err;
-       my $s = Email::Simple->new($msg);
-       if ($set_headers) {
-               set_nntp_headers($self, $s->header_obj, $ng, $n, $mid);
-
-               # must be last
-               $s->body_set('') if ($set_headers == 2);
-       }
-       [ $n, $mid, $s, $smsg->bytes, $smsg->lines, $ng ];
+       $smsg->{-ibx} = $ng;
+       $smsg;
 }
 
-sub simple_body_write ($$) {
-       my ($self, $s) = @_;
-       my $body = $s->body;
-       $s->body_set('');
-       $body =~ s/^\./../smg;
-       $body =~ s/(?<!\r)\n/\r\n/sg;
-       do_more($self, $body);
-       do_more($self, "\r\n") unless $body =~ /\r\n\z/s;
-       '.'
+sub msg_body_write ($$) {
+       my ($self, $msg) = @_;
+
+       # these can momentarily double the memory consumption :<
+       $$msg =~ s/^\./../smg;
+       $$msg =~ s/(?<!\r)\n/\r\n/sg; # Alpine barfs without this
+       $$msg .= "\r\n" unless $$msg =~ /\r\n\z/s;
+       $self->msg_more($$msg);
 }
 
 sub set_art {
@@ -512,53 +502,91 @@ sub set_art {
        $self->{article} = $art if defined $art && $art =~ /\A[0-9]+\z/;
 }
 
-sub _header ($) {
-       my $hdr = $_[0]->header_obj->as_string;
-       utf8::encode($hdr);
-       $hdr =~ s/(?<!\r)\n/\r\n/sg;
-       $hdr
+sub msg_hdr_write ($$) {
+       my ($eml, $smsg) = @_;
+       set_nntp_headers($eml, $smsg);
+
+       my $hdr = $eml->{hdr} // \(my $x = '');
+       # fixup old bug from import (pre-a0c07cba0e5d8b6a)
+       $$hdr =~ s/\A[\r\n]*From [^\r\n]*\r?\n//s;
+       $$hdr =~ s/(?<!\r)\n/\r\n/sg; # Alpine barfs without this
+
+       # for leafnode compatibility, we need to ensure Message-ID headers
+       # are only a single line.
+       $$hdr =~ s/^(Message-ID:)[ \t]*\r\n[ \t]+([^\r]+)\r\n/$1 $2\r\n/igsm;
+       $smsg->{nntp}->msg_more($$hdr);
+}
+
+sub blob_cb { # called by git->cat_async via git_async_cat
+       my ($bref, $oid, $type, $size, $smsg) = @_;
+       my $self = $smsg->{nntp};
+       my $code = $smsg->{nntp_code} // 220;
+       if (!defined($oid)) {
+               # it's possible to have TOCTOU if an admin runs
+               # public-inbox-(edit|purge), just move onto the next message
+               warn "E: $smsg->{blob} missing in $smsg->{-ibx}->{inboxdir}\n";
+               return $self->requeue;
+       } elsif ($smsg->{blob} ne $oid) {
+               $self->close;
+               die "BUG: $smsg->{blob} != $oid";
+       }
+       my $r = "$code $smsg->{num} <$smsg->{mid}> article retrieved - ";
+       my $eml = PublicInbox::Eml->new($bref);
+       if ($code == 220) {
+               more($self, $r .= 'head and body follow');
+               msg_hdr_write($eml, $smsg);
+               $self->msg_more("\r\n");
+               msg_body_write($self, $bref);
+       } elsif ($code == 221) {
+               more($self, $r .= 'head follows');
+               msg_hdr_write($eml, $smsg);
+       } elsif ($code == 222) {
+               more($self, $r .= 'body follows');
+               msg_body_write($self, $bref);
+       } else {
+               $self->close;
+               die "BUG: bad code: $r";
+       }
+       $self->write(\".\r\n"); # flushes (includes ->zflush)
+       $self->requeue;
 }
 
 sub cmd_article ($;$) {
        my ($self, $art) = @_;
-       my $r = art_lookup($self, $art, 1);
-       return $r unless ref $r;
-       my ($n, $mid, $s) = @$r;
+       my $smsg = art_lookup($self, $art);
+       return $smsg unless ref $smsg;
        set_art($self, $art);
-       more($self, "220 $n <$mid> article retrieved - head and body follow");
-       do_more($self, _header($s));
-       do_more($self, "\r\n");
-       simple_body_write($self, $s);
+       $smsg->{nntp} = $self;
+       ${git_async_cat($smsg->{-ibx}->git, $smsg->{blob}, \&blob_cb, $smsg)};
 }
 
 sub cmd_head ($;$) {
        my ($self, $art) = @_;
-       my $r = art_lookup($self, $art, 2);
-       return $r unless ref $r;
-       my ($n, $mid, $s) = @$r;
+       my $smsg = art_lookup($self, $art);
+       return $smsg unless ref $smsg;
        set_art($self, $art);
-       more($self, "221 $n <$mid> article retrieved - head follows");
-       do_more($self, _header($s));
-       '.'
+       $smsg->{nntp} = $self;
+       $smsg->{nntp_code} = 221;
+       ${git_async_cat($smsg->{-ibx}->git, $smsg->{blob}, \&blob_cb, $smsg)};
 }
 
 sub cmd_body ($;$) {
        my ($self, $art) = @_;
-       my $r = art_lookup($self, $art, 0);
-       return $r unless ref $r;
-       my ($n, $mid, $s) = @$r;
+       my $smsg = art_lookup($self, $art);
+       return $smsg unless ref $smsg;
        set_art($self, $art);
-       more($self, "222 $n <$mid> article retrieved - body follows");
-       simple_body_write($self, $s);
+       $smsg->{nntp} = $self;
+       $smsg->{nntp_code} = 222;
+       ${git_async_cat($smsg->{-ibx}->git, $smsg->{blob}, \&blob_cb, $smsg)};
 }
 
 sub cmd_stat ($;$) {
        my ($self, $art) = @_;
-       my $r = art_lookup($self, $art, 0);
-       return $r unless ref $r;
-       my ($n, $mid, undef) = @$r;
+       my $smsg = art_lookup($self, $art); # art may be msgid
+       return $smsg unless ref $smsg;
+       $art = $smsg->{num};
        set_art($self, $art);
-       "223 $n <$mid> article retrieved - request text separately";
+       "223 $art <$smsg->{mid}> article retrieved - request text separately";
 }
 
 sub cmd_ihave ($) { '435 article not wanted - do not send it' }
@@ -589,59 +617,73 @@ sub get_range ($$) {
        $beg = $min if ($beg < $min);
        $end = $max if ($end > $max);
        return '420 No article(s) selected' if ($beg > $end);
-       [ $beg, $end ];
+       [ \$beg, $end ];
 }
 
-sub long_response ($$) {
-       my ($self, $cb) = @_;
-       die "BUG: nested long response" if $self->{long_res};
+sub long_step {
+       my ($self) = @_;
+       # wbuf is unset or empty, here; {long} may add to it
+       my ($fd, $cb, $t0, @args) = @{$self->{long_cb}};
+       my $more = eval { $cb->($self, @args) };
+       if ($@ || !$self->{sock}) { # something bad happened...
+               delete $self->{long_cb};
+               my $elapsed = now() - $t0;
+               if ($@) {
+                       err($self,
+                           "%s during long response[$fd] - %0.6f",
+                           $@, $elapsed);
+               }
+               out($self, " deferred[$fd] aborted - %0.6f", $elapsed);
+               $self->close;
+       } elsif ($more) { # $self->{wbuf}:
+               $self->update_idle_time;
+
+               # COMPRESS users all share the same DEFLATE context.
+               # Flush it here to ensure clients don't see
+               # each other's data
+               $self->zflush;
+
+               # no recursion, schedule another call ASAP, but only after
+               # all pending writes are done.  autovivify wbuf:
+               my $new_size = push(@{$self->{wbuf}}, \&long_step);
+
+               # wbuf may be populated by $cb, no need to rearm if so:
+               $self->requeue if $new_size == 1;
+       } else { # all done!
+               delete $self->{long_cb};
+               res($self, '.');
+               my $elapsed = now() - $t0;
+               my $fd = fileno($self->{sock});
+               out($self, " deferred[$fd] done - %0.6f", $elapsed);
+               my $wbuf = $self->{wbuf}; # do NOT autovivify
+               $self->requeue unless $wbuf && @$wbuf;
+       }
+}
 
-       my $fd = fileno($self->{sock});
-       defined $fd or return;
+sub long_response ($$;@) {
+       my ($self, $cb, @args) = @_; # cb returns true if more, false if done
+
+       my $sock = $self->{sock} or return;
        # make sure we disable reading during a long response,
        # clients should not be sending us stuff and making us do more
        # work while we are stream a response to them
-       $self->watch_read(0);
-       my $t0 = now();
-       $self->{long_res} = sub {
-               my $more = eval { $cb->() };
-               if ($@ || $self->{closed}) {
-                       $self->{long_res} = undef;
-
-                       if ($@) {
-                               err($self,
-                                   "%s during long response[$fd] - %0.6f",
-                                   $@, now() - $t0);
-                       }
-                       if ($self->{closed}) {
-                               out($self, " deferred[$fd] aborted - %0.6f",
-                                          now() - $t0);
-                       } else {
-                               update_idle_time($self);
-                               check_read($self);
-                       }
-               } elsif ($more) { # scalar @{$self->{wbuf}}:
-                       # no recursion, schedule another call ASAP
-                       # but only after all pending writes are done
-                       update_idle_time($self);
-
-                       push @$nextq, $self;
-                       $nextt ||= PublicInbox::EvCleanup::asap(*next_tick);
-               } else { # all done!
-                       $self->{long_res} = undef;
-                       check_read($self);
-                       res($self, '.');
-                       out($self, " deferred[$fd] done - %0.6f", now() - $t0);
-               }
-       };
-       $self->{long_res}->(); # kick off!
+       $self->{long_cb} = [ fileno($sock), $cb, now(), @args ];
+       long_step($self); # kick off!
        undef;
 }
 
+sub hdr_msgid_range_i {
+       my ($self, $beg, $end) = @_;
+       my $r = $self->{ng}->mm->msg_range($beg, $end);
+       @$r or return;
+       more($self, join("\r\n", map { "$_->[0] <$_->[1]>" } @$r));
+       1;
+}
+
 sub hdr_message_id ($$$) { # optimize XHDR Message-ID [range] for slrnpull.
        my ($self, $xhdr, $range) = @_;
 
-       if (defined $range && $range =~ /\A<(.+)>\z/) { # Message-ID
+       if (defined $range && $range =~ $ONE_MSGID) {
                my ($ng, $n) = mid_lookup($self, $1);
                return r430 unless $n;
                hdr_mid_response($self, $xhdr, $ng, $n, $range, $range);
@@ -649,17 +691,8 @@ sub hdr_message_id ($$$) { # optimize XHDR Message-ID [range] for slrnpull.
                $range = $self->{article} unless defined $range;
                my $r = get_range($self, $range);
                return $r unless ref $r;
-               my $mm = $self->{ng}->mm;
-               my ($beg, $end) = @$r;
                more($self, $xhdr ? r221 : r225);
-               long_response($self, sub {
-                       my $r = $mm->msg_range(\$beg, $end);
-                       @$r or return;
-                       more($self, join("\r\n", map {
-                               "$_->[0] <$_->[1]>"
-                       } @$r));
-                       1;
-               });
+               long_response($self, \&hdr_msgid_range_i, @$r);
        }
 }
 
@@ -678,10 +711,22 @@ sub mid_lookup ($$) {
        (undef, undef);
 }
 
+sub xref_range_i {
+       my ($self, $beg, $end) = @_;
+       my $ng = $self->{ng};
+       my $r = $ng->mm->msg_range($beg, $end);
+       @$r or return;
+       more($self, join("\r\n", map {
+               my $num = $_->[0];
+               "$num ".xref($self, $ng, $num, $_->[1]);
+       } @$r));
+       1;
+}
+
 sub hdr_xref ($$$) { # optimize XHDR Xref [range] for rtin
        my ($self, $xhdr, $range) = @_;
 
-       if (defined $range && $range =~ /\A<(.+)>\z/) { # Message-ID
+       if (defined $range && $range =~ $ONE_MSGID) {
                my $mid = $1;
                my ($ng, $n) = mid_lookup($self, $mid);
                return r430 unless $n;
@@ -691,56 +736,53 @@ sub hdr_xref ($$$) { # optimize XHDR Xref [range] for rtin
                $range = $self->{article} unless defined $range;
                my $r = get_range($self, $range);
                return $r unless ref $r;
-               my $ng = $self->{ng};
-               my $mm = $ng->mm;
-               my ($beg, $end) = @$r;
                more($self, $xhdr ? r221 : r225);
-               long_response($self, sub {
-                       my $r = $mm->msg_range(\$beg, $end);
-                       @$r or return;
-                       more($self, join("\r\n", map {
-                               my $num = $_->[0];
-                               "$num ".xref($self, $ng, $num, $_->[1]);
-                       } @$r));
-                       1;
-               });
+               long_response($self, \&xref_range_i, @$r);
        }
 }
 
 sub over_header_for {
        my ($over, $num, $field) = @_;
        my $smsg = $over->get_art($num) or return;
-       return PublicInbox::SearchMsg::date($smsg) if $field eq 'date';
+       return PublicInbox::Smsg::date($smsg) if $field eq 'date';
        $smsg->{$field};
 }
 
-sub hdr_searchmsg ($$$$) {
+sub smsg_range_i {
+       my ($self, $beg, $end, $field) = @_;
+       my $over = $self->{ng}->over;
+       my $msgs = $over->query_xover($$beg, $end);
+       scalar(@$msgs) or return;
+       my $tmp = '';
+
+       # ->{$field} is faster than ->$field invocations, so favor that.
+       if ($field eq 'date') {
+               for my $s (@$msgs) {
+                       $tmp .= "$s->{num} ".PublicInbox::Smsg::date($s)."\r\n"
+               }
+       } else {
+               for my $s (@$msgs) {
+                       $tmp .= "$s->{num} $s->{$field}\r\n";
+               }
+       }
+       utf8::encode($tmp);
+       $self->msg_more($tmp);
+       $$beg = $msgs->[-1]->{num} + 1;
+}
+
+sub hdr_smsg ($$$$) {
        my ($self, $xhdr, $field, $range) = @_;
-       if (defined $range && $range =~ /\A<(.+)>\z/) { # Message-ID
+       if (defined $range && $range =~ $ONE_MSGID) {
                my ($ng, $n) = mid_lookup($self, $1);
                return r430 unless defined $n;
                my $v = over_header_for($ng->over, $n, $field);
                hdr_mid_response($self, $xhdr, $ng, $n, $range, $v);
        } else { # numeric range
                $range = $self->{article} unless defined $range;
-               my $over = $self->{ng}->over;
-               my $mm = $self->{ng}->mm;
                my $r = get_range($self, $range);
                return $r unless ref $r;
-               my ($beg, $end) = @$r;
                more($self, $xhdr ? r221 : r225);
-               my $cur = $beg;
-               long_response($self, sub {
-                       my $msgs = $over->query_xover($cur, $end);
-                       my $nr = scalar @$msgs or return;
-                       my $tmp = '';
-                       foreach my $s (@$msgs) {
-                               $tmp .= $s->{num} . ' ' . $s->$field . "\r\n";
-                       }
-                       utf8::encode($tmp);
-                       do_more($self, $tmp);
-                       $cur = $msgs->[-1]->{num} + 1;
-               });
+               long_response($self, \&smsg_range_i, @$r, $field);
        }
 }
 
@@ -753,9 +795,9 @@ sub do_hdr ($$$;$) {
                hdr_xref($self, $xhdr, $range);
        } elsif ($sub =~ /\A(?:subject|references|date|from|to|cc|
                                bytes|lines)\z/x) {
-               hdr_searchmsg($self, $xhdr, $sub, $range);
+               hdr_smsg($self, $xhdr, $sub, $range);
        } elsif ($sub =~ /\A:(bytes|lines)\z/) {
-               hdr_searchmsg($self, $xhdr, $1, $range);
+               hdr_smsg($self, $xhdr, $1, $range);
        } else {
                $xhdr ? (r221 . "\r\n.") : "503 HDR not permitted on $header";
        }
@@ -786,7 +828,7 @@ sub hdr_mid_prefix ($$$$$) {
 }
 
 sub hdr_mid_response ($$$$$$) {
-       my ($self, $xhdr, $ng, $n, $mid, $v) = @_; # r: art_lookup result
+       my ($self, $xhdr, $ng, $n, $mid, $v) = @_;
        my $res = '';
        if ($xhdr) {
                $res .= r221 . "\r\n";
@@ -800,6 +842,13 @@ sub hdr_mid_response ($$$$$$) {
        undef;
 }
 
+sub xrover_i {
+       my ($self, $beg, $end) = @_;
+       my $h = over_header_for($self->{ng}->over, $$beg, 'references');
+       more($self, "$$beg $h") if defined($h);
+       $$beg++ < $end;
+}
+
 sub cmd_xrover ($;$) {
        my ($self, $range) = @_;
        my $ng = $self->{ng} or return '412 no newsgroup selected';
@@ -809,16 +858,8 @@ sub cmd_xrover ($;$) {
        $range = $self->{article} unless defined $range;
        my $r = get_range($self, $range);
        return $r unless ref $r;
-       my ($beg, $end) = @$r;
-       my $mm = $ng->mm;
-       my $over = $ng->over;
        more($self, '224 Overview information follows');
-
-       long_response($self, sub {
-               my $h = over_header_for($over, $beg, 'references');
-               more($self, "$beg $h") if defined($h);
-               $beg++ < $end;
-       });
+       long_response($self, \&xrover_i, @$r);
 }
 
 sub over_line ($$$$) {
@@ -828,7 +869,7 @@ sub over_line ($$$$) {
        my $s = join("\t", $num,
                $smsg->{subject},
                $smsg->{from},
-               PublicInbox::SearchMsg::date($smsg),
+               PublicInbox::Smsg::date($smsg),
                "<$smsg->{mid}>",
                $smsg->{references},
                $smsg->{bytes},
@@ -840,7 +881,7 @@ sub over_line ($$$$) {
 
 sub cmd_over ($;$) {
        my ($self, $range) = @_;
-       if ($range && $range =~ /\A<(.+)>\z/) {
+       if ($range && $range =~ $ONE_MSGID) {
                my ($ng, $n) = mid_lookup($self, $1);
                defined $n or return r430;
                my $smsg = $ng->over->get_art($n) or return r430;
@@ -856,30 +897,59 @@ sub cmd_over ($;$) {
        }
 }
 
+sub xover_i {
+       my ($self, $beg, $end) = @_;
+       my $ng = $self->{ng};
+       my $msgs = $ng->over->query_xover($$beg, $end);
+       my $nr = scalar @$msgs or return;
+
+       # OVERVIEW.FMT
+       more($self, join("\r\n", map {
+               over_line($self, $ng, $_->{num}, $_);
+               } @$msgs));
+       $$beg = $msgs->[-1]->{num} + 1;
+}
+
 sub cmd_xover ($;$) {
        my ($self, $range) = @_;
        $range = $self->{article} unless defined $range;
        my $r = get_range($self, $range);
        return $r unless ref $r;
        my ($beg, $end) = @$r;
-       more($self, "224 Overview information follows for $beg to $end");
-       my $over = $self->{ng}->over;
-       my $cur = $beg;
-       long_response($self, sub {
-               my $msgs = $over->query_xover($cur, $end);
-               my $nr = scalar @$msgs or return;
+       more($self, "224 Overview information follows for $$beg to $end");
+       long_response($self, \&xover_i, @$r);
+}
+
+sub compressed { undef }
 
-               # OVERVIEW.FMT
-               more($self, join("\r\n", map {
-                       over_line($self, $self->{ng}, $_->{num}, $_);
-                       } @$msgs));
-               $cur = $msgs->[-1]->{num} + 1;
-       });
+sub cmd_starttls ($) {
+       my ($self) = @_;
+       my $sock = $self->{sock} or return;
+       # RFC 4642 2.2.1
+       return r502 if ($sock->can('accept_SSL') || $self->compressed);
+       my $opt = $self->{nntpd}->{accept_tls} or
+               return '580 can not initiate TLS negotiation';
+       res($self, '382 Continue with TLS negotiation');
+       $self->{sock} = IO::Socket::SSL->start_SSL($sock, %$opt);
+       $self->requeue if PublicInbox::DS::accept_tls_step($self);
+       undef;
+}
+
+# RFC 8054
+sub cmd_compress ($$) {
+       my ($self, $alg) = @_;
+       return '503 Only DEFLATE is supported' if uc($alg) ne 'DEFLATE';
+       return r502 if $self->compressed;
+       PublicInbox::NNTPdeflate->enable($self);
+       $self->requeue;
+       undef
 }
 
+sub zflush {} # overridden by NNTPdeflate
+
 sub cmd_xpath ($$) {
        my ($self, $mid) = @_;
-       return r501 unless $mid =~ /\A<(.+)>\z/;
+       return r501 unless $mid =~ $ONE_MSGID;
        $mid = $1;
        my @paths;
        foreach my $ng (values %{$self->{nntpd}->{groups}}) {
@@ -890,24 +960,14 @@ sub cmd_xpath ($$) {
        '223 '.join(' ', @paths);
 }
 
-sub res ($$) {
-       my ($self, $line) = @_;
-       do_write($self, $line . "\r\n");
-}
+sub res ($$) { do_write($_[0], $_[1] . "\r\n") }
 
-sub more ($$) {
-       my ($self, $line) = @_;
-       do_more($self, $line . "\r\n");
-}
+sub more ($$) { $_[0]->msg_more($_[1] . "\r\n") }
 
 sub do_write ($$) {
-       my ($self, $data) = @_;
-       my $done = $self->write($data);
-       return 0 if $self->{closed};
-
-       # Do not watch for readability if we have data in the queue,
-       # instead re-enable watching for readability when we can
-       $self->watch_read(0) if (!$done || $self->{long_res});
+       my $self = $_[0];
+       my $done = $self->write(\($_[1]));
+       return 0 unless $self->{sock};
 
        $done;
 }
@@ -922,99 +982,45 @@ sub out ($$;@) {
        printf { $self->{nntpd}->{out} } $fmt."\n", @args;
 }
 
-use constant MSG_MORE => ($^O eq 'linux') ? 0x8000 : 0;
-
-sub do_more ($$) {
-       my ($self, $data) = @_;
-       if (MSG_MORE && !scalar(@{$self->{wbuf}})) {
-               my $n = send($self->{sock}, $data, MSG_MORE);
-               if (defined $n) {
-                       my $dlen = length($data);
-                       return 1 if $n == $dlen; # all done!
-                       $data = substr($data, $n, $dlen - $n);
-               }
-       }
-       do_write($self, $data);
-}
-
-# callbacks for PublicInbox::DS
+# callback used by PublicInbox::DS for any (e)poll (in/out/hup/err)
+sub event_step {
+       my ($self) = @_;
 
-sub event_hup { $_[0]->close }
-sub event_err { $_[0]->close }
+       return unless $self->flush_write && $self->{sock} && !$self->{long_cb};
 
-sub event_write {
-       my ($self) = @_;
-       update_idle_time($self);
-       # only continue watching for readability when we are done writing:
-       if ($self->write(undef) == 1 && !$self->{long_res}) {
-               $self->watch_read(1);
-       }
-}
+       $self->update_idle_time;
+       # only read more requests if we've drained the write buffer,
+       # otherwise we can be buffering infinitely w/o backpressure
 
-sub event_read {
-       my ($self) = @_;
-       use constant LINE_MAX => 512; # RFC 977 section 2.3
-       my $rbuf = \($self->{rbuf});
-       my $r;
-
-       if (index($$rbuf, "\n") < 0) {
-               my $off = length($$rbuf);
-               $r = sysread($self->{sock}, $$rbuf, LINE_MAX, $off);
-               unless (defined $r) {
-                       return if $!{EAGAIN};
-                       return $self->close;
-               }
-               return $self->close if $r == 0;
-       }
-       $r = 1;
-       while ($r > 0 && $$rbuf =~ s/\A[ \t\r\n]*([^\r\n]*)\r?\n//) {
-               my $line = $1;
-               return $self->close if $line =~ /[[:cntrl:]]/s;
-               my $t0 = now();
-               my $fd = fileno($self->{sock});
-               $r = eval { process_line($self, $line) };
-               my $d = $self->{long_res} ?
-                       " deferred[$fd]" : '';
-               out($self, "[$fd] %s - %0.6f$d", $line, now() - $t0);
+       my $rbuf = $self->{rbuf} // \(my $x = '');
+       my $line = index($$rbuf, "\n");
+       while ($line < 0) {
+               return $self->close if length($$rbuf) >= LINE_MAX;
+               $self->do_read($rbuf, LINE_MAX, length($$rbuf)) or return;
+               $line = index($$rbuf, "\n");
        }
+       $line = substr($$rbuf, 0, $line + 1, '');
+       $line =~ s/\r?\n\z//s;
+       return $self->close if $line =~ /[[:cntrl:]]/s;
 
+       my $t0 = now();
+       my $fd = fileno($self->{sock});
+       my $r = eval { process_line($self, $line) };
+       my $pending = $self->{wbuf} ? ' pending' : '';
+       out($self, "[$fd] %s - %0.6f$pending", $line, now() - $t0);
        return $self->close if $r < 0;
-       my $len = length($$rbuf);
-       return $self->close if ($len >= LINE_MAX);
-       update_idle_time($self);
-}
+       $self->rbuf_idle($rbuf);
+       $self->update_idle_time;
 
-sub check_read {
-       my ($self) = @_;
-       if (index($self->{rbuf}, "\n") >= 0) {
-               # Force another read if there is a pipelined request.
-               # We don't know if the socket has anything for us to read,
-               # and we must double-check again by the time the timer fires
-               # in case we really did dispatch a read event and started
-               # another long response.
-               push @$nextq, $self;
-               $nextt ||= PublicInbox::EvCleanup::asap(*next_tick);
-       } else {
-               # no pipelined requests available, let the kernel know
-               # to wake us up if there's more
-               $self->watch_read(1); # PublicInbox::DS::watch_read
-       }
-}
-
-sub not_idle_long ($$) {
-       my ($self, $now) = @_;
-        my $sock = $self->{sock} or return;
-       defined(my $fd = fileno($sock)) or return;
-       my $ary = $EXPMAP->{$fd} or return;
-       my $exp_at = $ary->[0] + $EXPTIME;
-       $exp_at > $now;
+       # maybe there's more pipelined data, or we'll have
+       # to register it for socket-readiness notifications
+       $self->requeue unless $pending;
 }
 
 # for graceful shutdown in PublicInbox::Daemon:
 sub busy {
        my ($self, $now) = @_;
-       ($self->{rbuf} ne '' || $self->{long_res} ||
-               scalar(@{$self->{wbuf}}) || not_idle_long($self, $now));
+       ($self->{rbuf} || $self->{wbuf} || $self->not_idle_long($now));
 }
 
 1;