]> Sergey Matveev's repositories - public-inbox.git/blobdiff - lib/PublicInbox/NNTP.pm
nntp: append Archived-At and List-Archive headers
[public-inbox.git] / lib / PublicInbox / NNTP.pm
index 000b2c6140cb8a3c4e7dbdd3550a08ffd12e971d..3e0faaf96dd8f3f45e2f3e44696bec53aec2c771 100644 (file)
@@ -1,5 +1,7 @@
 # Copyright (C) 2015 all contributors <meta@public-inbox.org>
 # License: AGPLv3 or later (https://www.gnu.org/licenses/agpl-3.0.txt)
+#
+# Each instance of this represents a NNTP client socket
 package PublicInbox::NNTP;
 use strict;
 use warnings;
@@ -7,12 +9,13 @@ use base qw(Danga::Socket);
 use fields qw(nntpd article rbuf ng long_res);
 use PublicInbox::Search;
 use PublicInbox::Msgmap;
-use PublicInbox::GitCatFile;
+use PublicInbox::Git;
 use PublicInbox::MID qw(mid2path);
 use Email::MIME;
 use Data::Dumper qw(Dumper);
 use POSIX qw(strftime);
 use Time::HiRes qw(clock_gettime CLOCK_MONOTONIC);
+use URI::Escape qw(uri_escape_utf8);
 use constant {
        r501 => '501 command syntax error',
        r221 => '221 Header follows',
@@ -36,6 +39,25 @@ my %DISABLED; # = map { $_ => 1 } qw(xover list_overview_fmt newnews xhdr);
 my $EXPMAP; # fd -> [ idle_time, $self ]
 my $EXPTIMER;
 our $EXPTIME = 180; # 3 minutes
+my $WEAKEN = {}; # string(nntpd) -> nntpd
+my $WEAKTIMER;
+
+my $next_tick;
+my $nextq = [];
+sub next_tick () {
+       $next_tick = undef;
+       my $q = $nextq;
+       $nextq = [];
+       foreach my $nntp (@$q) {
+               # for request && response protocols, always finish writing
+               # before finishing reading:
+               if (my $long_cb = $nntp->{long_res}) {
+                       $nntp->write($long_cb);
+               } elsif (&Danga::Socket::POLLIN & $nntp->{event_watch}) {
+                       event_read($nntp);
+               }
+       }
+}
 
 sub update_idle_time ($) {
        my ($self) = @_;
@@ -44,6 +66,16 @@ sub update_idle_time ($) {
        defined $tmp and $EXPMAP->{$tmp} = [ now(), $self ];
 }
 
+# reduce FD pressure by closing some "git cat-file --batch" processes
+# and unused FDs for msgmap and Xapian indices
+sub weaken_groups () {
+       $WEAKTIMER = undef;
+       foreach my $nntpd (values %$WEAKEN) {
+               $_->weaken_all foreach (@{$nntpd->{grouplist}});
+       }
+       $WEAKEN = {};
+}
+
 sub expire_old () {
        my $now = now();
        my $exp = $EXPTIME;
@@ -67,11 +99,15 @@ sub expire_old () {
                $next -= $now;
                $next = 0 if $next < 0;
                $EXPTIMER = Danga::Socket->AddTimer($next, *expire_old);
+               weaken_groups();
        } else {
                $EXPTIMER = undef;
-               # noop to kick outselves out of the loop so descriptors
+               # noop to kick outselves out of the loop ASAP so descriptors
                # really get closed
                Danga::Socket->AddTimer(0, sub {});
+
+               # grace period for reaping resources
+               $WEAKTIMER ||= Danga::Socket->AddTimer(30, *weaken_groups);
        }
 }
 
@@ -85,6 +121,7 @@ sub new ($$$) {
        $self->{rbuf} = '';
        $self->watch_read(1);
        update_idle_time($self);
+       $WEAKEN->{"$nntpd"} = $nntpd;
        $EXPTIMER ||= Danga::Socket->AddTimer($EXPTIME, *expire_old);
        $self;
 }
@@ -114,7 +151,7 @@ sub process_line ($$) {
        my $err = $@;
        if ($err && !$self->{closed}) {
                chomp($l = Dumper(\$l));
-               err($self, "error from: $l $err");
+               err($self, 'error from: %s (%s)', $l, $err);
                $res = '503 program fault - command not performed';
        }
        return 0 unless defined $res;
@@ -210,7 +247,7 @@ sub cmd_listgroup ($;$) {
        }
 
        $self->{ng} or return '412 no newsgroup selected';
-       $self->long_response(0, long_response_limit, sub {
+       long_response($self, 0, long_response_limit, sub {
                my ($i) = @_;
                my $nr = $self->{ng}->mm->id_batch($$i, sub {
                        my ($ary) = @_;
@@ -227,7 +264,7 @@ sub parse_time ($$;$) {
        use Time::Local qw();
        my ($hh, $mm, $ss) = unpack('A2A2A2', $time);
        if (defined $gmt) {
-               $gmt =~ /\A(?:UTC|GMT)\z/i or die "GM invalid: $gmt\n";
+               $gmt =~ /\A(?:UTC|GMT)\z/i or die "GM invalid: $gmt";
                $gmt = 1;
        }
        my @now = $gmt ? gmtime : localtime;
@@ -320,7 +357,7 @@ sub cmd_newnews ($$$$;$$) {
 
        $ts .= '..';
        my $opts = { asc => 1, limit => 1000, offset => 0 };
-       $self->long_response(0, long_response_limit, sub {
+       long_response($self, 0, long_response_limit, sub {
                my ($i) = @_;
                my $srch = $srch[0];
                my $res = $srch->query($ts, $opts);
@@ -390,6 +427,29 @@ sub cmd_quit ($) {
        undef;
 }
 
+sub header_append ($$$) {
+       my ($hdr, $k, $v) = @_;
+       my @v = $hdr->header($k);
+       foreach (@v) {
+               return if $v eq $_;
+       }
+       $hdr->header_set($k, @v, $v);
+}
+
+sub set_nntp_headers {
+       my ($hdr, $ng, $n, $mid) = @_;
+
+       # clobber some
+       $hdr->header_set('Newsgroups', $ng->{name});
+       $hdr->header_set('Xref', xref($ng, $n));
+       header_append($hdr, 'List-Post', "<mailto:$ng->{address}>");
+       if (my $url = $ng->{url}) {
+               $mid = uri_escape_utf8($mid);
+               header_append($hdr, 'Archived-At', "<$url$mid/>");
+               header_append($hdr, 'List-Archive', "<$url>");
+       }
+}
+
 sub art_lookup ($$$) {
        my ($self, $art, $set_headers) = @_;
        my $ng = $self->{ng};
@@ -432,8 +492,7 @@ found:
        return $err unless $s;
        my $lines;
        if ($set_headers) {
-               $s->header_set('Newsgroups', $ng->{name});
-               $s->header_set('Xref', xref($ng, $n));
+               set_nntp_headers($s->header_obj, $ng, $n, $mid);
                $lines = $s->body =~ tr!\n!\n!;
 
                # must be last
@@ -460,7 +519,7 @@ sub set_art {
 
 sub cmd_article ($;$) {
        my ($self, $art) = @_;
-       my $r = $self->art_lookup($art, 1);
+       my $r = art_lookup($self, $art, 1);
        return $r unless ref $r;
        my ($n, $mid, $s) = @$r;
        set_art($self, $art);
@@ -472,7 +531,7 @@ sub cmd_article ($;$) {
 
 sub cmd_head ($;$) {
        my ($self, $art) = @_;
-       my $r = $self->art_lookup($art, 2);
+       my $r = art_lookup($self, $art, 2);
        return $r unless ref $r;
        my ($n, $mid, $s) = @$r;
        set_art($self, $art);
@@ -483,7 +542,7 @@ sub cmd_head ($;$) {
 
 sub cmd_body ($;$) {
        my ($self, $art) = @_;
-       my $r = $self->art_lookup($art, 0);
+       my $r = art_lookup($self, $art, 0);
        return $r unless ref $r;
        my ($n, $mid, $s) = @$r;
        set_art($self, $art);
@@ -493,7 +552,7 @@ sub cmd_body ($;$) {
 
 sub cmd_stat ($;$) {
        my ($self, $art) = @_;
-       my $r = $self->art_lookup($art, 0);
+       my $r = art_lookup($self, $art, 0);
        return $r unless ref $r;
        my ($n, $mid, undef) = @$r;
        set_art($self, $art);
@@ -531,16 +590,6 @@ sub get_range ($$) {
        [ $beg, $end ];
 }
 
-sub hdr_val ($$) {
-       my ($r, $header) = @_;
-       return $r->[3] if $header =~ /\A:?bytes\z/i;
-       return $r->[4] if $header =~ /\A:?lines\z/i;
-       $r = $r->[2]->header_obj->header($header);
-       defined $r or return;
-       $r =~ s/[\r\n\t]+/ /sg;
-       $r;
-}
-
 sub long_response ($$$$) {
        my ($self, $beg, $end, $cb) = @_;
        die "BUG: nested long response" if $self->{long_res};
@@ -568,8 +617,8 @@ sub long_response ($$$$) {
 
                        if ($err) {
                                err($self,
-                                   "$err during long response[$fd] - %0.6f",
-                                       now() - $t0);
+                                   "%s during long response[$fd] - %0.6f",
+                                   $err, now() - $t0);
                        }
                        if ($self->{closed}) {
                                out($self, " deferred[$fd] aborted - %0.6f",
@@ -582,9 +631,9 @@ sub long_response ($$$$) {
                        # no recursion, schedule another call ASAP
                        # but only after all pending writes are done
                        update_idle_time($self);
-                       Danga::Socket->AddTimer(0, sub {
-                               $self->write($self->{long_res});
-                       });
+
+                       push @$nextq, $self;
+                       $next_tick ||= Danga::Socket->AddTimer(0, *next_tick);
                } else { # all done!
                        $self->{long_res} = undef;
                        $self->watch_read(1);
@@ -610,7 +659,7 @@ sub hdr_message_id ($$$) { # optimize XHDR Message-ID [range] for slrnpull.
                my $mm = $self->{ng}->mm;
                my ($beg, $end) = @$r;
                more($self, $xhdr ? r221 : r225);
-               $self->long_response($beg, $end, sub {
+               long_response($self, $beg, $end, sub {
                        my ($i) = @_;
                        my $mid = $mm->mid_for($$i);
                        more($self, "$$i <$mid>") if defined $mid;
@@ -653,7 +702,7 @@ sub hdr_xref ($$$) { # optimize XHDR Xref [range] for rtin
                my $mm = $ng->mm;
                my ($beg, $end) = @$r;
                more($self, $xhdr ? r221 : r225);
-               $self->long_response($beg, $end, sub {
+               long_response($self, $beg, $end, sub {
                        my ($i) = @_;
                        my $mid = $mm->mid_for($$i);
                        more($self, "$$i ".xref($ng, $$i)) if defined $mid;
@@ -684,7 +733,7 @@ sub hdr_searchmsg ($$$$) {
                my ($beg, $end) = @$r;
                more($self, $xhdr ? r221 : r225);
                my $off = 0;
-               $self->long_response($beg, $end, sub {
+               long_response($self, $beg, $end, sub {
                        my ($i) = @_;
                        my $res = $srch->query_xover($beg, $end, $off);
                        my $msgs = $res->{msgs};
@@ -770,7 +819,7 @@ sub cmd_xrover ($;$) {
        my $mm = $ng->mm;
        my $srch = $ng->search;
        more($self, '224 Overview information follows');
-       $self->long_response($beg, $end, sub {
+       long_response($self, $beg, $end, sub {
                my ($i) = @_;
                my $mid = $mm->mid_for($$i) or return;
                my $h = search_header_for($srch, $mid, 'references');
@@ -820,7 +869,7 @@ sub cmd_xover ($;$) {
        more($self, "224 Overview information follows for $beg to $end");
        my $srch = $self->{ng}->search;
        my $off = 0;
-       $self->long_response($beg, $end, sub {
+       long_response($self, $beg, $end, sub {
                my ($i) = @_;
                my $res = $srch->query_xover($beg, $end, $off);
                my $msgs = $res->{msgs};
@@ -894,10 +943,10 @@ sub do_more ($$) {
                        $data = substr($data, $n, $dlen - $n);
                }
        }
-       $self->do_write($data);
+       do_write($self, $data);
 }
 
-# callbacks for by Danga::Socket
+# callbacks for Danga::Socket
 
 sub event_hup { $_[0]->close }
 sub event_err { $_[0]->close }
@@ -922,10 +971,10 @@ sub event_read {
                my $line = $1;
                my $t0 = now();
                my $fd = $self->{fd};
-               $r = eval { $self->process_line($line) };
+               $r = eval { process_line($self, $line) };
                my $d = $self->{long_res} ?
                        " deferred[$fd]" : '';
-               out($self, "[$fd] $line - %0.6f$d", now() - $t0);
+               out($self, "[$fd] %s - %0.6f$d", $line, now() - $t0);
        }
 
        return $self->close if $r < 0;
@@ -943,15 +992,13 @@ sub watch_read {
                # and we must double-check again by the time the timer fires
                # in case we really did dispatch a read event and started
                # another long response.
-               Danga::Socket->AddTimer(0, sub {
-                       if (&Danga::Socket::POLLIN & $self->{event_watch}) {
-                               $self->event_read;
-                       }
-               });
+               push @$nextq, $self;
+               $next_tick ||= Danga::Socket->AddTimer(0, *next_tick);
        }
        $rv;
 }
 
+# for graceful shutdown in PublicInbox::Daemon:
 sub busy () {
        my ($self) = @_;
        ($self->{rbuf} ne '' || $self->{long_res} || $self->{write_buf_size});