]> Sergey Matveev's repositories - public-inbox.git/blobdiff - lib/PublicInbox/GzipFilter.pm
www: $MSGID/raw: set charset in HTTP response
[public-inbox.git] / lib / PublicInbox / GzipFilter.pm
index 57344604b30f7e07d1434a601296eab81eaeb625..e37f1f76bd4a886431224ed38aa8a3f838cc50b1 100644 (file)
@@ -1,4 +1,4 @@
-# Copyright (C) 2020 all contributors <meta@public-inbox.org>
+# Copyright (C) 2020-2021 all contributors <meta@public-inbox.org>
 # License: AGPL-3.0+ <https://www.gnu.org/licenses/agpl-3.0.txt>
 #
 # In public-inbox <=1.5.0, public-inbox-httpd favored "getline"
@@ -7,8 +7,8 @@
 #
 # In newer versions, public-inbox-httpd supports a backpressure-aware
 # pull/push model which also accounts for slow git blob storage.
-# {async_next} callbacks only run when the DS {wbuf} is drained
-# {async_eml} callbacks only run when a blob arrives from git.
+# async_next callbacks only run when the DS {wbuf} is drained
+# async_eml callbacks only run when a blob arrives from git.
 #
 # We continue to support getline+close for generic PSGI servers.
 package PublicInbox::GzipFilter;
@@ -46,20 +46,20 @@ sub gz_or_noop {
 sub gzf_maybe ($$) { bless { gz => gz_or_noop(@_) }, __PACKAGE__ }
 
 sub psgi_response {
-       my ($self, $code, $res_hdr, $next_cb, $eml_cb) = @_;
-       my $env = $self->{env};
-       $self->{gz} //= gz_or_noop($res_hdr, $env);
-       if ($env->{'pi-httpd.async'}) {
-               $self->{async_next} = $next_cb;
-               $self->{async_eml} = $eml_cb;
-               my $http = $env->{'psgix.io'}; # PublicInbox::HTTP
+       # $code may be an HTTP response code (e.g. 200) or a CODE ref (mbox_hdr)
+       my ($self, $code, $res_hdr) = @_;
+       if ($self->{env}->{'pi-httpd.async'}) {
+               my $http = $self->{env}->{'psgix.io'}; # PublicInbox::HTTP
                $http->{forward} = $self;
                sub {
                        my ($wcb) = @_; # -httpd provided write callback
-                       $self->{http_out} = $wcb->([$code, $res_hdr]);
-                       $next_cb->($http); # start stepping
+                       $self->{wcb_args} = [ $code, $res_hdr, $wcb ];
+                       $self->can('async_next')->($http); # start stepping
                };
        } else { # generic PSGI code path
+               ref($code) eq 'CODE' and
+                       ($code, $res_hdr) = @{$code->($self)};
+               $self->{gz} //= gz_or_noop($res_hdr, $self->{env});
                [ $code, $res_hdr, $self ];
        }
 }
@@ -86,6 +86,12 @@ sub gzip_or_die () {
        $gz;
 }
 
+sub gone { # what: search/over/mm
+       my ($ctx, $what) = @_;
+       warn "W: `$ctx->{ibx}->{name}' $what went away unexpectedly\n";
+       undef;
+}
+
 # for GetlineBody (via Qspawn) when NOT using $env->{'pi-httpd.async'}
 # Also used for ->getline callbacks
 sub translate ($$) {
@@ -110,15 +116,28 @@ sub translate ($$) {
        }
 }
 
+sub http_out ($) {
+       my ($self) = @_;
+       $self->{http_out} // do {
+               my $args = delete $self->{wcb_args} // return undef;
+               my $wcb = pop @$args; # from PublicInbox:HTTP async
+               # $args->[0] may be \&mbox_hdr or similar
+               $args = $args->[0]->($self) if ref($args->[0]) eq 'CODE';
+               $self->{gz} //= gz_or_noop($args->[1], $self->{env});
+               $self->{http_out} = $wcb->($args); # $wcb->([$code, $hdr_ary])
+       };
+}
+
 sub write {
        # my $ret = bytes::length($_[1]); # XXX does anybody care?
-       $_[0]->{http_out}->write(translate($_[0], $_[1]));
+       http_out($_[0])->write(translate($_[0], $_[1]));
 }
 
 # similar to ->translate; use this when we're sure we know we have
 # more data to buffer after this
 sub zmore {
        my $self = $_[0]; # $_[1] => input
+       http_out($self);
        my $err = $self->{gz}->deflate($_[1], $self->{zbuf});
        die "gzip->deflate: $err" if $err != Z_OK;
        undef;
@@ -141,17 +160,15 @@ sub zflush ($;$) {
 
 sub close {
        my ($self) = @_;
-       if (my $http_out = delete $self->{http_out}) {
-               $http_out->write(zflush($self));
-               $http_out->close;
-       }
+       my $http_out = http_out($self) // return;
+       $http_out->write(zflush($self));
+       delete($self->{http_out})->close;
 }
 
 sub bail  {
        my $self = shift;
        if (my $env = $self->{env}) {
-               eval { $env->{'psgi.errors'}->print(@_, "\n") };
-               warn("E: error printing to psgi.errors: $@", @_) if $@;
+               warn @_, "\n";
                my $http = $env->{'psgix.io'} or return; # client abort
                eval { $http->close }; # should hit our close
                warn "E: error in http->close: $@" if $@;
@@ -165,23 +182,29 @@ sub bail  {
 # this is public-inbox-httpd-specific
 sub async_blob_cb { # git->cat_async callback
        my ($bref, $oid, $type, $size, $self) = @_;
-       my $http = $self->{env}->{'psgix.io'} or return; # client abort
+       my $http = $self->{env}->{'psgix.io'};
+       $http->{forward} or return; # client aborted
        my $smsg = $self->{smsg} or bail($self, 'BUG: no smsg');
        if (!defined($oid)) {
                # it's possible to have TOCTOU if an admin runs
                # public-inbox-(edit|purge), just move onto the next message
-               return $http->next_step($self->{async_next});
+               warn "E: $smsg->{blob} missing in $self->{ibx}->{inboxdir}\n";
+               return $http->next_step($self->can('async_next'));
        }
        $smsg->{blob} eq $oid or bail($self, "BUG: $smsg->{blob} != $oid");
-       eval { $self->{async_eml}->($self, PublicInbox::Eml->new($bref)) };
+       eval { $self->async_eml(PublicInbox::Eml->new($bref)) };
        bail($self, "E: async_eml: $@") if $@;
-       $http->next_step($self->{async_next});
+       if ($self->{-low_prio}) {
+               push(@{$self->{www}->{-low_prio_q}}, $self) == 1 and
+                               PublicInbox::DS::requeue($self->{www});
+       } else {
+               $http->next_step($self->can('async_next'));
+       }
 }
 
 sub smsg_blob {
        my ($self, $smsg) = @_;
-       git_async_cat($self->{-inbox}->git, $smsg->{blob},
-                       \&async_blob_cb, $self);
+       ibx_async_cat($self->{ibx}, $smsg->{blob}, \&async_blob_cb, $self);
 }
 
 1;