]> Sergey Matveev's repositories - public-inbox.git/blobdiff - lib/PublicInbox/ManifestJsGz.pm
No ext_urls
[public-inbox.git] / lib / PublicInbox / ManifestJsGz.pm
index 3b436827b1554599be348f793e0b91a3ac45137a..1f739baaa3817dbe73c9f81d829765318e2de407 100644 (file)
@@ -1,27 +1,33 @@
-# Copyright (C) 2020 all contributors <meta@public-inbox.org>
+# Copyright (C) all contributors <meta@public-inbox.org>
 # License: AGPL-3.0+ <https://www.gnu.org/licenses/agpl-3.0.txt>
 
-# generates manifest.js.gz for grokmirror(1)
+# generates manifest.js.gz for grokmirror(1) via PublicInbox::WWW
+# This doesn't parse manifest.js.gz (that happens in LeiMirror)
 package PublicInbox::ManifestJsGz;
-use strict;
-use v5.10.1;
+use v5.12;
 use parent qw(PublicInbox::WwwListing);
-use bytes (); # length
 use PublicInbox::Config;
 use IO::Compress::Gzip qw(gzip);
 use HTTP::Date qw(time2str);
 
-our $json = PublicInbox::Config::json();
+my $json = PublicInbox::Config::json();
 
-# called by WwwListing
-sub url_regexp {
+sub url_filter {
        my ($ctx) = @_;
        # grokmirror uses relative paths, so it's domain-dependent
-       # SUPER calls PublicInbox::WwwListing::url_regexp
-       $ctx->SUPER::url_regexp('publicInbox.grokManifest', 'match=domain');
+       # SUPER calls PublicInbox::WwwListing::url_filter
+       $ctx->SUPER::url_filter('publicInbox.grokManifest', 'match=domain');
 }
 
-sub manifest_add ($$;$$) {
+sub inject_entry ($$$;$) {
+       my ($ctx, $url_path, $ent, $git_dir) = @_;
+       $ctx->{-abs2urlpath}->{$git_dir // delete $ent->{git_dir}} = $url_path;
+       my $modified = $ent->{modified};
+       $ctx->{-mtime} = $modified if $modified > ($ctx->{-mtime} // 0);
+       $ctx->{manifest}->{$url_path} = $ent;
+}
+
+sub manifest_add ($$;$$) { # slow path w/o extindex "all" (or per-inbox)
        my ($ctx, $ibx, $epoch, $default_desc) = @_;
        my $url_path = "/$ibx->{name}";
        my $git;
@@ -32,15 +38,10 @@ sub manifest_add ($$;$$) {
                $git = $ibx->git;
        }
        my $ent = $git->manifest_entry($epoch, $default_desc) or return;
-       $ctx->{-abs2urlpath}->{$git->{git_dir}} = $url_path;
-       my $modified = $ent->{modified};
-       if ($modified > ($ctx->{-mtime} // 0)) {
-               $ctx->{-mtime} = $modified;
-       }
-       $ctx->{manifest}->{$url_path} = $ent;
+       inject_entry($ctx, $url_path, $ent, $git->{git_dir});
 }
 
-sub ibx_entry {
+sub slow_manifest_add ($$) {
        my ($ctx, $ibx) = @_;
        eval {
                if (defined(my $max = $ibx->max_git_epoch)) {
@@ -55,9 +56,46 @@ sub ibx_entry {
        warn "E: $@" if $@;
 }
 
-sub hide_key { 'manifest' }
+sub eidx_manifest_add ($$$) {
+       my ($ctx, $ALL, $ibx) = @_;
+       if (my $data = $ALL->misc->inbox_data($ibx)) {
+               $data = $json->decode($data);
+               delete $data->{''}; # private
+               while (my ($url_path, $ent) = each %$data) {
+                       inject_entry($ctx, $url_path, $ent);
+               }
+       } else {
+               warn "E: `${\$ibx->eidx_key}' not indexed by $ALL->{topdir}\n";
+               # do not use slow path for global manifest since
+               # it can become catastrophically slow.  per-inbox manifest
+               # is not too bad with dozens of epochs, so never fail that:
+               slow_manifest_add($ctx, $ibx) if $ibx == $ctx->{ibx};
+       }
+}
+
+sub response {
+       my ($class, $ctx) = @_;
+       bless $ctx, $class;
+       my ($re, undef) = $ctx->url_filter;
+       $re // return psgi_triple($ctx);
+       my $iter = PublicInbox::ConfigIter->new($ctx->{www}->{pi_cfg},
+                                       $ctx->can('list_match_i'), $re, $ctx);
+       sub {
+               $ctx->{-wcb} = $_[0]; # HTTP server callback
+               $ctx->{env}->{'pi-httpd.async'} ?
+                               $iter->event_step : $iter->each_section;
+       }
+}
+
+sub ibx_entry {
+       my ($ctx, $ibx) = @_;
+       my $ALL = $ctx->{www}->{pi_cfg}->ALL;
+       $ALL ? eidx_manifest_add($ctx, $ALL, $ibx) :
+               slow_manifest_add($ctx, $ibx);
+}
+
+sub hide_key { 'manifest' } # for WwwListing->list_match_i
 
-# overrides WwwListing->psgi_triple
 sub psgi_triple {
        my ($ctx) = @_;
        my $abs2urlpath = delete($ctx->{-abs2urlpath}) // {};
@@ -70,7 +108,13 @@ sub psgi_triple {
        gzip(\$manifest => \(my $out));
        [ 200, [ qw(Content-Type application/gzip),
                 'Last-Modified', time2str($ctx->{-mtime}),
-                'Content-Length', bytes::length($out) ], [ $out ] ]
+                'Content-Length', length($out) ], [ $out ] ]
+}
+
+sub per_inbox {
+       my ($ctx) = @_;
+       ibx_entry($ctx, $ctx->{ibx});
+       psgi_triple($ctx);
 }
 
 1;