]> Sergey Matveev's repositories - public-inbox.git/blobdiff - lib/PublicInbox/NewsWWW.pm
update copyrights for 2021
[public-inbox.git] / lib / PublicInbox / NewsWWW.pm
index 19eb596cea2a1563489ae2d6107a8e3643248cec..d7dd637ff8b681e37f0a483148cd860c08bd477c 100644 (file)
@@ -1,4 +1,4 @@
-# Copyright (C) 2016 all contributors <meta@public-inbox.org>
+# Copyright (C) 2016-2021 all contributors <meta@public-inbox.org>
 # License: AGPL-3.0+ <https://www.gnu.org/licenses/agpl-3.0.txt>
 #
 # Plack app redirector for mapping /$NEWSGROUP requests to
@@ -9,72 +9,91 @@ package PublicInbox::NewsWWW;
 use strict;
 use warnings;
 use PublicInbox::Config;
-use URI::Escape qw(uri_escape_utf8);
+use PublicInbox::MID qw(mid_escape);
+use PublicInbox::Hval qw(prurl);
 
 sub new {
-       my ($class, $pi_config) = @_;
-       $pi_config ||= PublicInbox::Config->new;
-       bless { pi_config => $pi_config }, $class;
+       my ($class, $pi_cfg) = @_;
+       bless { pi_cfg => $pi_cfg // PublicInbox::Config->new }, $class;
+}
+
+sub redirect ($$) {
+       my ($code, $url) = @_;
+       [ $code,
+         [ Location => $url, 'Content-Type' => 'text/plain' ],
+         [ "Redirecting to $url\n" ] ]
+}
+
+sub try_inbox {
+       my ($ibx, $arg) = @_;
+       return if scalar(@$arg) > 1;
+
+       # do not pass $env since HTTP_HOST may differ
+       my $url = $ibx->base_url or return;
+
+       my ($mid) = @$arg;
+       eval { $ibx->mm->num_for($mid) } or return;
+
+       # 302 since the same message may show up on
+       # multiple inboxes and inboxes can be added/reordered
+       $arg->[1] = redirect(302, $url .= mid_escape($mid) . '/');
 }
 
 sub call {
        my ($self, $env) = @_;
-       my $ng_map = $self->newsgroup_map;
-       my $path = $env->{PATH_INFO};
-       $path =~ s!\A/+!!;
-       $path =~ s!/+\z!!;
 
        # some links may have the article number in them:
        # /inbox.foo.bar/123456
-       my ($ng, $article) = split(m!/+!, $path, 2);
-       if (my $info = $ng_map->{$ng}) {
-               my $url = PublicInbox::Hval::prurl($env, $info->{url});
+       my (undef, @parts) = split(m!/!, $env->{PATH_INFO});
+       my ($ng, $article) = @parts;
+       my $pi_cfg = $self->{pi_cfg};
+       if (my $ibx = $pi_cfg->lookup_newsgroup($ng)) {
+               my $url = prurl($env, $ibx->{url});
                my $code = 301;
-               my $h = [ Location => $url, 'Content-Type' => 'text/plain' ];
-               if (defined $article && $article =~ /\A\d+\z/) {
-                       my $mid = eval { ng_mid_for($ng, $info, $article) };
+               if (defined $article && $article =~ /\A[0-9]+\z/) {
+                       my $mid = eval { $ibx->mm->mid_for($article) };
                        if (defined $mid) {
                                # article IDs are not stable across clones,
                                # do not encourage caching/bookmarking them
                                $code = 302;
-                               $url .= uri_escape_utf8($mid) . '/';
+                               $url .= mid_escape($mid) . '/';
                        }
                }
-
-               return [ $code, $h, [ "Redirecting to $url\n" ] ]
+               return redirect($code, $url);
        }
-       [ 404, [ 'Content-Type' => 'text/plain' ], [] ];
-}
-
-sub ng_mid_for {
-       my ($ng, $info, $article) = @_;
-       # may fail due to lack of Danga::Socket
-       # for defer_weaken:
-       require PublicInbox::NewsGroup;
-       $ng = $info->{ng} ||=
-               PublicInbox::NewsGroup->new($ng, $info->{git_dir}, '');
-       $ng->mm->mid_for($article);
-}
 
-sub newsgroup_map {
-       my ($self) = @_;
-       my $rv;
-       $rv = $self->{ng_map} and return $rv;
-       my $pi_config = $self->{pi_config};
-       my %ng_map;
-       foreach my $k (keys %$pi_config) {
-               $k =~ /\Apublicinbox\.([^\.]+)\.mainrepo\z/ or next;
-               my $inbox = $1;
-               my $git_dir = $pi_config->{"publicinbox.$inbox.mainrepo"};
-               my $url = $pi_config->{"publicinbox.$inbox.url"};
-               defined $url or next;
-               my $ng = $pi_config->{"publicinbox.$inbox.newsgroup"};
-               next if (!defined $ng) || ($ng eq ''); # disabled
+       my @try = (join('/', @parts));
 
-               $url =~ m!/\z! or $url .= '/';
-               $ng_map{$ng} = { url => $url, git_dir => $git_dir };
+       # trailing slash is in the rest of our WWW, so maybe some users
+       # will assume it:
+       if ($parts[-1] eq '') {
+               pop @parts;
+               push @try, join('/', @parts);
+       }
+       my $ALL = $pi_cfg->ALL;
+       if (my $over = $ALL ? $ALL->over : undef) {
+               my $by_eidx_key = $pi_cfg->{-by_eidx_key};
+               for my $mid (@try) {
+                       my ($id, $prev);
+                       while (my $x = $over->next_by_mid($mid, \$id, \$prev)) {
+                               my $xr3 = $over->get_xref3($x->{num});
+                               for (@$xr3) {
+                                       s/:[0-9]+:$x->{blob}\z// or next;
+                                       my $ibx = $by_eidx_key->{$_} // next;
+                                       my $url = $ibx->base_url or next;
+                                       $url .= mid_escape($mid) . '/';
+                                       return redirect(302, $url);
+                               }
+                       }
+               }
+       } else { # slow path, scan every inbox
+               for my $mid (@try) {
+                       my $arg = [ $mid ]; # [1] => result
+                       $pi_cfg->each_inbox(\&try_inbox, $arg);
+                       return $arg->[1] if $arg->[1];
+               }
        }
-       $self->{ng_map} = \%ng_map;
+       [ 404, [qw(Content-Type text/plain)], ["404 Not Found\n"] ];
 }
 
 1;