]> Sergey Matveev's repositories - public-inbox.git/blobdiff - lib/PublicInbox/ExtMsg.pm
extmsg: rework partial MID matching to favor current inbox
[public-inbox.git] / lib / PublicInbox / ExtMsg.pm
index 4925a592430ef608b44e8c91568d02084ca2379e..e0aabfb1ab4cca2ed61ab40c167be4a2d35b1f06 100644 (file)
@@ -1,5 +1,5 @@
-# Copyright (C) 2015 all contributors <meta@public-inbox.org>
-# License: AGPLv3 or later (https://www.gnu.org/licenses/agpl-3.0.txt)
+# Copyright (C) 2015-2018 all contributors <meta@public-inbox.org>
+# License: AGPL-3.0+ <https://www.gnu.org/licenses/agpl-3.0.txt>
 #
 # Used by the web interface to link to messages outside of the our
 # public-inboxes.  Mail threads may cross projects/threads; so
@@ -14,25 +14,28 @@ use PublicInbox::WwwStream;
 
 # TODO: user-configurable
 our @EXT_URL = (
-       'http://mid.gmane.org/%s',
-       'https://lists.debian.org/msgid-search/%s',
        # leading "//" denotes protocol-relative (http:// or https://)
-       '//mid.mail-archive.com/%s',
        '//marc.info/?i=%s',
+       '//www.mail-archive.com/search?l=mid&q=%s',
+       'http://mid.gmane.org/%s',
+       'https://lists.debian.org/msgid-search/%s',
+       '//docs.FreeBSD.org/cgi/mid.cgi?db=mid&id=%s',
+       'https://www.w3.org/mid/%s',
+       'http://www.postgresql.org/message-id/%s',
+       'https://lists.debconf.org/cgi-lurker/keyword.cgi?'.
+               'doc-url=/lurker&format=en.html&query=id:%s'
 );
 
 sub ext_msg {
        my ($ctx) = @_;
-       my $pi_config = $ctx->{pi_config};
        my $cur = $ctx->{-inbox};
        my $mid = $ctx->{mid};
-       my $env = $ctx->{env};
 
        eval { require PublicInbox::Search };
        my $have_xap = $@ ? 0 : 1;
        my (@nox, @ibx, @found);
 
-       $pi_config->each_inbox(sub {
+       $ctx->{www}->{pi_config}->each_inbox(sub {
                my ($other) = @_;
                return if $other->{name} eq $cur->{name} || !$other->base_url;
 
@@ -81,17 +84,33 @@ sub ext_msg {
        my $n_partial = 0;
        my @partial;
 
-       eval { require PublicInbox::Msgmap };
-       my $have_mm = $@ ? 0 : 1;
-       if ($have_mm) {
+       if (my $mm = $cur->mm) {
+               my $tmp_mid = $mid;
+               my $res = $mm->mid_prefixes($tmp_mid, 100);
+               if ($res && scalar(@$res)) {
+                       $n_partial += scalar(@$res);
+                       push @partial, [ $cur, $res ];
+               # fixup common errors:
+               } elsif ($tmp_mid =~ s,/[tTf],,) {
+                       $res = $mm->mid_prefixes($tmp_mid, 100);
+                       if ($res && scalar(@$res)) {
+                               $n_partial += scalar(@$res);
+                               push @partial, [ $cur, $res ];
+                       }
+               }
+       }
+
+       # can't find a partial match in current inbox, try the others:
+       if (!$n_partial && length($mid) >= 16) {
                my $tmp_mid = $mid;
 again:
-               unshift @ibx, $cur;
                foreach my $ibx (@ibx) {
                        my $mm = $ibx->mm or next;
-                       if (my $res = $mm->mid_prefixes($tmp_mid)) {
+                       my $res = $mm->mid_prefixes($tmp_mid, 100);
+                       if ($res && scalar(@$res)) {
                                $n_partial += scalar(@$res);
                                push @partial, [ $ibx, $res ];
+                               last if $n_partial >= 100;
                        }
                }
                # fixup common errors:
@@ -102,42 +121,36 @@ again:
 
        my $code = 404;
        my $h = PublicInbox::Hval->new_msgid($mid);
-       my $href = $h->as_href;
+       my $href = $h->{href};
        my $html = $h->as_html;
-       my $title = "Message-ID &lt;$html&gt; not found";
-       my $s = "<html><head><title>$title</title>" .
-               "</head><body><pre><b>$title</b>\n";
-
+       my $title = "&lt;$html&gt; not found";
+       my $s = "<pre>Message-ID &lt;$html&gt;\nnot found\n";
        if ($n_partial) {
                $code = 300;
                my $es = $n_partial == 1 ? '' : 'es';
-               $s.= "\n$n_partial partial match$es found:\n\n";
+               $s .= "\n$n_partial partial match$es found:\n\n";
+               my $cur_name = $cur->{name};
                foreach my $pair (@partial) {
                        my ($ibx, $res) = @$pair;
-                       my $u = $ibx->base_url or next;
+                       my $env = $ctx->{env} if $ibx->{name} eq $cur_name;
+                       my $u = $ibx->base_url($env) or next;
                        foreach my $m (@$res) {
                                my $p = PublicInbox::Hval->new_msgid($m);
-                               my $r = $p->as_href;
+                               my $r = $p->{href};
                                my $t = $p->as_html;
                                $s .= qq{<a\nhref="$u$r/">$u$t/</a>\n};
                        }
                }
        }
-
-       # Fall back to external repos if configured
-       if (@EXT_URL && index($mid, '@') >= 0) {
+       my $ext = ext_urls($ctx, $mid, $href, $html);
+       if ($ext ne '') {
+               $s .= $ext;
                $code = 300;
-               $s .= "\nPerhaps try an external site:\n\n";
-               foreach my $url (@EXT_URL) {
-                       my $u = PublicInbox::Hval::prurl($env, $url);
-                       my $r = sprintf($u, $href);
-                       my $t = sprintf($u, $html);
-                       $s .= qq{<a\nhref="$r">$t</a>\n};
-               }
        }
-       $s .= '</pre></body></html>';
-
-       [$code, ['Content-Type'=>'text/html; charset=UTF-8'], [$s]];
+       $ctx->{-html_tip} = $s .= '</pre>';
+       $ctx->{-title_html} = $title;
+       $ctx->{-upfx} = '../';
+       PublicInbox::WwwStream->response($ctx, $code);
 }
 
 sub ext_urls {
@@ -161,7 +174,7 @@ sub ext_urls {
 sub exact {
        my ($ctx, $found, $mid) = @_;
        my $h = PublicInbox::Hval->new_msgid($mid);
-       my $href = $h->as_href;
+       my $href = $h->{href};
        my $html = $h->as_html;
        my $title = "&lt;$html&gt; found in ";
        my $end = @$found == 1 ? 'another inbox' : 'other inboxes';