]> Sergey Matveev's repositories - public-inbox.git/blobdiff - lib/PublicInbox/View.pm
use raw header for Message-ID
[public-inbox.git] / lib / PublicInbox / View.pm
index 7cac7851104736b3daaebb953ff0e5f12b667675..867ed6fab2e33508ed7f8380251e45025441d95b 100644 (file)
@@ -1,5 +1,8 @@
-# Copyright (C) 2014, Eric Wong <normalperson@yhbt.net> and all contributors
+# Copyright (C) 2014-2015 all contributors <meta@public-inbox.org>
 # License: AGPLv3 or later (https://www.gnu.org/licenses/agpl-3.0.txt)
+#
+# Used for displaying the HTML web interface.
+# See Documentation/design_www.txt for this.
 package PublicInbox::View;
 use strict;
 use warnings;
@@ -9,15 +12,15 @@ use Encode qw/find_encoding/;
 use Encode::MIME::Header;
 use Email::MIME::ContentType qw/parse_content_type/;
 use PublicInbox::Hval;
-use PublicInbox::MID qw/mid_clean mid_compress mid2path/;
-use Digest::SHA;
+use PublicInbox::Linkify;
+use PublicInbox::MID qw/mid_clean id_compress mid2path mid_mime/;
 require POSIX;
 
 # TODO: make these constants tunable
 use constant MAX_INLINE_QUOTED => 12; # half an 80x24 terminal
 use constant MAX_TRUNC_LEN => 72;
-use constant PRE_WRAP => "<pre\nstyle=\"white-space:pre-wrap\">";
 use constant T_ANCHOR => '#u';
+use constant INDENT => '  ';
 
 *ascii_html = *PublicInbox::Hval::ascii_html;
 
@@ -31,18 +34,73 @@ sub msg_html {
        } else {
                $footer = '';
        }
-       headers_to_html_header($mime, $full_pfx, $ctx) .
+       my $hdr = $mime->header_obj;
+       headers_to_html_header($hdr, $full_pfx, $ctx) .
                multipart_text_as_html($mime, $full_pfx) .
-               '</pre><hr />' . PRE_WRAP .
-               html_footer($mime, 1, $full_pfx, $ctx) .
+               '</pre><hr /><pre>' .
+               html_footer($hdr, 1, $full_pfx, $ctx) .
                $footer .
                '</pre></body></html>';
 }
 
+# /$LISTNAME/$MESSAGE_ID/R/
+sub msg_reply {
+       my ($ctx, $hdr, $footer) = @_;
+       my $s = $hdr->header('Subject');
+       $s = '(no subject)' if (!defined $s) || ($s eq '');
+       my $f = $hdr->header('From');
+       $f = '' unless defined $f;
+       $s = PublicInbox::Hval->new_oneline($s);
+       my $mid = $hdr->header_raw('Message-ID');
+       $mid = PublicInbox::Hval->new_msgid($mid);
+       my $t = $s->as_html;
+       my $se_url =
+        'https://kernel.org/pub/software/scm/git/docs/git-send-email.html';
+
+       my ($arg, $link) = mailto_arg_link($hdr);
+       push @$arg, '/path/to/YOUR_REPLY';
+
+       "<html><head><title>replying to \"$t\"</title></head><body><pre>" .
+       "replying to message:\n\n" .
+       "Subject: <b>$t</b>\n" .
+       "From: ". ascii_html($f) .
+       "\nDate: " .  ascii_html($hdr->header('Date')) .
+       "\nMessage-ID: &lt;" . $mid->as_html . "&gt;\n\n" .
+       "There are multiple ways to reply:\n\n" .
+       "* Save the following mbox file, import it into your mail client,\n" .
+       "  and reply-to-all from there: <a\nhref=../raw>mbox</a>\n\n" .
+       "* Reply to all the recipients using the <b>--to</b>, <b>--cc</b>,\n" .
+       "  and <b>--in-reply-to</b> switches of git-send-email(1):\n\n" .
+       "\tgit send-email \\\n\t\t" .
+       join(" \\ \n\t\t", @$arg ). "\n\n" .
+       qq(  <a\nhref="$se_url">$se_url</a>\n\n) .
+       "* If your mail client supports setting the <b>In-Reply-To</b>" .
+       " header\n  via mailto: links, try the " .
+       qq(<a\nhref="$link">mailto: link</a>\n) .
+       "\nFor context, the original <a\nhref=../>message</a> or " .
+       qq(<a\nhref="../t/#u">thread</a>) .
+       '</pre><hr /><pre>' . $footer .  '</pre></body></html>';
+}
+
 sub feed_entry {
        my ($class, $mime, $full_pfx) = @_;
 
-       PRE_WRAP . multipart_text_as_html($mime, $full_pfx) . '</pre>';
+       # no <head> here for <style>...
+       PublicInbox::Hval::PRE .
+               multipart_text_as_html($mime, $full_pfx) . '</pre>';
+}
+
+sub in_reply_to {
+       my ($hdr) = @_;
+       my $irt = $hdr->header_raw('In-Reply-To');
+
+       return mid_clean($irt) if (defined $irt);
+
+       my $refs = $hdr->header_raw('References');
+       if ($refs && $refs =~ /<([^>]+)>\s*\z/s) {
+               return $1;
+       }
+       undef;
 }
 
 # this is already inside a <pre>
@@ -53,55 +111,40 @@ sub index_entry {
        my $srch = $ctx->{srch};
        my ($prev, $next) = ($midx - 1, $midx + 1);
        my $part_nr = 0;
-       my $enc = enc_for($mime->header("Content-Type"));
-       my $subj = $mime->header('Subject');
-       my $header_obj = $mime->header_obj;
+       my $hdr = $mime->header_obj;
+       my $enc = enc_for($hdr->header("Content-Type"));
+       my $subj = $hdr->header('Subject');
 
-       my $mid_raw = $header_obj->header('Message-ID');
+       my $mid_raw = mid_clean(mid_mime($mime));
        my $id = anchor_for($mid_raw);
        my $seen = $state->{seen};
-       $seen->{$id} = "#$id"; # save the anchor for later
+       $seen->{$id} = "#$id"; # save the anchor for children, later
 
        my $mid = PublicInbox::Hval->new_msgid($mid_raw);
-       my $from = PublicInbox::Hval->new_oneline($mime->header('From'))->raw;
+       my $from = PublicInbox::Hval->new_oneline($hdr->header('From'))->raw;
        my @from = Email::Address->parse($from);
        $from = $from[0]->name;
 
        $from = PublicInbox::Hval->new_oneline($from)->as_html;
        $subj = PublicInbox::Hval->new_oneline($subj)->as_html;
-       my $more = 'permalink';
-       my $root_anchor = $state->{root_anchor};
+       my $root_anchor = $state->{root_anchor} || '';
        my $path = $root_anchor ? '../../' : '';
        my $href = $mid->as_href;
-       my $irt = $header_obj->header('In-Reply-To');
-       my ($anchor_idx, $anchor, $t_anchor);
-       if (defined $irt) {
-               $anchor_idx = anchor_for($irt);
-               $anchor = $seen->{$anchor_idx};
-               $t_anchor = T_ANCHOR;
-       } else {
-               $t_anchor = '';
-       }
+       my $irt = in_reply_to($hdr);
+       my $parent_anchor = $seen->{anchor_for($irt)} if defined $irt;
+
        if ($srch) {
-               $subj = "<a\nhref=\"${path}t/$href/#u\">$subj</a>";
+               my $t = $ctx->{flat} ? 'T' : 't';
+               $subj = "<a\nhref=\"${path}$href/$t/#u\">$subj</a>";
        }
-       if ($root_anchor && $root_anchor eq $id) {
-               $subj = "<u\nid=\"u\">$subj</u>";
-       }
-
-       my $ts = $mime->header('X-PI-TS');
-       unless (defined $ts) {
-               $ts = msg_timestamp($mime);
+       if ($root_anchor eq $id) {
+               $subj = "<u\nid=u>$subj</u>";
        }
-       $ts = POSIX::strftime('%Y-%m-%d %H:%M', gmtime($ts));
 
-       my $rv = "<table\nsummary=l$level><tr>";
-       if ($level) {
-               $rv .= '<td><pre>' . ('  ' x $level) . '</pre></td>';
-       }
-       $rv .= "<td\nid=s$midx>" . PRE_WRAP;
-       $rv .= "<b\nid=\"$id\">$subj</b>\n";
-       $rv .= "- by $from @ $ts UTC - ";
+       my $ts = _msg_date($hdr);
+       my $rv = "<pre\nid=s$midx>";
+       $rv .= "<b\nid=$id>$subj</b>\n";
+       $rv .= "- $from @ $ts UTC - ";
        $rv .= "<a\nhref=\"#s$next\">next</a>";
        if ($prev >= 0) {
                $rv .= "/<a\nhref=\"#s$prev\">prev</a>";
@@ -109,9 +152,13 @@ sub index_entry {
        $fh->write($rv .= "\n\n");
 
        my ($fhref, $more_ref);
-       my $mhref = "${path}m/$href/";
-       if ($level > 0) {
-               $fhref = "${path}f/$href/";
+       my $mhref = "${path}$href/";
+       my $more = 'permalink';
+
+       # show full message if it's our root message
+       my $neq = $root_anchor ne $id;
+       if ($neq || ($neq && $level != 0 && !$ctx->{flat})) {
+               $fhref = "${path}$href/f/";
                $more_ref = \$more;
        }
        # scan through all parts, looking for displayable text
@@ -120,26 +167,30 @@ sub index_entry {
        });
        $mime->body_set('');
 
-       my $txt = "${path}m/$href/raw";
+       my $txt = "${path}$href/raw";
        $rv = "\n<a\nhref=\"$mhref\">$more</a> <a\nhref=\"$txt\">raw</a> ";
-       $rv .= html_footer($mime, 0, undef, $ctx);
+       $rv .= html_footer($hdr, 0, undef, $ctx, $mhref);
 
        if (defined $irt) {
-               unless (defined $anchor) {
-                       my $v = PublicInbox::Hval->new_msgid($irt);
+               unless (defined $parent_anchor) {
+                       my $v = PublicInbox::Hval->new_msgid($irt, 1);
                        $v = $v->as_href;
-                       $anchor = "${path}m/$v/";
-                       $seen->{$anchor_idx} = $anchor;
+                       $parent_anchor = "${path}$v/";
+               }
+               $rv .= " <a\nhref=\"$parent_anchor\">parent</a>";
+       }
+       if (my $pct = $state->{pct}) { # used by SearchView.pm
+               $rv .= " [relevance $pct->{$mid_raw}%]";
+       } elsif ($srch) {
+               if ($ctx->{flat}) {
+                       $rv .= " [<a\nhref=\"${path}$href/t/#u\">threaded</a>" .
+                               "|<b>flat</b>]";
+               } else {
+                       $rv .= " [<b>threaded</b>|" .
+                               "<a\nhref=\"${path}$href/T/#u\">flat</a>]";
                }
-               $rv .= " <a\nhref=\"$anchor\">parent</a>";
-       }
-
-       if ($srch) {
-               $rv .= " <a\nhref=\"${path}t/$href/$t_anchor\">" .
-                      "threadlink</a>";
        }
-
-       $fh->write($rv .= '</pre></td></tr></table>');
+       $fh->write($rv .= '</pre>');
 }
 
 sub thread_html {
@@ -151,56 +202,61 @@ sub thread_html {
 
 sub emit_thread_html {
        my ($cb, $ctx, $foot, $srch) = @_;
-       my $mid = mid_compress($ctx->{mid});
+       my $mid = $ctx->{mid};
        my $res = $srch->get_thread($mid);
        my $msgs = load_results($res);
        my $nr = scalar @$msgs;
-       return missing_thread($cb) if $nr == 0;
-       my $fh = $cb->([200,['Content-Type'=>'text/html; charset=UTF-8']]);
-       my $th = thread_results($msgs);
+       return missing_thread($cb, $ctx) if $nr == 0;
+       my $flat = $ctx->{flat};
+       my $orig_cb = $cb;
+       my $seen = {};
        my $state = {
                ctx => $ctx,
-               seen => {},
+               seen => $seen,
                root_anchor => anchor_for($mid),
                anchor_idx => 0,
+               cur_level => 0,
        };
-       {
-               require PublicInbox::GitCatFile;
-               my $git = PublicInbox::GitCatFile->new($ctx->{git_dir});
-               thread_entry($fh, $git, $state, $_, 0) for $th->rootset;
+
+       require PublicInbox::Git;
+       my $git = $ctx->{git} ||= PublicInbox::Git->new($ctx->{git_dir});
+       if ($flat) {
+               pre_anchor_entry($seen, $_) for (@$msgs);
+               __thread_entry(\$cb, $git, $state, $_, 0) for (@$msgs);
+       } else {
+               my $th = thread_results($msgs);
+               thread_entry(\$cb, $git, $state, $_, 0) for $th->rootset;
+               if (my $max = $state->{cur_level}) {
+                       $cb->write(('</ul></li>' x ($max - 1)) . '</ul>');
+               }
        }
+       $git = undef;
+       Email::Address->purge_cache;
+
+       # there could be a race due to a message being deleted in git
+       # but still being in the Xapian index:
+       return missing_thread($cb, $ctx) if ($orig_cb eq $cb);
+
        my $final_anchor = $state->{anchor_idx};
-       my $next = "<a\nid=\"s$final_anchor\">";
+       my $next = "<a\nid=s$final_anchor>";
        $next .= $final_anchor == 1 ? 'only message in' : 'end of';
-       $next .= " thread</a>, back to <a\nhref=\"../../\">index</a>\n";
-       $next .= "download: <a\nhref=\"mbox.gz\">mbox.gz</a>\n\n";
-       $fh->write("<hr />" . PRE_WRAP . $next . $foot .
-                  "</pre></body></html>");
-       $fh->close;
+       $next .= " thread</a>, back to <a\nhref=\"../../\">index</a>";
+       $next .= "\ndownload thread: ";
+       $next .= "<a\nhref=\"../t.mbox.gz\">mbox.gz</a>";
+       $next .= " / follow: <a\nhref=\"../t.atom\">Atom feed</a>";
+       $cb->write('<hr /><pre>' . $next . "\n\n".
+                       $foot .  '</pre></body></html>');
+       $cb->close;
 }
 
 sub index_walk {
        my ($fh, $part, $enc, $part_nr, $fhref, $more) = @_;
        my $s = add_text_body($enc, $part, $part_nr, $fhref);
 
-       if ($more) {
-               # drop the remainder of git patches, they're usually better
-               # to review when the full message is viewed
-               $s =~ s!^---+\n.*\z!!ms and $$more = 'more...';
-
-               # Drop signatures
-               $s =~ s/^-- \n.*\z//ms and $$more = 'more...';
-       }
+       return if $s eq '';
 
-       # kill any leading or trailing whitespace lines
-       $s =~ s/^\s*$//sgm;
-       $s =~ s/\s+\z//s;
+       $s .= "\n"; # ensure there's a trailing newline
 
-       if ($s ne '') {
-               # kill per-line trailing whitespace
-               $s =~ s/[ \t]+$//sgm;
-               $s .= "\n" unless $s =~ /\n\z/s;
-       }
        $fh->write($s);
 }
 
@@ -227,7 +283,9 @@ sub multipart_text_as_html {
        # scan through all parts, looking for displayable text
        $mime->walk_parts(sub {
                my ($part) = @_;
-               $rv .= add_text_body($enc, $part, \$part_nr, $full_pfx);
+               $part = add_text_body($enc, $part, \$part_nr, $full_pfx, 1);
+               $rv .= $part;
+               $rv .= "\n" if $part ne '';
        });
        $mime->body_set('');
        $rv;
@@ -243,29 +301,24 @@ sub add_filename_line {
        "$pad " . ascii_html($fn) . " $pad\n";
 }
 
-my $LINK_RE = qr!\b((?:ftp|https?|nntp)://
-                [\@:\w\.-]+/
-                ?[\@\w\+\&\?\.\%\;/#=-]*)!x;
-
-sub linkify {
-       # no newlines added here since it'd break the splitting we do
-       # to fold quotes
-       $_[0] =~ s!$LINK_RE!<a\nhref="$1">$1</a>!g;
-}
-
 sub flush_quote {
-       my ($quot, $n, $part_nr, $full_pfx, $final) = @_;
+       my ($quot, $n, $part_nr, $full_pfx, $final, $do_anchor) = @_;
 
+       # n.b.: do not use <blockquote> since it screws up alignment
+       # w.r.t. unquoted text.  Repliers may rely on pre-formatted
+       # alignment to point out a certain word in quoted text.
        if ($full_pfx) {
                if (!$final && scalar(@$quot) <= MAX_INLINE_QUOTED) {
                        # show quote inline
-                       my $rv = join('', map { linkify($_); $_ } @$quot);
+                       my $l = PublicInbox::Linkify->new;
+                       my $rv = join('', map { $l->linkify_1($_) } @$quot);
                        @$quot = ();
-                       return $rv;
+                       $rv = ascii_html($rv);
+                       return $l->linkify_2($rv);
                }
 
                # show a short snippet of quoted text and link to full version:
-               @$quot = map { s/^(?:&gt;\s*)+//gm; $_ } @$quot;
+               @$quot = map { s/^(?:>\s*)+//gm; $_ } @$quot;
                my $cur = join(' ', @$quot);
                @$quot = split(/\s+/, $cur);
                $cur = '';
@@ -280,26 +333,29 @@ sub flush_quote {
                } while (@$quot && length($cur) < MAX_TRUNC_LEN);
                @$quot = ();
                $cur =~ s/ \z/ .../s;
+               $cur = ascii_html($cur);
                my $nr = ++$$n;
                "&gt; [<a\nhref=\"$full_pfx#q${part_nr}_$nr\">$cur</a>]\n";
        } else {
                # show everything in the full version with anchor from
                # short version (see above)
-               my $nr = ++$$n;
-               my $rv = "<a\nid=q${part_nr}_$nr></a>";
-               $rv .= join('', map { linkify($_); $_ } @$quot);
+               my $l = PublicInbox::Linkify->new;
+               my $rv .= join('', map { $l->linkify_1($_) } @$quot);
                @$quot = ();
-               $rv;
+               $rv = ascii_html($rv);
+               return $l->linkify_2($rv) unless $do_anchor;
+               my $nr = ++$$n;
+               "<a\nid=q${part_nr}_$nr></a>" . $l->linkify_2($rv);
        }
 }
 
 sub add_text_body {
-       my ($enc_msg, $part, $part_nr, $full_pfx) = @_;
+       my ($enc_msg, $part, $part_nr, $full_pfx, $do_anchor) = @_;
        return '' if $part->subparts;
 
        my $ct = $part->content_type;
        # account for filter bugs...
-       if (defined $ct && $ct =~ m!\btext/[xh]+tml\b!i) {
+       if (defined $ct && $ct =~ m!\btext/x?html\b!i) {
                $part->body_set('');
                return '';
        }
@@ -309,7 +365,6 @@ sub add_text_body {
        my $s = $part->body;
        $part->body_set('');
        $s = $enc->decode($s);
-       $s = ascii_html($s);
        my @lines = split(/^/m, $s);
        $s = '';
 
@@ -321,37 +376,43 @@ sub add_text_body {
 
        my @quot;
        while (defined(my $cur = shift @lines)) {
-               if ($cur !~ /^&gt;/) {
+               if ($cur !~ /^>/) {
                        # show the previously buffered quote inline
                        if (scalar @quot) {
                                $s .= flush_quote(\@quot, \$n, $$part_nr,
-                                                 $full_pfx, 0);
+                                                 $full_pfx, 0, $do_anchor);
                        }
 
                        # regular line, OK
-                       linkify($cur);
-                       $s .= $cur;
+                       my $l = PublicInbox::Linkify->new;
+                       $cur = $l->linkify_1($cur);
+                       $cur = ascii_html($cur);
+                       $s .= $l->linkify_2($cur);
                } else {
                        push @quot, $cur;
                }
        }
-       $s .= flush_quote(\@quot, \$n, $$part_nr, $full_pfx, 1) if scalar @quot;
-       $s .= "\n" unless $s =~ /\n\z/s;
+       if (scalar @quot) {
+               $s .= flush_quote(\@quot, \$n, $$part_nr, $full_pfx, 1,
+                                 $do_anchor);
+       }
        ++$$part_nr;
+
+       $s =~ s/[ \t]+$//sgm; # kill per-line trailing whitespace
+       $s =~ s/\A\n+//s; # kill leading blank lines
+       $s =~ s/\s+\z//s; # kill all trailing spaces (final "\n" added if ne '')
        $s;
 }
 
 sub headers_to_html_header {
-       my ($mime, $full_pfx, $ctx) = @_;
+       my ($hdr, $full_pfx, $ctx) = @_;
        my $srch = $ctx->{srch} if $ctx;
        my $rv = "";
        my @title;
-       my $header_obj = $mime->header_obj;
-       my $mid = $header_obj->header('Message-ID');
+       my $mid = $hdr->header_raw('Message-ID');
        $mid = PublicInbox::Hval->new_msgid($mid);
-       my $mid_href = $mid->as_href;
        foreach my $h (qw(From To Cc Subject Date)) {
-               my $v = $mime->header($h);
+               my $v = $hdr->header($h);
                defined($v) && ($v ne '') or next;
                $v = PublicInbox::Hval->new_oneline($v);
 
@@ -361,9 +422,8 @@ sub headers_to_html_header {
                } elsif ($h eq 'Subject') {
                        $title[0] = $v->as_html;
                        if ($srch) {
-                               $rv .= "$h: <a\nid=\"t\"\n" .
-                                       "href=\"../../t/$mid_href/\">";
-                               $rv .= $v->as_html . "</a>\n";
+                               $rv .= "$h: <b\nid=t>";
+                               $rv .= $v->as_html . "</b>\n";
                                next;
                        }
                }
@@ -371,69 +431,95 @@ sub headers_to_html_header {
 
        }
        $rv .= 'Message-ID: &lt;' . $mid->as_html . '&gt; ';
-       my $raw_ref = $full_pfx ? 'raw' : "../../m/$mid_href/raw";
-       $rv .= "(<a\nhref=\"$raw_ref\">raw</a>)\n";
+       my $upfx = $full_pfx ? '' : '../';
+       $rv .= "(<a\nhref=\"${upfx}raw\">raw</a>)\n";
+       my $atom;
        if ($srch) {
-               $rv .= "<a\nhref=\"#r\">References: [see below]</a>\n";
+               thread_inline(\$rv, $ctx, $hdr, $upfx);
+
+               $atom = qq{<link\nrel=alternate\ntitle="Atom feed"\n} .
+                       qq!href="${upfx}t.atom"\ntype="application/atom+xml"/>!;
        } else {
-               $rv .= _parent_headers_nosrch($header_obj);
+               $rv .= _parent_headers_nosrch($hdr);
+               $atom = '';
        }
        $rv .= "\n";
 
-       ("<html><head><title>".  join(' - ', @title) .
-        '</title></head><body>' . PRE_WRAP . $rv);
+       ("<html><head><title>".  join(' - ', @title) . "</title>$atom".
+        PublicInbox::Hval::STYLE . "</head><body><pre>" . $rv);
 }
 
 sub thread_inline {
-       my ($dst, $ctx, $cur) = @_;
+       my ($dst, $ctx, $hdr, $upfx) = @_;
        my $srch = $ctx->{srch};
-       my $mid = mid_compress(mid_clean($cur->header('Message-ID')));
+       my $mid = mid_clean($hdr->header_raw('Message-ID'));
        my $res = $srch->get_thread($mid);
        my $nr = $res->{total};
+       my $expand = "<a\nhref=\"${upfx}t/#u\">expand</a> " .
+                       "/ <a\nhref=\"${upfx}t.mbox.gz\">mbox.gz</a>";
 
+       $$dst .= 'Thread: ';
+       my $parent = in_reply_to($hdr);
        if ($nr <= 1) {
-               $$dst .= "\n[no followups, yet]</a>\n";
+               if (defined $parent) {
+                       $$dst .= "($expand)\n ";
+                       $$dst .= ghost_parent("$upfx../", $parent) . "\n";
+               } else {
+                       $$dst .= "[no followups, yet] ($expand)\n";
+               }
+               $ctx->{next_msg} = undef;
+               $ctx->{parent_msg} = $parent;
                return;
        }
 
-       $$dst .= "\n\n~$nr messages in thread: ".
-                "(<a\nhref=\"../../t/$mid/#u\">expand</a>)\n";
-       my $subj = $srch->subject_path($cur->header('Subject'));
+       $$dst .= "~$nr messages ($expand";
+       if ($nr > MAX_INLINE_QUOTED) {
+               $$dst .= qq! / <a\nhref="#b">[scroll down]</a>!;
+       }
+       $$dst .= ")\n";
+
+       my $subj = $srch->subject_path($hdr->header('Subject'));
        my $state = {
                seen => { $subj => 1 },
                srch => $srch,
                cur => $mid,
+               parent_cmp => defined $parent ? $parent : '',
+               parent => $parent,
+               prev_attr => '',
+               prev_level => 0,
        };
        for (thread_results(load_results($res))->rootset) {
-               inline_dump($dst, $state, $_, 0);
+               inline_dump($dst, $state, $upfx, $_, 0);
        }
-       $state->{next_msg};
+       $$dst .= "<a\nid=b></a>"; # anchor for body start
+       $ctx->{next_msg} = $state->{next_msg};
+       $ctx->{parent_msg} = $state->{parent};
 }
 
 sub _parent_headers_nosrch {
-       my ($header_obj) = @_;
+       my ($hdr) = @_;
        my $rv = '';
 
-       my $irt = $header_obj->header('In-Reply-To');
+       my $irt = in_reply_to($hdr);
        if (defined $irt) {
-               my $v = PublicInbox::Hval->new_msgid($irt);
+               my $v = PublicInbox::Hval->new_msgid($irt, 1);
                my $html = $v->as_html;
                my $href = $v->as_href;
                $rv .= "In-Reply-To: &lt;";
                $rv .= "<a\nhref=\"../$href/\">$html</a>&gt;\n";
        }
 
-       my $refs = $header_obj->header('References');
+       my $refs = $hdr->header_raw('References');
        if ($refs) {
                # avoid redundant URLs wasting bandwidth
                my %seen;
-               $seen{mid_clean($irt)} = 1 if defined $irt;
+               $seen{$irt} = 1 if defined $irt;
                my @refs;
                my @raw_refs = ($refs =~ /<([^>]+)>/g);
                foreach my $ref (@raw_refs) {
                        next if $seen{$ref};
                        $seen{$ref} = 1;
-                       push @refs, linkify_ref($ref);
+                       push @refs, linkify_ref_nosrch($ref);
                }
 
                if (@refs) {
@@ -443,13 +529,13 @@ sub _parent_headers_nosrch {
        $rv;
 }
 
-sub html_footer {
-       my ($mime, $standalone, $full_pfx, $ctx) = @_;
+sub mailto_arg_link {
+       my ($hdr) = @_;
        my %cc; # everyone else
        my $to; # this is the From address
 
        foreach my $h (qw(From To Cc)) {
-               my $v = $mime->header($h);
+               my $v = $hdr->header($h);
                defined($v) && ($v ne '') or next;
                my @addrs = Email::Address->parse($v);
                foreach my $recip (@addrs) {
@@ -459,44 +545,69 @@ sub html_footer {
                        $to ||= $dst;
                }
        }
-       Email::Address->purge_cache if $standalone;
+       Email::Address->purge_cache;
+       my @arg;
 
-       my $subj = $mime->header('Subject') || '';
+       my $subj = $hdr->header('Subject') || '';
        $subj = "Re: $subj" unless $subj =~ /\bRe:/i;
-       my $mid = $mime->header('Message-ID');
+       my $mid = $hdr->header_raw('Message-ID');
+       push @arg, "--in-reply-to='" . ascii_html($mid) . "'";
        my $irt = uri_escape_utf8($mid);
        delete $cc{$to};
+       push @arg, '--to=' . ascii_html($to);
        $to = uri_escape_utf8($to);
        $subj = uri_escape_utf8($subj);
-
-       my $cc = uri_escape_utf8(join(',', sort values %cc));
+       my $cc = join(',', sort values %cc);
+       push @arg, '--cc=' . ascii_html($cc);
+       $cc = uri_escape_utf8($cc);
        my $href = "mailto:$to?In-Reply-To=$irt&Cc=${cc}&Subject=$subj";
+       $href =~ s/%20/+/g;
+
+       (\@arg, $href);
+}
+
+sub html_footer {
+       my ($mime, $standalone, $full_pfx, $ctx, $mhref) = @_;
 
        my $srch = $ctx->{srch} if $ctx;
-       my $idx = $standalone ? " <a\nhref=\"../../\">index</a>" : '';
+       my $upfx = $full_pfx ? '../' : '../../';
+       my $tpfx = $full_pfx ? '' : '../';
+       my $idx = $standalone ? " <a\nhref=\"$upfx\">index</a>" : '';
+       my $irt = '';
+
+       if ($srch && $standalone) {
+               $idx .= qq{ / follow: <a\nhref="${tpfx}t.atom">Atom feed</a>\n};
+       }
        if ($idx && $srch) {
-               my $next = thread_inline(\$idx, $ctx, $mime);
-               if (defined $irt) {
-                       $irt = PublicInbox::Hval->new_msgid($irt);
-                       $irt = $irt->as_href;
-                       $irt = "<a\nhref=\"../$irt/\">parent</a> ";
+               my $p = $ctx->{parent_msg};
+               my $next = $ctx->{next_msg};
+               if ($p) {
+                       $p = PublicInbox::Hval->new_oneline($p);
+                       $p = $p->as_href;
+                       $irt = "<a\nhref=\"$upfx$p/\">parent</a> ";
                } else {
                        $irt = ' ' x length('parent ');
                }
                if ($next) {
-                       $irt .= "<a\nhref=\"../$next/\">next</a> ";
+                       $irt .= "<a\nhref=\"$upfx$next/\">next</a> ";
+               } else {
+                       $irt .= ' ' x length('next ');
+               }
+               if ($p || $next) {
+                       $irt .= "<a\nhref=\"${tpfx}t/#u\">thread</a> ";
                } else {
-                       $irt .= '     ';
+                       $irt .= ' ' x length('thread ');
                }
        } else {
                $irt = '';
        }
 
-       "$irt<a\nhref=\"" . ascii_html($href) . '">reply</a>' . $idx;
+       $mhref = './' unless defined $mhref;
+       $irt . qq(<a\nhref="${mhref}R/">reply</a>) . $idx;
 }
 
-sub linkify_ref {
-       my $v = PublicInbox::Hval->new_msgid($_[0]);
+sub linkify_ref_nosrch {
+       my $v = PublicInbox::Hval->new_msgid($_[0], 1);
        my $html = $v->as_html;
        my $href = $v->as_href;
        "&lt;<a\nhref=\"../$href/\">$html</a>&gt;";
@@ -506,35 +617,124 @@ sub anchor_for {
        my ($msgid) = @_;
        my $id = $msgid;
        if ($id !~ /\A[a-f0-9]{40}\z/) {
-               $id = mid_compress(mid_clean($id), 1);
+               $id = id_compress(mid_clean($id), 1);
        }
        'm' . $id;
 }
 
 sub thread_html_head {
-       my ($mime) = @_;
-       my $s = PublicInbox::Hval->new_oneline($mime->header('Subject'));
+       my ($cb, $header, $state) = @_;
+       $$cb = $$cb->([200, ['Content-Type'=> 'text/html; charset=UTF-8']]);
+
+       my $s = PublicInbox::Hval->new_oneline($header->header('Subject'));
        $s = $s->as_html;
-       "<html><head><title>$s</title></head><body>";
+       $$cb->write("<html><head><title>$s</title>".
+               qq{<link\nrel=alternate\ntitle="Atom feed"\n} .
+               qq!href="../t.atom"\ntype="application/atom+xml"/>! .
+               PublicInbox::Hval::STYLE .
+               "</head><body>");
+}
+
+sub pre_anchor_entry {
+       my ($seen, $mime) = @_;
+       my $id = anchor_for(mid_mime($mime));
+       $seen->{$id} = "#$id"; # save the anchor for children, later
+}
+
+sub ghost_parent {
+       my ($upfx, $mid) = @_;
+       # 'subject dummy' is used internally by Mail::Thread
+       return '[no common parent]' if ($mid eq 'subject dummy');
+
+       $mid = PublicInbox::Hval->new_msgid($mid);
+       my $href = $mid->as_href;
+       my $html = $mid->as_html;
+       qq{[parent not found: &lt;<a\nhref="$upfx$href/">$html</a>&gt;]};
+}
+
+sub thread_adj_level {
+       my ($fh, $state, $level) = @_;
+
+       my $max = $state->{cur_level};
+       if ($level <= 0) {
+               return '' if $max == 0; # flat output
+
+               # reset existing lists
+               my $x = $max > 1 ? ('</ul></li>' x ($max - 1)) : '';
+               $fh->write($x . '</ul>');
+               $state->{cur_level} = 0;
+               return '';
+       }
+       if ($level == $max) { # continue existing list
+               $fh->write('<li>');
+       } elsif ($level < $max) {
+               my $x = $max > 1 ? ('</ul></li>' x ($max - $level)) : '';
+               $fh->write($x .= '<li>');
+               $state->{cur_level} = $level;
+       } else { # ($level > $max) # start a new level
+               $state->{cur_level} = $level;
+               $fh->write(($max ? '<li>' : '') . '<ul><li>');
+       }
+       '</li>';
+}
+
+sub ghost_flush {
+       my ($fh, $state, $upfx, $mid, $level) = @_;
+
+       my $end = thread_adj_level($fh, $state, $level);
+       $fh->write('<pre>'. ghost_parent($upfx, $mid) .  '</pre>' . $end);
+}
+
+sub __thread_entry {
+       my ($cb, $git, $state, $mime, $level) = @_;
+
+       # lazy load the full message from mini_mime:
+       $mime = eval {
+               my $path = mid2path(mid_clean(mid_mime($mime)));
+               Email::MIME->new($git->cat_file('HEAD:'.$path));
+       } or return;
+
+       if ($state->{anchor_idx} == 0) {
+               thread_html_head($cb, $mime, $state, $level);
+       }
+       my $fh = $$cb;
+       if (my $ghost = delete $state->{ghost}) {
+               # n.b. ghost messages may only be parents, not children
+               foreach my $g (@$ghost) {
+                       ghost_flush($fh, $state, '../../', @$g);
+               }
+       }
+       my $end = thread_adj_level($fh, $state, $level);
+       index_entry($fh, $mime, $level, $state);
+       $fh->write($end) if $end;
+
+       1;
+}
+
+sub indent_for {
+       my ($level) = @_;
+       INDENT x ($level - 1);
+}
+
+sub __ghost_prepare {
+       my ($state, $node, $level) = @_;
+       my $ghost = $state->{ghost} ||= [];
+       push @$ghost, [ $node->messageid, $level ];
 }
 
 sub thread_entry {
-       my ($fh, $git, $state, $node, $level) = @_;
+       my ($cb, $git, $state, $node, $level) = @_;
        return unless $node;
        if (my $mime = $node->message) {
-
-               # lazy load the full message from mini_mime:
-               my $path = mid2path(mid_clean($mime->header('Message-ID')));
-               $mime = eval { Email::MIME->new($git->cat_file("HEAD:$path")) };
-               if ($mime) {
-                       if ($state->{anchor_idx} == 0) {
-                               $fh->write(thread_html_head($mime));
-                       }
-                       index_entry($fh, $mime, $level, $state);
+               unless (__thread_entry($cb, $git, $state, $mime, $level)) {
+                       __ghost_prepare($state, $node, $level);
                }
+       } else {
+               __ghost_prepare($state, $node, $level);
        }
-       thread_entry($fh, $git, $state, $node->child, $level + 1);
-       thread_entry($fh, $git, $state, $node->next, $level);
+
+       thread_entry($cb, $git, $state, $node->child, $level + 1);
+       thread_entry($cb, $git, $state, $node->next, $level);
 }
 
 sub load_results {
@@ -544,59 +744,73 @@ sub load_results {
 }
 
 sub msg_timestamp {
-       my ($mime) = @_;
-       my $ts = eval { str2time($mime->header('Date')) };
+       my ($hdr) = @_;
+       my $ts = eval { str2time($hdr->header('Date')) };
        defined($ts) ? $ts : 0;
 }
 
 sub thread_results {
-       my ($msgs) = @_;
+       my ($msgs, $nosubject) = @_;
        require PublicInbox::Thread;
        my $th = PublicInbox::Thread->new(@$msgs);
-       $th->thread;
        no warnings 'once';
-       $th->order(*PublicInbox::Thread::sort_ts);
+       $Mail::Thread::nosubject = $nosubject;
+       $th->thread;
+       $th->order(*sort_ts);
        $th
 }
 
 sub missing_thread {
-       my ($cb) = @_;
-       my $title = 'Thread does not exist';
-       $cb->([404, ['Content-Type' => 'text/html']])->write(<<EOF);
-<html><head><title>$title</title></head><body><pre>$title
-<a href="../../">Return to index</a></pre></body></html>
-EOF
+       my ($cb, $ctx) = @_;
+       require PublicInbox::ExtMsg;
+
+       $cb->(PublicInbox::ExtMsg::ext_msg($ctx))
+}
+
+sub _msg_date {
+       my ($hdr) = @_;
+       my $ts = $hdr->header('X-PI-TS') || msg_timestamp($hdr);
+       fmt_ts($ts);
 }
 
+sub fmt_ts { POSIX::strftime('%Y-%m-%d %k:%M', gmtime($_[0])) }
+
 sub _inline_header {
-       my ($dst, $state, $mime, $level) = @_;
-       my $pfx = '  ' x $level;
+       my ($dst, $state, $upfx, $hdr, $level) = @_;
+       my $dot = $level == 0 ? '' : '` ';
 
        my $cur = $state->{cur};
-       my $mid = $mime->header('Message-ID');
-       my $f = $mime->header('X-PI-From');
-       my $d = $mime->header('X-PI-Date');
-       $f = PublicInbox::Hval->new($f);
-       $d = PublicInbox::Hval->new($d);
-       $f = $f->as_html;
-       $d = $d->as_html . ' UTC';
-       my $midc = mid_compress(mid_clean($mid));
+       my $mid = mid_clean($hdr->header_raw('Message-ID'));
+       my $f = $hdr->header('X-PI-From');
+       my $d = _msg_date($hdr);
+       $f = PublicInbox::Hval->new_oneline($f)->as_html;
+       my $pfx = ' ' . $d . ' ' . indent_for($level);
+       my $attr = $f;
+       $state->{first_level} ||= $level;
+
+       if ($attr ne $state->{prev_attr} || $state->{prev_level} > $level) {
+               $state->{prev_attr} = $attr;
+       } else {
+               $attr = '';
+       }
+       $state->{prev_level} = $level;
+
        if ($cur) {
-               if ($cur eq $midc) {
+               if ($cur eq $mid) {
                        delete $state->{cur};
-                       $$dst .= "$pfx` <b><a\nid=\"r\"\nhref=\"#t\">".
-                                "[this message]</a></b> by $f @ $d\n";
+                       $$dst .= "$pfx$dot<b><a\nid=r\nhref=\"#b\">".
+                                "$attr [this message]</a></b>\n";
 
                        return;
                }
        } else {
-               $state->{next_msg} ||= $midc;
+               $state->{next_msg} ||= $mid;
        }
 
        # Subject is never undef, this mail was loaded from
        # our Xapian which would've resulted in '' if it were
        # really missing (and Filter rejects empty subjects)
-       my $s = $mime->header('Subject');
+       my $s = $hdr->header('Subject');
        my $h = $state->{srch}->subject_path($s);
        if ($state->{seen}->{$h}) {
                $s = undef;
@@ -606,24 +820,145 @@ sub _inline_header {
                $s = $s->as_html;
        }
        my $m = PublicInbox::Hval->new_msgid($mid);
-       $m = '../' . $m->as_href . '/';
+       $m = $upfx . '../' . $m->as_href . '/';
        if (defined $s) {
-               $$dst .= "$pfx` <a\nhref=\"$m\">$s</a>\n" .
-                        "$pfx  $f @ $d\n";
+               $$dst .= "$pfx$dot<a\nhref=\"$m\">$s</a> $attr\n";
        } else {
-               $$dst .= "$pfx` <a\nhref=\"$m\">$f @ $d</a>\n";
+               $$dst .= "$pfx$dot<a\nhref=\"$m\">$f</a>\n";
        }
 }
 
 sub inline_dump {
-       my ($dst, $state, $node, $level) = @_;
+       my ($dst, $state, $upfx, $node, $level) = @_;
        return unless $node;
-       return if $state->{stopped};
        if (my $mime = $node->message) {
-               _inline_header($dst, $state, $mime, $level);
+               my $hdr = $mime->header_obj;
+               my $mid = mid_clean($hdr->header_obj('Message-ID'));
+               if ($mid eq $state->{parent_cmp}) {
+                       $state->{parent} = $mid;
+               }
+               _inline_header($dst, $state, $upfx, $hdr, $level);
+       } else {
+               my $dot = $level == 0 ? '' : '` ';
+               my $pfx = (' ' x length(' 1970-01-01 13:37 ')).
+                       indent_for($level) . $dot;
+               $$dst .= $pfx;
+               $$dst .= ghost_parent("$upfx../", $node->messageid) . "\n";
+       }
+       inline_dump($dst, $state, $upfx, $node->child, $level+1);
+       inline_dump($dst, $state, $upfx, $node->next, $level);
+}
+
+sub sort_ts {
+       sort {
+               (eval { $a->topmost->message->header('X-PI-TS') } || 0) <=>
+               (eval { $b->topmost->message->header('X-PI-TS') } || 0)
+       } @_;
+}
+
+sub rsort_ts {
+       sort {
+               (eval { $b->topmost->message->header('X-PI-TS') } || 0) <=>
+               (eval { $a->topmost->message->header('X-PI-TS') } || 0)
+       } @_;
+}
+
+# accumulate recent topics if search is supported
+# returns 1 if done, undef if not
+sub add_topic {
+       my ($state, $node, $level) = @_;
+       return unless $node;
+       my $child_adjust = 1;
+
+       if (my $x = $node->message) {
+               $x = $x->header_obj;
+               my $subj;
+
+               $subj = $x->header('Subject');
+               $subj = $state->{srch}->subject_normalized($subj);
+
+               if (++$state->{subjs}->{$subj} == 1) {
+                       push @{$state->{order}}, [ $level, $subj ];
+               }
+
+               my $mid = mid_clean($x->header_raw('Message-ID'));
+
+               my $ts = $x->header('X-PI-TS');
+               my $exist = $state->{latest}->{$subj};
+               if (!$exist || $exist->[1] < $ts) {
+                       $state->{latest}->{$subj} = [ $mid, $ts ];
+               }
+       } else {
+               # ghost message, do not bump level
+               $child_adjust = 0;
        }
-       inline_dump($dst, $state, $node->child, $level+1);
-       inline_dump($dst, $state, $node->next, $level);
+
+       add_topic($state, $node->child, $level + $child_adjust);
+       add_topic($state, $node->next, $level);
+}
+
+sub dump_topics {
+       my ($state) = @_;
+       my $order = $state->{order};
+       my $subjs = $state->{subjs};
+       my $latest = $state->{latest};
+       return "\n[No topics in range]</pre>" unless (scalar @$order);
+       my $dst = '';
+       my $pfx;
+       my $prev = 0;
+       my $prev_attr = '';
+       while (defined(my $info = shift @$order)) {
+               my ($level, $subj) = @$info;
+               my $n = delete $subjs->{$subj};
+               my ($mid, $ts) = @{delete $latest->{$subj}};
+               $mid = PublicInbox::Hval->new_msgid($mid)->as_href;
+               $subj = PublicInbox::Hval->new($subj)->as_html;
+               $pfx = indent_for($level);
+               my $nl = $level == $prev ? "\n" : '';
+               my $dot = $level == 0 ? '' : '` ';
+               $dst .= "$nl$pfx$dot<a\nhref=\"$mid/t/#u\"><b>$subj</b></a>\n";
+
+               my $attr;
+               $ts = fmt_ts($ts);
+               $attr = " $ts UTC";
+
+               # $n isn't the total number of posts on the topic,
+               # just the number of posts in the current results
+               # window, so leave it unlabeled
+               $n = $n == 1 ? '' : " ($n+ messages)";
+
+               if ($level == 0 || $attr ne $prev_attr) {
+                       my $mbox = qq(<a\nhref="$mid/t.mbox.gz">mbox.gz</a>);
+                       my $atom = qq(<a\nhref="$mid/t.atom">Atom</a>);
+                       $pfx .= INDENT if $level > 0;
+                       $dst .= $pfx . $attr . $n . " - $mbox / $atom\n";
+                       $prev_attr = $attr;
+               }
+       }
+       $dst .= '</pre>';
+}
+
+sub emit_index_topics {
+       my ($state, $fh) = @_;
+       my $off = $state->{ctx}->{cgi}->param('o');
+       $off = 0 unless defined $off;
+       $state->{order} = [];
+       $state->{subjs} = {};
+       $state->{latest} = {};
+       my $max = 25;
+       my %opts = ( offset => int $off, limit => $max * 4 );
+       while (scalar @{$state->{order}} < $max) {
+               my $res = $state->{srch}->query('', \%opts);
+               my $nr = scalar @{$res->{msgs}} or last;
+
+               for (rsort_ts(thread_results(load_results($res), 1)->rootset)) {
+                       add_topic($state, $_, 0);
+               }
+               $opts{offset} += $nr;
+       }
+
+       $fh->write(dump_topics($state));
+       $opts{offset};
 }
 
 1;