]> Sergey Matveev's repositories - public-inbox.git/blobdiff - lib/PublicInbox/View.pm
view: reduce ascii_html calls and {obuf} use
[public-inbox.git] / lib / PublicInbox / View.pm
index 3980ed9177a692863e58926e1f9d78615f1ca304..52d37a9ff690dbb32cc501ef0867137e0bc3b9fb 100644 (file)
@@ -38,9 +38,9 @@ sub msg_page_i {
                                : $ctx->gone('over');
                $ctx->{mhref} = ($ctx->{nr} || $ctx->{smsg}) ?
                                "../${\mid_href($smsg->{mid})}/" : '';
-               if (_msg_page_prepare_obuf($eml, $ctx)) {
-                       multipart_text_as_html($eml, $ctx);
-                       ${$ctx->{obuf}} .= '</pre><hr>';
+               if (_msg_page_prepare($eml, $ctx)) {
+                       $eml->each_part(\&add_text_body, $ctx, 1);
+                       $ctx->zmore('</pre><hr>');
                }
                html_footer($ctx, $ctx->{first_hdr}) if !$ctx->{smsg};
                delete($ctx->{obuf}) // \'';
@@ -56,9 +56,9 @@ sub no_over_html ($) {
        my $eml = PublicInbox::Eml->new($bref);
        $ctx->{mhref} = '';
        PublicInbox::WwwStream::init($ctx);
-       if (_msg_page_prepare_obuf($eml, $ctx)) { # sets {-title_html}
-               multipart_text_as_html($eml, $ctx);
-               ${$ctx->{obuf}} .= '</pre><hr>';
+       if (_msg_page_prepare($eml, $ctx)) { # sets {-title_html}
+               $eml->each_part(\&add_text_body, $ctx, 1);
+               $ctx->zmore('</pre><hr>');
        }
        html_footer($ctx, $eml);
        $ctx->html_done;
@@ -246,11 +246,11 @@ sub eml_entry {
        $ctx->{mhref} = $mhref;
        $ctx->{changed_href} = "#e$id"; # for diffstat "files? changed,"
        $ctx->{obuf} = \$rv;
-       $eml->each_part(\&add_text_body, $ctx, 1);
-       delete $ctx->{obuf};
+       $eml->each_part(\&add_text_body, $ctx, 1); # expensive
+       $ctx->zmore; # TODO: remove once add_text_body is updated
 
        # add the footer
-       $rv .= "\n<a\nhref=#$id_m\nid=e$id>^</a> ".
+       $rv = "\n<a\nhref=#$id_m\nid=e$id>^</a> ".
                "<a\nhref=\"$mhref\">permalink</a>" .
                " <a\nhref=\"${mhref}raw\">raw</a>" .
                " <a\nhref=\"${mhref}#R\">reply</a>";
@@ -302,8 +302,7 @@ sub _th_index_lite {
        my $rv = '';
        my $mapping = $ctx->{mapping} or return $rv;
        my $pad = '  ';
-       my $mid_map = $mapping->{$mid_raw};
-       defined $mid_map or
+       my $mid_map = $mapping->{$mid_raw} //
                return 'public-inbox BUG: '.ascii_html($mid_raw).' not mapped';
        my ($attr, $node, $idx, $level) = @$mid_map;
        my $children = $node->{children};
@@ -335,10 +334,10 @@ sub _th_index_lite {
        }
        my $s_s = nr_to_s($nr_s, 'sibling', 'siblings');
        my $s_c = nr_to_s($nr_c, 'reply', 'replies');
-       $attr =~ s!\n\z!</b>\n!s;
+       chop $attr; # remove "\n"
        $attr =~ s!<a\nhref.*</a> (?:&#34; )?!!s; # no point in dup subject
        $attr =~ s!<a\nhref=[^>]+>([^<]+)</a>!$1!s; # no point linking to self
-       $rv .= "<b>@ $attr";
+       $rv .= "<b>@ $attr</b>\n";
        if ($nr_c) {
                my $cmid = $children->[0] ? $children->[0]->{mid} : undef;
                $rv .= $pad . _skel_hdr($mapping, $cmid);
@@ -388,7 +387,8 @@ sub pre_thread  { # walk_thread callback
 sub thread_eml_entry {
        my ($ctx, $eml) = @_;
        my ($beg, $end) = thread_adj_level($ctx, $ctx->{level});
-       $beg . '<pre>' . eml_entry($ctx, $eml) . '</pre>' . $end;
+       $ctx->zmore($beg.'<pre>');
+       eml_entry($ctx, $eml) . '</pre>' . $end;
 }
 
 sub next_in_queue ($$) {
@@ -505,26 +505,14 @@ sub thread_html_i { # PublicInbox::WwwStream::getline callback
        }
 }
 
-sub multipart_text_as_html {
-       # ($mime, $ctx) = @_; # each_part may do "$_[0] = undef"
-
-       # scan through all parts, looking for displayable text
-       $_[0]->each_part(\&add_text_body, $_[1], 1);
-}
-
 sub submsg_hdr ($$) {
        my ($ctx, $eml) = @_;
-       my $obfs_ibx = $ctx->{-obfs_ibx};
-       my $rv = $ctx->{obuf};
-       $$rv .= "\n";
+       my $s = "\n";
        for my $h (qw(From To Cc Subject Date Message-ID X-Alt-Message-ID)) {
-               my @v = $eml->header($h);
-               for my $v (@v) {
-                       obfuscate_addrs($obfs_ibx, $v) if $obfs_ibx;
-                       $v = ascii_html($v);
-                       $$rv .= "$h: $v\n";
-               }
+               $s .= "$h: $_\n" for $eml->header($h);
        }
+       obfuscate_addrs($ctx->{-obfs_ibx}, $s) if $ctx->{-obfs_ibx};
+       ascii_html($s);
 }
 
 sub attach_link ($$$$;$) {
@@ -535,7 +523,6 @@ sub attach_link ($$$$;$) {
        # downloads for 0-byte multipart attachments
        return unless $part->{bdy};
 
-       my $nl = $idx eq '1' ? '' : "\n"; # like join("\n", ...)
        my $size = length($part->body);
        delete $part->{bdy}; # save memory
 
@@ -551,23 +538,17 @@ sub attach_link ($$$$;$) {
        } else {
                $sfn = 'a.bin';
        }
-       my $rv = $ctx->{obuf};
-       $$rv .= qq($nl<a\nhref="$ctx->{mhref}$idx-$sfn">);
-       if ($err) {
-               $$rv .= <<EOF;
+       my $rv = $idx eq '1' ? '' : "\n"; # like join("\n", ...)
+       $rv .= qq(<a\nhref="$ctx->{mhref}$idx-$sfn">);
+       $rv .= <<EOF if $err;
 [-- Warning: decoded text below may be mangled, UTF-8 assumed --]
 EOF
-       }
-       $$rv .= "[-- Attachment #$idx: ";
-       my $ts = "Type: $ct, Size: $size bytes";
+       $rv .= "[-- Attachment #$idx: ";
        my $desc = $part->header('Content-Description') // $fn // '';
-       $desc = ascii_html($desc);
-       $$rv .= ($desc eq '') ? "$ts --]" : "$desc --]\n[-- $ts --]";
-       $$rv .= "</a>\n";
-
-       submsg_hdr($ctx, $part) if $part->{is_submsg};
-
-       undef;
+       $rv .= ascii_html($desc)." --]\n[-- " if $desc ne '';
+       $rv .= "Type: $ct, Size: $size bytes --]</a>\n";
+       $rv .= submsg_hdr($ctx, $part) if $part->{is_submsg};
+       $rv;
 }
 
 sub add_text_body { # callback for each_part
@@ -579,12 +560,11 @@ sub add_text_body { # callback for each_part
        my ($part, $depth, $idx) = @$p;
        my $ct = $part->content_type || 'text/plain';
        my $fn = $part->filename;
-       my ($s, $err) = msg_part_text($part, $ct);
-       return attach_link($ctx, $ct, $p, $fn) unless defined $s;
-
        my $rv = $ctx->{obuf};
+       my ($s, $err) = msg_part_text($part, $ct);
+       $s // return $$rv .= (attach_link($ctx, $ct, $p, $fn) // '');
        if ($part->{is_submsg}) {
-               submsg_hdr($ctx, $part);
+               $$rv .= submsg_hdr($ctx, $part);
                $$rv .= "\n";
        }
 
@@ -634,7 +614,7 @@ sub add_text_body { # callback for each_part
        undef $s; # free memory
        if (defined($fn) || ($depth > 0 && !$part->{is_submsg}) || $err) {
                # badly-encoded message with $err? tell the world about it!
-               attach_link($ctx, $ct, $p, $fn, $err);
+               $$rv .= attach_link($ctx, $ct, $p, $fn, $err);
                $$rv .= "\n";
        }
        delete $part->{bdy}; # save memory
@@ -655,11 +635,9 @@ sub add_text_body { # callback for each_part
        }
 }
 
-sub _msg_page_prepare_obuf {
+sub _msg_page_prepare {
        my ($eml, $ctx) = @_;
        my $have_over = !!$ctx->{ibx}->over;
-       my $obfs_ibx = $ctx->{-obfs_ibx};
-       $ctx->{obuf} = \(my $rv = '');
        my $mids = mids_for_index($eml);
        my $nr = $ctx->{nr}++;
        if ($nr) { # unlikely
@@ -667,80 +645,86 @@ sub _msg_page_prepare_obuf {
                        warn "W: BUG? @$mids not deduplicated properly\n";
                        return;
                }
-               $rv .=
+               $ctx->{-html_tip} =
 "<pre>WARNING: multiple messages have this Message-ID\n</pre><pre>";
        } else {
                $ctx->{first_hdr} = $eml->header_obj;
                $ctx->{chash} = content_hash($eml) if $ctx->{smsg}; # reused MID
-               $rv .= "<pre\nid=b>"; # anchor for body start
+               $ctx->{-html_tip} = "<pre\nid=b>"; # anchor for body start
        }
        $ctx->{-upfx} = '../';
        my @title; # (Subject[0], From[0])
+       my $hbuf = '';
        for my $v ($eml->header('From')) {
                my @n = PublicInbox::Address::names($v);
-               $v = ascii_html($v);
-               $title[1] //= ascii_html(join(', ', @n));
-               if ($obfs_ibx) {
-                       obfuscate_addrs($obfs_ibx, $v);
-                       obfuscate_addrs($obfs_ibx, $title[1]);
-               }
-               $rv .= "From: $v\n" if $v ne '';
+               $title[1] //= join(', ', @n);
+               $hbuf .= "From: $v\n" if $v ne '';
        }
-       foreach my $h (qw(To Cc)) {
+       for my $h (qw(To Cc)) {
                for my $v ($eml->header($h)) {
                        fold_addresses($v);
-                       $v = ascii_html($v);
-                       obfuscate_addrs($obfs_ibx, $v) if $obfs_ibx;
-                       $rv .= "$h: $v\n" if $v ne '';
+                       $hbuf .= "$h: $v\n" if $v ne '';
                }
        }
        my @subj = $eml->header('Subject');
-       if (@subj) {
-               my $v = ascii_html(shift @subj);
-               obfuscate_addrs($obfs_ibx, $v) if $obfs_ibx;
-               $rv .= 'Subject: ';
-               $rv .= $have_over ? qq(<a\nhref="#r"\nid=t>$v</a>\n) : "$v\n";
-               $title[0] = $v;
-               for $v (@subj) { # multi-Subject message :<
-                       $v = ascii_html($v);
-                       obfuscate_addrs($obfs_ibx, $v) if $obfs_ibx;
-                       $rv .= "Subject: $v\n";
-               }
-       } else { # dummy anchor for thread skeleton at bottom of page
-               $rv .= qq(<a\nhref="#r"\nid=t></a>) if $have_over;
-               $title[0] = '(no subject)';
-       }
-       for my $v ($eml->header('Date')) {
-               $v = ascii_html($v);
-               obfuscate_addrs($obfs_ibx, $v) if $obfs_ibx; # possible :P
-               $rv .= qq{Date: $v\n};
+       $hbuf .= "Subject: $_\n" for @subj;
+       $title[0] = $subj[0] // '(no subject)';
+       $hbuf .= "Date: $_\n" for $eml->header('Date');
+       $hbuf = ascii_html($hbuf);
+       $ctx->{-title_html} = ascii_html(join(' - ', @title));
+       if (my $obfs_ibx = $ctx->{-obfs_ibx}) {
+               obfuscate_addrs($obfs_ibx, $hbuf);
+               obfuscate_addrs($obfs_ibx, $ctx->{-title_html});
        }
+
        # [thread overview] link is typically added after Date,
        # but added after Subject, or even nothing.
        if ($have_over) {
-               chop $rv; # drop "\n", or noop if $rv eq ''
-               $rv .= qq{\t<a\nhref="#r">[thread overview]</a>\n};
+               chop $hbuf; # drop "\n", or noop if $rv eq ''
+               $hbuf .= qq{\t<a\nhref="#r">[thread overview]</a>\n};
+               $hbuf =~ s!^Subject:\x20(.*?)(\n[A-Z]|\z)
+                               !Subject: <a\nhref="#r"\nid=t>$1</a>$2!msx or
+                       $hbuf .= qq(<a\nhref="#r\nid=t></a>);
+       }
+       if (scalar(@$mids) == 1) { # common case
+               my $x = ascii_html($mids->[0]);
+               $hbuf .= qq[Message-ID: &lt;$x&gt; (<a href="raw">raw</a>)\n];
        }
        if (!$nr) { # first (and only) message, common case
-               $ctx->{-title_html} = join(' - ', @title);
-               $rv = $ctx->html_top . $rv;
+               $ctx->zmore($ctx->html_top, $hbuf);
+       } else {
+               delete $ctx->{-title_html};
+               $ctx->zmore($ctx->{-html_tip}, $hbuf);
        }
-
        $ctx->{-linkify} //= PublicInbox::Linkify->new;
-       if (scalar(@$mids) == 1) { # common case
-               my $mhtml = ascii_html($mids->[0]);
-               $rv .= qq[Message-ID: &lt;$mhtml&gt; (<a href="raw">raw</a>)\n];
-       } else {
+       $hbuf = '';
+       if (scalar(@$mids) != 1) { # unlikely, but it happens :<
                # X-Alt-Message-ID can happen if a message is injected from
                # public-inbox-nntpd because of multiple Message-ID headers.
-               my $s = '';
                for my $h (qw(Message-ID X-Alt-Message-ID)) {
-                       $s .= "$h: $_\n" for ($eml->header_raw($h));
+                       $hbuf .= "$h: $_\n" for ($eml->header_raw($h));
                }
-               $ctx->{-linkify}->linkify_mids('..', \$s, 1);
-               $rv .= $s;
+               $ctx->{-linkify}->linkify_mids('..', \$hbuf, 1); # escapes HTML
+               $ctx->zmore($hbuf);
+               $hbuf = '';
+       }
+       my @irt = $eml->header_raw('In-Reply-To');
+       my $refs;
+       if (!@irt) {
+               $refs = references($eml);
+               $irt[0] = pop(@$refs) if scalar @$refs;
+       }
+       $hbuf .= "In-Reply-To: $_\n" for @irt;
+
+       # do not display References: if search is present,
+       # we show the thread skeleton at the bottom, instead.
+       if (!$have_over) {
+               $refs //= references($eml);
+               $hbuf .= 'References: <'.join(">\n\t<", @$refs).">\n" if @$refs;
        }
-       $rv .= _parent_headers($ctx, $eml);
+       $ctx->{-linkify}->linkify_mids('..', \$hbuf); # escapes HTML
+       $ctx->zmore($hbuf .= "\n");
+       ${$ctx->{obuf}} = ''; # TODO remove
        1;
 }
 
@@ -790,27 +774,6 @@ sub thread_skel ($$$) {
        $ctx->{parent_msg} = $parent;
 }
 
-sub _parent_headers {
-       my ($ctx, $hdr) = @_;
-       my @irt = $hdr->header_raw('In-Reply-To');
-       my $refs;
-       my $s = '';
-       if (!@irt) {
-               $refs = references($hdr);
-               $irt[0] = pop(@$refs) if scalar @$refs;
-       }
-       $s .= "In-Reply-To: $_\n" for @irt;
-
-       # do not display References: if search is present,
-       # we show the thread skeleton at the bottom, instead.
-       if (!$ctx->{ibx}->over) {
-               $refs //= references($hdr);
-               $s .= 'References: <'.join(">\n\t<", @$refs).">\n" if @$refs;
-       }
-       $ctx->{-linkify}->linkify_mids('..', \$s); # escapes HTML
-       $s .= "\n";
-}
-
 # appends to obuf
 sub html_footer {
        my ($ctx, $hdr) = @_;