]> Sergey Matveev's repositories - public-inbox.git/blobdiff - lib/PublicInbox/View.pm
view: implement optional address obfuscation
[public-inbox.git] / lib / PublicInbox / View.pm
index e4e9d7d2e30860fb168c0635329a71f41a61ad60..687a0acb9367737410d5ff4aae641513fd49b629 100644 (file)
@@ -6,14 +6,14 @@
 package PublicInbox::View;
 use strict;
 use warnings;
-use URI::Escape qw/uri_escape_utf8/;
 use Date::Parse qw/str2time/;
-use PublicInbox::Hval qw/ascii_html/;
+use PublicInbox::Hval qw/ascii_html obfuscate_addrs/;
 use PublicInbox::Linkify;
 use PublicInbox::MID qw/mid_clean id_compress mid_mime mid_escape/;
 use PublicInbox::MsgIter;
 use PublicInbox::Address;
 use PublicInbox::WwwStream;
+use PublicInbox::Reply;
 require POSIX;
 
 use constant INDENT => '  ';
@@ -24,11 +24,13 @@ sub th_pfx ($) { $_[0] == 0 ? '' : TCHILD };
 sub msg_html {
        my ($ctx, $mime) = @_;
        my $hdr = $mime->header_obj;
-       my $tip = _msg_html_prepare($hdr, $ctx);
+       my $obfs = $ctx->{-inbox}->{obfuscate};
+       my $tip = _msg_html_prepare($hdr, $ctx, $obfs);
        PublicInbox::WwwStream->response($ctx, 200, sub {
                my ($nr, undef) = @_;
                if ($nr == 1) {
-                       $tip . multipart_text_as_html($mime, '') . '</pre><hr>'
+                       $tip . multipart_text_as_html($mime, '', $obfs) .
+                               '</pre><hr>'
                } elsif ($nr == 2) {
                        # fake an EOF if generating the footer fails;
                        # we want to at least show the message if something
@@ -52,12 +54,13 @@ sub msg_reply {
         'https://en.wikipedia.org/wiki/Posting_style#Interleaved_style';
 
        my $info = '';
-       if (my $url = $ctx->{-inbox}->{infourl}) {
+       my $ibx = $ctx->{-inbox};
+       if (my $url = $ibx->{infourl}) {
                $url = PublicInbox::Hval::prurl($ctx->{env}, $url);
                $info = qq(\n  List information: <a\nhref="$url">$url</a>\n);
        }
 
-       my ($arg, $link) = mailto_arg_link($hdr);
+       my ($arg, $link) = PublicInbox::Reply::mailto_arg_link($ibx, $hdr);
        push @$arg, '/path/to/YOUR_REPLY';
        $arg = ascii_html(join(" \\\n    ", '', @$arg));
        <<EOF
@@ -92,18 +95,18 @@ EOF
 
 sub in_reply_to {
        my ($hdr) = @_;
-       my $irt = $hdr->header_raw('In-Reply-To');
-
-       return mid_clean($irt) if defined $irt && $irt ne '';
-
-       my $refs = $hdr->header_raw('References');
-       if ($refs && $refs =~ /<([^>]+)>\s*\z/s) {
-               return $1;
+       my %mid = map { $_ => 1 } $hdr->header_raw('Message-ID');
+       my @refs = ($hdr->header_raw('References'),
+                       $hdr->header_raw('In-Reply-To'));
+       @refs = ((join(' ', @refs)) =~ /<([^>]+)>/g);
+       while (defined(my $irt = pop @refs)) {
+               next if $mid{"<$irt>"};
+               return $irt;
        }
        undef;
 }
 
-sub _hdr_names ($$) {
+sub _hdr_names_html ($$) {
        my ($hdr, $field) = @_;
        my $val = $hdr->header($field) or return '';
        ascii_html(join(', ', PublicInbox::Address::names($val)));
@@ -128,18 +131,25 @@ sub index_entry {
 
        my $root_anchor = $ctx->{root_anchor} || '';
        my $irt;
+       my $obfs = $ctx->{-obfuscate};
 
        my $rv = "<a\nhref=#e$id\nid=m$id>*</a> ";
        $subj = '<b>'.ascii_html($subj).'</b>';
+       obfuscate_addrs($subj) if $obfs;
        $subj = "<u\nid=u>$subj</u>" if $root_anchor eq $id_m;
        $rv .= $subj . "\n";
        $rv .= _th_index_lite($mid_raw, \$irt, $id, $ctx);
        my @tocc;
        foreach my $f (qw(To Cc)) {
-               my $dst = _hdr_names($hdr, $f);
-               push @tocc, "$f: $dst" if $dst ne '';
+               my $dst = _hdr_names_html($hdr, $f);
+               if ($dst ne '') {
+                       obfuscate_addrs($dst) if $obfs;
+                       push @tocc, "$f: $dst";
+               }
        }
-       $rv .= "From: "._hdr_names($hdr, 'From').' @ '._msg_date($hdr)." UTC";
+       my $from = _hdr_names_html($hdr, 'From');
+       obfuscate_addrs($from) if $obfs;
+       $rv .= "From: $from @ "._msg_date($hdr)." UTC";
        my $upfx = $ctx->{-upfx};
        my $mhref = $upfx . mid_escape($mid_raw) . '/';
        $rv .= qq{ (<a\nhref="$mhref">permalink</a> / };
@@ -156,7 +166,7 @@ sub index_entry {
        $rv .= "\n";
 
        # scan through all parts, looking for displayable text
-       msg_iter($mime, sub { $rv .= add_text_body($mhref, $_[0]) });
+       msg_iter($mime, sub { $rv .= add_text_body($mhref, $obfs, $_[0]) });
 
        # add the footer
        $rv .= "\n<a\nhref=#$id_m\nid=e$id>^</a> ".
@@ -201,7 +211,10 @@ sub _th_index_lite {
        my $rv = '';
        my $mapping = $ctx->{mapping} or return $rv;
        my $pad = '  ';
-       my ($attr, $node, $idx, $level) = @{$mapping->{$mid_raw}};
+       my $mid_map = $mapping->{$mid_raw};
+       defined $mid_map or
+               return 'public-inbox BUG: '.ascii_html($mid_raw).' not mapped';
+       my ($attr, $node, $idx, $level) = @$mid_map;
        my $children = $node->{children};
        my $nr_c = scalar @$children;
        my $nr_s = 0;
@@ -299,7 +312,8 @@ sub stream_thread ($$) {
        }
        return missing_thread($ctx) unless $mime;
 
-       $mime = Email::MIME->new($mime);
+       $ctx->{-obfuscate} = $ctx->{-inbox}->{obfuscate};
+       $mime = PublicInbox::MIME->new($mime);
        $ctx->{-title_html} = ascii_html($mime->header('Subject'));
        $ctx->{-html_tip} = thread_index_entry($ctx, $level, $mime);
        PublicInbox::WwwStream->response($ctx, 200, sub {
@@ -311,7 +325,7 @@ sub stream_thread ($$) {
                        unshift @q, map { ($cl, $_) } @{$node->{children}};
                        my $mid = $node->{id};
                        if ($mime = $inbox->msg_by_smsg($node->{smsg})) {
-                               $mime = Email::MIME->new($mime);
+                               $mime = PublicInbox::MIME->new($mime);
                                return thread_index_entry($ctx, $level, $mime);
                        } else {
                                return ghost_index_entry($ctx, $level, $node);
@@ -351,7 +365,11 @@ sub thread_html {
        $ctx->{s_nr} = "$nr+ messages in thread";
 
        my $rootset = thread_results($msgs);
+
+       # reduce hash lookups in pre_thread->skel_dump
+       $ctx->{-obfuscate} = $ctx->{-inbox}->{obfuscate};
        walk_thread($rootset, $ctx, *pre_thread);
+
        $skel .= '</pre>';
        return stream_thread($rootset, $ctx) unless $ctx->{flat};
 
@@ -362,7 +380,7 @@ sub thread_html {
                $mime = $inbox->msg_by_smsg($mime) and last;
        }
        return missing_thread($ctx) unless $mime;
-       $mime = Email::MIME->new($mime);
+       $mime = PublicInbox::MIME->new($mime);
        $ctx->{-title_html} = ascii_html($mime->header('Subject'));
        $ctx->{-html_tip} = '<pre>'.index_entry($mime, $ctx, scalar @$msgs);
        $mime = undef;
@@ -372,7 +390,7 @@ sub thread_html {
                        $mime = $inbox->msg_by_smsg($mime) and last;
                }
                if ($mime) {
-                       $mime = Email::MIME->new($mime);
+                       $mime = PublicInbox::MIME->new($mime);
                        return index_entry($mime, $ctx, scalar @$msgs);
                }
                $msgs = undef;
@@ -381,14 +399,11 @@ sub thread_html {
 }
 
 sub multipart_text_as_html {
-       my ($mime, $upfx) = @_;
+       my ($mime, $upfx, $obfs) = @_;
        my $rv = "";
 
        # scan through all parts, looking for displayable text
-       msg_iter($mime, sub {
-               my ($p) = @_;
-               $rv .= add_text_body($upfx, $p);
-       });
+       msg_iter($mime, sub { $rv .= add_text_body($upfx, $obfs, $_[0]) });
        $rv;
 }
 
@@ -435,12 +450,14 @@ sub attach_link ($$$$;$) {
        }
        $ret .= "[-- Attachment #$idx: ";
        my $ts = "Type: $ct, Size: $size bytes";
+       $desc = ascii_html($desc);
        $ret .= ($desc eq '') ? "$ts --]" : "$desc --]\n[-- $ts --]";
        $ret .= "</a>\n";
 }
 
 sub add_text_body {
-       my ($upfx, $p) = @_; # from msg_iter: [ Email::MIME, depth, @idx ]
+       my ($upfx, $obfs, $p) = @_;
+       # $p - from msg_iter: [ Email::MIME, depth, @idx ]
        my ($part, $depth) = @$p; # attachment @idx is unused
        my $ct = $part->content_type || 'text/plain';
        my $fn = $part->filename;
@@ -491,15 +508,20 @@ sub add_text_body {
 
        if (@quot) { # ugh, top posted
                flush_quote(\$s, $l, \@quot);
-       } elsif ($s =~ /\n\z/s) { # common, last line ends with a newline
+               obfuscate_addrs($s) if $obfs;
                $s;
-       } else { # some editors don't do newlines...
-               $s .= "\n";
+       } else {
+               obfuscate_addrs($s) if $obfs;
+               if ($s =~ /\n\z/s) { # common, last line ends with a newline
+                       $s;
+               } else { # some editors don't do newlines...
+                       $s .= "\n";
+               }
        }
 }
 
 sub _msg_html_prepare {
-       my ($hdr, $ctx) = @_;
+       my ($hdr, $ctx, $obfs) = @_;
        my $srch = $ctx->{srch} if $ctx;
        my $atom = '';
        my $rv = "<pre\nid=b>"; # anchor for body start
@@ -518,6 +540,7 @@ sub _msg_html_prepare {
                if ($h eq 'From') {
                        my @n = PublicInbox::Address::names($v->raw);
                        $title[1] = ascii_html(join(', ', @n));
+                       obfuscate_addrs($title[1]) if $obfs;
                } elsif ($h eq 'Subject') {
                        $title[0] = $v->as_html;
                        if ($srch) {
@@ -527,7 +550,7 @@ sub _msg_html_prepare {
                        }
                }
                $v = $v->as_html;
-               $v =~ s/(\@[^,]+,) /$1\n\t/g if ($h eq 'Cc' || $h eq 'To');
+               obfuscate_addrs($v) if $obfs;
                $rv .= "$h: $v\n";
 
        }
@@ -573,7 +596,11 @@ sub thread_skel {
        $ctx->{prev_level} = 0;
        $ctx->{dst} = $dst;
        $sres = load_results($srch, $sres);
+
+       # reduce hash lookups in skel_dump
+       $ctx->{-obfuscate} = $ctx->{-inbox}->{obfuscate};
        walk_thread(thread_results($sres), $ctx, *skel_dump);
+
        $ctx->{parent_msg} = $parent;
 }
 
@@ -614,49 +641,6 @@ sub _parent_headers {
        $rv;
 }
 
-sub squote_maybe ($) {
-       my ($val) = @_;
-       if ($val =~ m{([^\w@\./,\%\+\-])}) {
-               $val =~ s/(['!])/'\\$1'/g; # '!' for csh
-               return "'$val'";
-       }
-       $val;
-}
-
-sub mailto_arg_link {
-       my ($hdr) = @_;
-       my %cc; # everyone else
-       my $to; # this is the From address
-
-       foreach my $h (qw(From To Cc)) {
-               my $v = $hdr->header($h);
-               defined($v) && ($v ne '') or next;
-               my @addrs = PublicInbox::Address::emails($v);
-               foreach my $address (@addrs) {
-                       my $dst = lc($address);
-                       $cc{$dst} ||= $address;
-                       $to ||= $dst;
-               }
-       }
-       my @arg;
-
-       my $subj = $hdr->header('Subject') || '';
-       $subj = "Re: $subj" unless $subj =~ /\bRe:/i;
-       my $mid = $hdr->header_raw('Message-ID');
-       push @arg, '--in-reply-to='.squote_maybe(mid_clean($mid));
-       my $irt = mid_escape($mid);
-       delete $cc{$to};
-       push @arg, "--to=$to";
-       $to = uri_escape_utf8($to);
-       $subj = uri_escape_utf8($subj);
-       my @cc = sort values %cc;
-       push(@arg, map { "--cc=$_" } @cc);
-       my $cc = uri_escape_utf8(join(',', @cc));
-       my $href = "mailto:$to?In-Reply-To=$irt&Cc=${cc}&Subject=$subj";
-
-       (\@arg, ascii_html($href));
-}
-
 sub html_footer {
        my ($hdr, $standalone, $ctx, $rhref) = @_;
 
@@ -770,7 +754,11 @@ sub skel_dump {
        my $dst = $ctx->{dst};
        my $cur = $ctx->{cur};
        my $mid = $smsg->{mid};
+
        my $f = ascii_html($smsg->from_name);
+       my $obfs = $ctx->{-obfuscate};
+       obfuscate_addrs($f) if $obfs;
+
        my $d = fmt_ts($smsg->{ts}) . ' ' . indent_for($level) . th_pfx($level);
        my $attr = $f;
        $ctx->{first_level} ||= $level;
@@ -796,19 +784,20 @@ sub skel_dump {
        # Subject is never undef, this mail was loaded from
        # our Xapian which would've resulted in '' if it were
        # really missing (and Filter rejects empty subjects)
-       my $s = $smsg->subject;
-       my $h = $ctx->{srch}->subject_path($s);
+       my $subj = $smsg->subject;
+       my $h = $ctx->{srch}->subject_path($subj);
        if ($ctx->{seen}->{$h}) {
-               $s = undef;
+               $subj = undef;
        } else {
                $ctx->{seen}->{$h} = 1;
-               $s = PublicInbox::Hval->new($s);
-               $s = $s->as_html;
+               $subj = PublicInbox::Hval->new($subj);
+               $subj = $subj->as_html;
+               obfuscate_addrs($subj) if $obfs;
        }
        my $m;
        my $id = '';
        my $mapping = $ctx->{mapping};
-       my $end = defined($s) ? "$s</a> $f\n" : "$f</a>\n";
+       my $end = defined($subj) ? "$subj</a> $f\n" : "$f</a>\n";
        if ($mapping) {
                my $map = $mapping->{$mid};
                $id = id_compress($mid, 1);
@@ -900,6 +889,7 @@ sub dump_topics {
        }
 
        my @out;
+       my $obfs = $ctx->{-inbox}->{obfuscate};
 
        # sort by recency, this allows new posts to "bump" old topics...
        foreach my $topic (sort { $b->[0] <=> $a->[0] } @$order) {
@@ -928,12 +918,13 @@ sub dump_topics {
                        " $ts UTC $n - $mbox / $atom\n";
                for (my $i = 0; $i < scalar(@ex); $i += 2) {
                        my $level = $ex[$i];
-                       my $sub = $ex[$i + 1];
-                       $mid = delete $seen->{$sub};
-                       $sub = PublicInbox::Hval->new($sub)->as_html;
+                       my $subj = $ex[$i + 1];
+                       $mid = delete $seen->{$subj};
+                       $subj = ascii_html($subj);
+                       obfuscate_addrs($subj) if $obfs;
                        $href = mid_escape($mid);
                        $s .= indent_for($level) . TCHILD;
-                       $s .= "<a\nhref=\"$href/T/#u\">$sub</a>\n";
+                       $s .= "<a\nhref=\"$href/T/#u\">$subj</a>\n";
                }
                push @out, $s;
        }