]> Sergey Matveev's repositories - public-inbox.git/blob - lib/PublicInbox/Hval.pm
html: refactor header value handling to be OO
[public-inbox.git] / lib / PublicInbox / Hval.pm
1 # Copyright (C) 2014, Eric Wong <normalperson@yhbt.net> and all contributors
2 # License: AGPLv3 or later (https://www.gnu.org/licenses/agpl-3.0.txt)
3 #
4 # represents a header value in various forms
5 package PublicInbox::Hval;
6 use strict;
7 use warnings;
8 use fields qw(raw -as_utf8);
9 use Encode qw(find_encoding);
10 use CGI qw(escapeHTML);
11 use URI::Escape qw(uri_escape);
12
13 my $enc_utf8 = find_encoding('utf8');
14 my $enc_ascii = find_encoding('us-ascii');
15 my $enc_mime = find_encoding('MIME-Header');
16
17 sub new {
18         my ($class, $raw) = @_;
19         my $self = fields::new($class);
20
21         # we never care about leading/trailing whitespace
22         $raw =~ s/\A\s*//;
23         $raw =~ s/\s*\z//;
24         $self->{raw} = $raw;
25         $self;
26 }
27
28 sub new_msgid {
29         my ($class, $raw) = @_;
30         $raw =~ s/\A<//;
31         $raw =~ s/>\z//;
32         $class->new($raw);
33 }
34
35 sub new_oneline {
36         my ($class, $raw) = @_;
37         $raw = '' unless defined $raw;
38         $raw =~ tr/\t\n / /s; # squeeze spaces
39         $raw =~ tr/\r//d; # kill CR
40         $class->new($raw);
41 }
42
43 sub as_utf8 {
44         my ($self) = @_;
45         $self->{-as_utf8} ||= $enc_utf8->encode($self->{raw});
46 }
47
48 sub ascii_html { $enc_ascii->encode(escapeHTML($_[0]), Encode::HTMLCREF) }
49
50 sub as_html { ascii_html($_[0]->as_utf8) }
51 sub as_href { ascii_html(uri_escape($_[0]->as_utf8)) }
52
53 1;