]> Sergey Matveev's repositories - public-inbox.git/blobdiff - public-inbox-cgi
view: trim_message_id consistently
[public-inbox.git] / public-inbox-cgi
index ccfaae3789d1f0322c86f24b3aaf25d44f07c7be..6a6f31e23ef81acd8045001190a3e7991c012290 100755 (executable)
@@ -13,9 +13,9 @@ use 5.008;
 use strict;
 use warnings;
 use CGI qw(:cgi :escapeHTML -nosticky); # PSGI/FastCGI/mod_perl compat
-use CGI::Util qw(unescape);
-use Encode;
+use Encode qw(decode_utf8);
 use PublicInbox::Config;
+use Digest::SHA qw(sha1_hex);
 our $LISTNAME_RE = qr!\A/([\w\.\-]+)!;
 our $pi_config;
 BEGIN {
@@ -26,75 +26,168 @@ BEGIN {
        }
 }
 
+my $ret = main();
+
+my ($status, $headers, $body) = @$ret;
+set_binmode($headers);
+if (@ARGV && $ARGV[0] eq 'static') {
+       print $body;
+} else { # CGI
+       print "Status: $status\r\n";
+       while (my ($k, $v) = each %$headers) {
+               print "$k: $v\r\n";
+       }
+       print "\r\n", $body;
+}
+
+# TODO: plack support
+
+# private functions below
+
 sub main {
        my $cgi = CGI->new;
+       my %ctx;
        if ($cgi->request_method !~ /\AGET|HEAD\z/) {
-               return r($cgi, "405 Method Not Allowed");
+               return r("405 Method Not Allowed");
        }
        my $path_info = decode_utf8($ENV{PATH_INFO});
+
+       # top-level indices and feeds
        if ($path_info eq "/") {
-               r($cgi, "404 Not Found");
-       } elsif ($path_info =~ m!$LISTNAME_RE/?\z!o) {
-               get_list_log($cgi, $1);
-       } elsif ($path_info =~ m!$LISTNAME_RE/all\z!o) {
-               get_list_all($cgi, $1);
+               r404();
+       } elsif ($path_info =~ m!$LISTNAME_RE(?:/|/index\.html)?\z!o) {
+               invalid_list(\%ctx, $1) || get_index(\%ctx, $cgi, 1);
        } elsif ($path_info =~ m!$LISTNAME_RE/index\.atom\.xml\z!o) {
-               get_atom_index($cgi, $1);
+               invalid_list(\%ctx, $1) || get_atom(\%ctx, $cgi, 1);
        } elsif ($path_info =~ m!$LISTNAME_RE/all\.atom\.xml\z!o) {
-               get_atom_all($cgi, $1);
-       } elsif ($path_info =~ m!$LISTNAME_RE/mid/(\S+)\.txt\z!o) {
-               get_mid_txt($cgi, $1, $2);
-       } elsif ($path_info =~ m!$LISTNAME_RE/mid/(\S+)\.html\z!o) {
-               get_mid_html($cgi, $1, $2);
-       } elsif ($path_info =~ m!$LISTNAME_RE/mid/(\S+)\z!o) {
+               invalid_list(\%ctx, $1) || get_atom(\%ctx, $cgi, 0);
+
+       # single-message pages
+       } elsif ($path_info =~ m!$LISTNAME_RE/m/(\S+)\.txt\z!o) {
+               invalid_list_mid(\%ctx, $1, $2) || get_mid_txt(\%ctx, $cgi);
+       } elsif ($path_info =~ m!$LISTNAME_RE/m/(\S+)\.html\z!o) {
+               invalid_list_mid(\%ctx, $1, $2) || get_mid_html(\%ctx, $cgi);
+       } elsif ($path_info =~ m!$LISTNAME_RE/m/(\S+)\z!o) {
                redirect_mid_html($cgi, $1, $2);
+
+       # full-message page
+       } elsif ($path_info =~ m!$LISTNAME_RE/f/(\S+)\.html\z!o) {
+               invalid_list_mid(\%ctx, $1, $2) || get_full_html(\%ctx, $cgi);
+       } elsif ($path_info =~ m!$LISTNAME_RE/f/(\S+)\z!o) {
+               redirect_mid_html($cgi, $1, $2);
+
        } else {
-               r($cgi, "404 Not Found");
+               r404();
        }
 }
 
-binmode STDOUT, ':utf8';
-main();
+sub r404 { r("404 Not Found") }
 
 # simple response for errors
-sub r {
-       print $_[0]->header(-type => "text/plain",
-                               -status => $_[1],
-                               -charset => 'utf-8');
-}
+sub r { [ $_[0], { 'Content-Type' => 'text/plain' }, '' ] }
 
-# /$LISTNAME/all.atom.xml      -> Atom feed, includes replies
-sub get_atom_all {
-       my ($cgi, $listname) = @_;
+# returns undef if valid, array ref response if invalid
+sub invalid_list {
+       my ($ctx, $listname) = @_;
        my $git_dir = $pi_config->get($listname, "mainrepo");
-       defined $git_dir or return r($cgi, "404 Not Found");
+       if (defined $git_dir) {
+               $ctx->{git_dir} = $git_dir;
+               $ctx->{listname} = $listname;
+               return undef;
+       }
+       r404();
+}
 
-       require PublicInbox::Feed;
-       print $cgi->header(-type => "application/xml", -charset => 'us-ascii',
-                               -status => '200 OK');
-
-       print PublicInbox::Feed->generate({
-               git_dir => $git_dir,
-               pi_config => $pi_config,
-               listname => $listname,
-               cgi => $cgi
-       });
+# returns undef if valid, array ref response if invalid
+sub invalid_list_mid {
+       my ($ctx, $listname, $mid) = @_;
+       my $ret = invalid_list($ctx, $listname, $mid) and return $ret;
+       $ctx->{mid} = $mid;
+       undef;
 }
 
-# /$LISTNAME/index.atom.xml    -> Atom feed
-sub get_atom_index {
-       my ($cgi, $listname) = @_;
-       my $git_dir = $pi_config->get($listname, "mainrepo");
-       defined $git_dir or return r($cgi, "404 Not Found");
+# /$LISTNAME/index.atom.xml                     -> Atom feed
+# /$LISTNAME/all.atom.xml                       -> Atom feed, includes replies
+sub get_atom {
+       my ($ctx, $cgi, $top) = @_;
+       require PublicInbox::Feed;
+       [ '200 OK', { 'Content-Type' => 'application/xml' },
+         PublicInbox::Feed->generate({
+                       git_dir => $ctx->{git_dir},
+                       listname => $ctx->{listname},
+                       pi_config => $pi_config,
+                       cgi => $cgi,
+                       top => $top,
+               })
+       ];
+}
 
+# /$LISTNAME/?before=$GIT_COMMIT                 -> HTML only
+sub get_index {
+       my ($ctx, $cgi, $top) = @_;
        require PublicInbox::Feed;
-       print $cgi->header(-type => "application/xml", -charset => 'us-ascii',
-                               -status => '200 OK');
-       print PublicInbox::Feed->generate({
-               git_dir => $git_dir,
-               pi_config => $pi_config,
-               listname => $listname,
-               cgi => $cgi,
-               top => 1
-       });
+       [ '200 OK', { 'Content-Type' => 'text/html' },
+         PublicInbox::Feed->generate_html_index({
+                       git_dir => $ctx->{git_dir},
+                       listname => $ctx->{listname},
+                       pi_config => $pi_config,
+                       cgi => $cgi,
+                       top => $top,
+               })
+       ];
+}
+
+# just returns a string ref for the blob in the current ctx
+sub mid2blob {
+       my ($ctx) = @_;
+       local $ENV{GIT_DIR} = $ctx->{git_dir};
+       my $hex = sha1_hex($ctx->{mid});
+       $hex =~ /\A([a-f0-9]{2})([a-f0-9]{38})\z/i or
+                       die "BUG: not a SHA-1 hex: $hex";
+       my $blob = `git cat-file blob HEAD:$1/$2 2>/dev/null`;
+       $? == 0 ? \$blob : undef;
+}
+
+# /$LISTNAME/m/$MESSAGE_ID.txt                    -> raw original
+sub get_mid_txt {
+       my ($ctx, $cgi) = @_;
+       my $x = mid2blob($ctx);
+       $x ? [ "200 OK", {'Content-Type' => 'text/plain'}, $$x ] : r404();
+}
+
+# /$LISTNAME/m/$MESSAGE_ID.html                   -> HTML content (short quotes)
+sub get_mid_html {
+       my ($ctx, $cgi) = @_;
+       my $x = mid2blob($ctx);
+       return r404() unless $x;
+
+       my $pfx = $cgi->self_url;
+       $pfx =~ s!/m/.+\z!/!; # FIXME: this is not robust
+
+       require PublicInbox::View;
+       require Email::MIME;
+       [ "200 OK", {'Content-Type' => 'text/html'},
+               PublicInbox::View->as_html(Email::MIME->new($$x), $pfx)];
+}
+
+# /$LISTNAME/f/$MESSAGE_ID.html                   -> HTML content (fullquotes)
+sub get_full_html {
+       my ($ctx, $cgi) = @_;
+       my $x = mid2blob($ctx);
+       return r404() unless $x;
+       require PublicInbox::View;
+       require Email::MIME;
+       [ "200 OK", {'Content-Type' => 'text/html'},
+               PublicInbox::View->as_html(Email::MIME->new($$x))];
+}
+
+# only used for CGI and static file generation modes
+sub set_binmode {
+       my ($headers) = @_;
+       if ($headers->{'Content-Type'} eq 'text/plain') {
+               # no way to validate raw messages, mixed encoding is possible.
+               binmode STDOUT;
+       } else { # strict encoding for HTML and XML
+               binmode STDOUT, ':encoding(UTF-8)';
+       }
 }