]> Sergey Matveev's repositories - public-inbox.git/blobdiff - lib/PublicInbox/WWW.pm
rename 'GitCatFile' package to 'Git'
[public-inbox.git] / lib / PublicInbox / WWW.pm
index 11b540276d8c57a96e6c0335493314d7049819fb..ee414e85d1d5a9442d6a34281df43834e0753cea 100644 (file)
@@ -1,6 +1,8 @@
-# Copyright (C) 2014, Eric Wong <normalperson@yhbt.net> and all contributors
+# Copyright (C) 2014-2015 all contributors <meta@public-inbox.org>
 # License: AGPLv3 or later (https://www.gnu.org/licenses/agpl-3.0.txt)
 #
+# Main web interface for mailing list archives
+#
 # We focus on the lowest common denominators here:
 # - targeted at text-only console browsers (w3m, links, etc..)
 # - Only basic HTML, CSS only for line-wrapping <pre> text content for GUIs
@@ -11,18 +13,20 @@ package PublicInbox::WWW;
 use 5.008;
 use strict;
 use warnings;
-use PublicInbox::Config;
+use PublicInbox::Config qw(try_cat);
 use URI::Escape qw(uri_escape_utf8 uri_unescape);
 use constant SSOMA_URL => 'http://ssoma.public-inbox.org/';
 use constant PI_URL => 'http://public-inbox.org/';
+require PublicInbox::Git;
 our $LISTNAME_RE = qr!\A/([\w\.\-]+)!;
 our $MID_RE = qr!([^/]+)!;
+our $END_RE = qr!(f/|T/|t/|t\.mbox(?:\.gz)?|t\.atom|raw|)!;
 our $pi_config;
 
 sub run {
        my ($cgi, $method) = @_;
        $pi_config ||= PublicInbox::Config->new;
-       my %ctx = (cgi => $cgi, pi_config => $pi_config);
+       my $ctx = { cgi => $cgi, pi_config => $pi_config };
        if ($method !~ /\AGET|HEAD\z/) {
                return r(405, 'Method Not Allowed');
        }
@@ -32,40 +36,25 @@ sub run {
        if ($path_info eq '/') {
                r404();
        } elsif ($path_info =~ m!$LISTNAME_RE\z!o) {
-               invalid_list(\%ctx, $1) || r301(\%ctx, $1);
+               invalid_list($ctx, $1) || r301($ctx, $1);
        } elsif ($path_info =~ m!$LISTNAME_RE(?:/|/index\.html)?\z!o) {
-               invalid_list(\%ctx, $1) || get_index(\%ctx);
+               invalid_list($ctx, $1) || get_index($ctx);
        } elsif ($path_info =~ m!$LISTNAME_RE/(?:atom\.xml|new\.atom)\z!o) {
-               invalid_list(\%ctx, $1) || get_atom(\%ctx);
+               invalid_list($ctx, $1) || get_atom($ctx);
 
-       # thread display
-       } elsif ($path_info =~ m!$LISTNAME_RE/$MID_RE/t/\z!o) {
-               invalid_list_mid(\%ctx, $1, $2) || get_thread(\%ctx);
-       } elsif ($path_info =~ m!$LISTNAME_RE/$MID_RE/t\.mbox(\.gz)?\z!o) {
-               my $sfx = $3;
-               invalid_list_mid(\%ctx, $1, $2) || get_thread_mbox(\%ctx, $sfx);
-       } elsif ($path_info =~ m!$LISTNAME_RE/$MID_RE/t\.atom\z!o) {
-               invalid_list_mid(\%ctx, $1, $2) || get_thread_atom(\%ctx);
-       } elsif ($path_info =~ m!$LISTNAME_RE/$MID_RE/T/\z!o) {
-               $ctx{flat} = 1;
-               invalid_list_mid(\%ctx, $1, $2) || get_thread(\%ctx);
+       } elsif ($path_info =~ m!$LISTNAME_RE/$MID_RE/$END_RE\z!o) {
+               msg_page($ctx, $1, $2, $3);
 
-       # single-message pages
-       } elsif ($path_info =~ m!$LISTNAME_RE/$MID_RE/\z!o) {
-               invalid_list_mid(\%ctx, $1, $2) || get_mid_html(\%ctx);
-       } elsif ($path_info =~ m!$LISTNAME_RE/$MID_RE/raw\z!o) {
-               invalid_list_mid(\%ctx, $1, $2) || get_mid_txt(\%ctx);
-
-       # full-message page
-       } elsif ($path_info =~ m!$LISTNAME_RE/$MID_RE/f/\z!o) {
-               invalid_list_mid(\%ctx, $1, $2) || get_full_html(\%ctx);
+       # in case people leave off the trailing slash:
+       } elsif ($path_info =~ m!$LISTNAME_RE/$MID_RE/(f|T|t)\z!o) {
+               r301($ctx, $1, $2, $3 eq 't' ? 't/#u' : $3);
 
        # convenience redirects order matters
        } elsif ($path_info =~ m!$LISTNAME_RE/([^/]{2,})\z!o) {
-               r301(\%ctx, $1, $2);
+               r301($ctx, $1, $2);
 
        } else {
-               legacy_redirects(\%ctx, $path_info);
+               legacy_redirects($ctx, $path_info);
        }
 }
 
@@ -74,13 +63,13 @@ sub preload {
        require PublicInbox::Feed;
        require PublicInbox::View;
        require PublicInbox::Thread;
-       require PublicInbox::GitCatFile;
        require Email::MIME;
        require Digest::SHA;
        require POSIX;
 
        eval {
                require PublicInbox::Search;
+               require PublicInbox::SearchView;
                require PublicInbox::Mbox;
                require IO::Compress::Gzip;
        };
@@ -92,6 +81,7 @@ sub r404 {
        my ($ctx) = @_;
        if ($ctx && $ctx->{mid}) {
                require PublicInbox::ExtMsg;
+               searcher($ctx);
                return PublicInbox::ExtMsg::ext_msg($ctx);
        }
        r(404, 'Not Found');
@@ -106,6 +96,7 @@ sub invalid_list {
        my $git_dir = $pi_config->get($listname, "mainrepo");
        if (defined $git_dir) {
                $ctx->{git_dir} = $git_dir;
+               $ctx->{git} = PublicInbox::Git->new($git_dir);
                $ctx->{listname} = $listname;
                return;
        }
@@ -143,7 +134,12 @@ sub get_index {
        require PublicInbox::Feed;
        my $srch = searcher($ctx);
        footer($ctx);
-       PublicInbox::Feed::generate_html_index($ctx);
+       if (defined $ctx->{cgi}->param('q')) {
+               require PublicInbox::SearchView;
+               PublicInbox::SearchView::sres_top_html($ctx);
+       } else {
+               PublicInbox::Feed::generate_html_index($ctx);
+       }
 }
 
 # just returns a string ref for the blob in the current ctx
@@ -151,18 +147,7 @@ sub mid2blob {
        my ($ctx) = @_;
        require PublicInbox::MID;
        my $path = PublicInbox::MID::mid2path($ctx->{mid});
-       my @cmd = ('git', "--git-dir=$ctx->{git_dir}",
-                       qw(cat-file blob), "HEAD:$path");
-       my $pid = open my $fh, '-|';
-       defined $pid or die "fork failed: $!\n";
-       if ($pid == 0) {
-               open STDERR, '>', '/dev/null'; # ignore errors
-               exec @cmd or die "exec failed: $!\n";
-       } else {
-               my $blob = eval { local $/; <$fh> };
-               close $fh;
-               $? == 0 ? \$blob : undef;
-       }
+       $ctx->{git}->cat_file("HEAD:$path");
 }
 
 # /$LISTNAME/$MESSAGE_ID/raw                    -> raw mbox
@@ -170,7 +155,7 @@ sub get_mid_txt {
        my ($ctx) = @_;
        my $x = mid2blob($ctx) or return r404($ctx);
        require PublicInbox::Mbox;
-       PublicInbox::Mbox::emit1($x);
+       PublicInbox::Mbox::emit1($ctx, $x);
 }
 
 # /$LISTNAME/$MESSAGE_ID/                   -> HTML content (short quotes)
@@ -203,10 +188,11 @@ sub get_full_html {
 
 # /$LISTNAME/$MESSAGE_ID/t/
 sub get_thread {
-       my ($ctx) = @_;
+       my ($ctx, $flat) = @_;
        my $srch = searcher($ctx) or return need_search($ctx);
        require PublicInbox::View;
        my $foot = footer($ctx);
+       $ctx->{flat} = $flat;
        PublicInbox::View::thread_html($ctx, $foot, $srch);
 }
 
@@ -222,17 +208,6 @@ sub ctx_get {
        $val;
 }
 
-sub try_cat {
-       my ($path) = @_;
-       my $rv;
-       if (open(my $fh, '<', $path)) {
-               local $/;
-               $rv = <$fh>;
-               close $fh;
-       }
-       $rv;
-}
-
 sub footer {
        my ($ctx) = @_;
        return '' unless $ctx;
@@ -366,6 +341,14 @@ sub legacy_redirects {
        } elsif ($path_info =~ m!$LISTNAME_RE/f/(\S+)\z!o) {
                r301($ctx, $1, $2, 'f/');
 
+       # some Message-IDs have slashes in them and the HTTP server
+       # may try to be clever and unescape them :<
+       } elsif ($path_info =~ m!$LISTNAME_RE/(\S+/\S+)/$END_RE\z!o) {
+               msg_page($ctx, $1, $2, $3);
+
+       # in case people leave off the trailing slash:
+       } elsif ($path_info =~ m!$LISTNAME_RE/(\S+/\S+)/(f|T|t)\z!o) {
+               r301($ctx, $1, $2, $3 eq 't' ? 't/#u' : $3);
        } else {
                r404();
        }
@@ -390,4 +373,19 @@ sub r301 {
          [ "Redirecting to $url\n" ] ]
 }
 
+sub msg_page {
+       my ($ctx, $list, $mid, $e) = @_;
+       unless (invalid_list_mid($ctx, $list, $mid)) {
+               '' eq $e and return get_mid_html($ctx);
+               't/' eq $e and return get_thread($ctx);
+               't.atom' eq $e and return get_thread_atom($ctx);
+               't.mbox' eq $e and return get_thread_mbox($ctx);
+               't.mbox.gz' eq $e and return get_thread_mbox($ctx, '.gz');
+               'T/' eq $e and return get_thread($ctx, 1);
+               'raw' eq $e and return get_mid_txt($ctx);
+               'f/' eq $e and return get_full_html($ctx);
+       }
+       r404($ctx);
+}
+
 1;