]> Sergey Matveev's repositories - public-inbox.git/blobdiff - lib/PublicInbox/IMAP.pm
imap: support 8000 octet lines
[public-inbox.git] / lib / PublicInbox / IMAP.pm
index 8307343cf151f7c607f7956c4014ba999dbe7a14..2e50415de57367b4f6b996c1f372ff21f1042ceb 100644 (file)
@@ -16,7 +16,7 @@
 package PublicInbox::IMAP;
 use strict;
 use base qw(PublicInbox::DS);
-use fields qw(imapd logged_in ibx long_cb -login_tag
+use fields qw(imapd ibx long_cb -login_tag
        uid_min -idle_tag -idle_max);
 use PublicInbox::Eml;
 use PublicInbox::EmlContentFoo qw(parse_content_disposition);
@@ -27,6 +27,7 @@ use Text::ParseWords qw(parse_line);
 use Errno qw(EAGAIN);
 use Time::Local qw(timegm);
 use POSIX qw(strftime);
+use Hash::Util qw(unlock_hash); # dependency of fields for perl 5.10+, anyways
 
 my $Address;
 for my $mod (qw(Email::Address::XS Mail::Address)) {
@@ -35,27 +36,32 @@ for my $mod (qw(Email::Address::XS Mail::Address)) {
 }
 die "neither Email::Address::XS nor Mail::Address loaded: $@" if !$Address;
 
-sub LINE_MAX () { 512 } # does RFC 3501 have a limit like RFC 977?
+sub LINE_MAX () { 8000 } # RFC 2683 3.2.1.5
 
 # changing this will cause grief for clients which cache
 sub UID_BLOCK () { 50_000 }
 
-my %FETCH_NEED_BLOB = ( # for future optimization
-       'BODY[HEADER]' => 1,
-       'BODY[TEXT]' => 1,
-       'BODY[]' => 1,
-       'RFC822.HEADER' => 1,
-       'RFC822.SIZE' => 1, # needs CRLF conversion :<
-       'RFC822.TEXT' => 1,
-       BODY => 1,
-       BODYSTRUCTURE => 1,
-       ENVELOPE => 1,
-       FLAGS => 0,
-       INTERNALDATE => 0,
-       RFC822 => 1,
-       UID => 0,
+# these values area also used for sorting
+sub NEED_SMSG () { 1 }
+sub NEED_BLOB () { NEED_SMSG|2 }
+sub NEED_EML () { NEED_BLOB|4 }
+my $OP_EML_NEW = [ NEED_EML - 1, \&op_eml_new ];
+
+my %FETCH_NEED = (
+       'BODY[HEADER]' => [ NEED_EML, \&emit_rfc822_header ],
+       'BODY[TEXT]' => [ NEED_EML, \&emit_rfc822_text ],
+       'BODY[]' => [ NEED_BLOB, \&emit_rfc822 ],
+       'RFC822.HEADER' => [ NEED_EML, \&emit_rfc822_header ],
+       'RFC822.TEXT' => [ NEED_EML, \&emit_rfc822_text ],
+       'RFC822.SIZE' => [ NEED_SMSG, \&emit_rfc822_size ],
+       RFC822 => [ NEED_BLOB, \&emit_rfc822 ],
+       BODY => [ NEED_EML, \&emit_body ],
+       BODYSTRUCTURE => [ NEED_EML, \&emit_bodystructure ],
+       ENVELOPE => [ NEED_EML, \&emit_envelope ],
+       FLAGS => [ 0, \&emit_flags ],
+       INTERNALDATE => [ NEED_SMSG, \&emit_internaldate ],
 );
-my %FETCH_ATT = map { $_ => [ $_ ] } keys %FETCH_NEED_BLOB;
+my %FETCH_ATT = map { $_ => [ $_ ] } keys %FETCH_NEED;
 
 # aliases (RFC 3501 section 6.4.5)
 $FETCH_ATT{FAST} = [ qw(FLAGS INTERNALDATE RFC822.SIZE) ];
@@ -63,9 +69,10 @@ $FETCH_ATT{ALL} = [ @{$FETCH_ATT{FAST}}, 'ENVELOPE' ];
 $FETCH_ATT{FULL} = [ @{$FETCH_ATT{ALL}}, 'BODY' ];
 
 for my $att (keys %FETCH_ATT) {
-       my %h = map { $_ => 1 } @{$FETCH_ATT{$att}};
+       my %h = map { $_ => $FETCH_NEED{$_} } @{$FETCH_ATT{$att}};
        $FETCH_ATT{$att} = \%h;
 }
+undef %FETCH_NEED;
 
 my $valid_range = '[0-9]+|[0-9]+:[0-9]+|[0-9]+:\*';
 $valid_range = qr/\A(?:$valid_range)(?:,(?:$valid_range))*\z/;
@@ -74,6 +81,9 @@ my @MoY = qw(Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec);
 my %MoY;
 @MoY{@MoY} = (0..11);
 
+# RFC 3501 5.4. Autologout Timer needs to be >= 30min
+$PublicInbox::DS::EXPTIME = 60 * 30;
+
 sub greet ($) {
        my ($self) = @_;
        my $capa = capa($self);
@@ -82,7 +92,8 @@ sub greet ($) {
 
 sub new ($$$) {
        my ($class, $sock, $imapd) = @_;
-       my $self = fields::new($class);
+       my $self = fields::new('PublicInbox::IMAP_preauth');
+       unlock_hash(%$self);
        my $ev = EPOLLIN;
        my $wbuf;
        if ($sock->can('accept_SSL') && !$sock->accept_SSL) {
@@ -101,13 +112,15 @@ sub new ($$$) {
        $self;
 }
 
+sub logged_in { 1 }
+
 sub capa ($) {
        my ($self) = @_;
 
        # dovecot advertises IDLE pre-login; perhaps because some clients
        # depend on it, so we'll do the same
        my $capa = 'CAPABILITY IMAP4rev1 IDLE';
-       if ($self->{logged_in}) {
+       if ($self->logged_in) {
                $capa .= ' COMPRESS=DEFLATE';
        } else {
                if (!($self->{sock} // $self)->can('accept_SSL') &&
@@ -120,7 +133,7 @@ sub capa ($) {
 
 sub login_success ($$) {
        my ($self, $tag) = @_;
-       $self->{logged_in} = 1;
+       bless $self, 'PublicInbox::IMAP';
        my $capa = capa($self);
        "$tag OK [$capa] Logged in\r\n";
 }
@@ -145,7 +158,7 @@ sub cmd_close ($$) {
 
 sub cmd_logout ($$) {
        my ($self, $tag) = @_;
-       delete $self->{logged_in};
+       delete $self->{-idle_tag};
        $self->write(\"* BYE logging out\r\n$tag OK Logout done\r\n");
        $self->shutdn; # PublicInbox::DS::shutdn
        undef;
@@ -168,23 +181,63 @@ sub cmd_noop ($$) { "$_[1] OK Noop done\r\n" }
 sub on_inbox_unlock {
        my ($self, $ibx) = @_;
        my $new = $ibx->mm->max;
+       my $uid_end = ($self->{uid_min} // 1) - 1 + UID_BLOCK;
        defined(my $old = $self->{-idle_max}) or die 'BUG: -idle_max unset';
+       $new = $uid_end if $new > $uid_end;
        if ($new > $old) {
                $self->{-idle_max} = $new;
                $self->msg_more("* $_ EXISTS\r\n") for (($old + 1)..($new - 1));
                $self->write(\"* $new EXISTS\r\n");
+       } elsif ($new == $uid_end) { # max exceeded $uid_end
+               # continue idling w/o inotify
+               delete $self->{-idle_max};
+               my $sock = $self->{sock} or return;
+               $ibx->unsubscribe_unlock(fileno($sock));
+       }
+}
+
+# called every X minute(s) or so by PublicInbox::DS::later
+my $IDLERS = {};
+my $idle_timer;
+sub idle_tick_all {
+       my $old = $IDLERS;
+       $IDLERS = {};
+       for my $i (values %$old) {
+               next if ($i->{wbuf} || !exists($i->{-idle_tag}));
+               $i->update_idle_time or next;
+               $IDLERS->{fileno($i->{sock})} = $i;
+               $i->write(\"* OK Still here\r\n");
        }
+       $idle_timer = scalar keys %$IDLERS ?
+                       PublicInbox::DS::later(\&idle_tick_all) : undef;
 }
 
 sub cmd_idle ($$) {
        my ($self, $tag) = @_;
        # IDLE seems allowed by dovecot w/o a mailbox selected *shrug*
        my $ibx = $self->{ibx} or return "$tag BAD no mailbox selected\r\n";
-       $ibx->subscribe_unlock(fileno($self->{sock}), $self);
-       $self->{imapd}->idler_start;
        $self->{-idle_tag} = $tag;
-       $self->{-idle_max} = $ibx->mm->max // 0;
-       "+ idling\r\n"
+       my $max = $ibx->mm->max // 0;
+       my $uid_end = ($self->{uid_min} // 1) - 1 + UID_BLOCK;
+       my $sock = $self->{sock} or return;
+       my $fd = fileno($sock);
+       # only do inotify on most recent slice
+       if ($max < $uid_end) {
+               $ibx->subscribe_unlock($fd, $self);
+               $self->{imapd}->idler_start;
+               $self->{-idle_max} = $max;
+       }
+       $idle_timer //= PublicInbox::DS::later(\&idle_tick_all);
+       $IDLERS->{$fd} = $self;
+       \"+ idling\r\n"
+}
+
+sub stop_idle ($$) {
+       my ($self, $ibx);
+       my $sock = $self->{sock} or return;
+       my $fd = fileno($sock);
+       delete $IDLERS->{$fd};
+       $ibx->unsubscribe_unlock($fd);
 }
 
 sub cmd_done ($$) {
@@ -195,19 +248,20 @@ sub cmd_done ($$) {
                warn "BUG: idle_tag set w/o inbox";
                return "$tag BAD internal bug\r\n";
        };
-       $ibx->unsubscribe_unlock(fileno($self->{sock}));
+       stop_idle($self, $ibx);
        "$idle_tag OK Idle done\r\n";
 }
 
 sub ensure_ranges_exist ($$$) {
        my ($imapd, $ibx, $max) = @_;
+       defined(my $mb_top = $ibx->{newsgroup}) or return;
        my $mailboxes = $imapd->{mailboxes};
-       my $mb_top = $ibx->{newsgroup};
        my @created;
        for (my $i = int($max/UID_BLOCK); $i >= 0; --$i) {
                my $sub_mailbox = "$mb_top.$i";
                last if exists $mailboxes->{$sub_mailbox};
                $mailboxes->{$sub_mailbox} = $ibx;
+               $sub_mailbox =~ s/\Ainbox\./INBOX./i; # more familiar to users
                push @created, $sub_mailbox;
        }
        return unless @created;
@@ -417,7 +471,7 @@ sub requeue_once ($) {
 
 sub uid_fetch_cb { # called by git->cat_async via git_async_cat
        my ($bref, $oid, $type, $size, $fetch_m_arg) = @_;
-       my ($self, undef, $msgs, undef, $want) = @$fetch_m_arg;
+       my ($self, undef, $msgs, undef, $ops, $partial) = @$fetch_m_arg;
        my $smsg = shift @$msgs or die 'BUG: no smsg';
        if (!defined($oid)) {
                # it's possible to have TOCTOU if an admin runs
@@ -426,51 +480,73 @@ sub uid_fetch_cb { # called by git->cat_async via git_async_cat
        } else {
                $smsg->{blob} eq $oid or die "BUG: $smsg->{blob} != $oid";
        }
-
        $$bref =~ s/(?<!\r)\n/\r\n/sg; # make strict clients happy
 
        # fixup old bug from import (pre-a0c07cba0e5d8b6a)
        $$bref =~ s/\A[\r\n]*From [^\r\n]*\r\n//s;
-
        $self->msg_more("* $smsg->{num} FETCH (UID $smsg->{num}");
-
-       $want->{'RFC822.SIZE'} and
-               $self->msg_more(' RFC822.SIZE '.length($$bref));
-       $want->{INTERNALDATE} and
-               $self->msg_more(' INTERNALDATE "'.$smsg->internaldate.'"');
-       $want->{FLAGS} and $self->msg_more(' FLAGS ()');
-       for ('RFC822', 'BODY[]') {
-               $want->{$_} or next;
-               $self->msg_more(" $_ {".length($$bref)."}\r\n");
-               $self->msg_more($$bref);
+       my $eml;
+       for (my $i = 0; $i < @$ops;) {
+               my $k = $ops->[$i++];
+               $ops->[$i++]->($self, $k, $smsg, $bref, $eml);
        }
+       partial_emit($self, $partial, $eml) if $partial;
+       $self->msg_more(")\r\n");
+       requeue_once($self);
+}
 
-       my $eml = PublicInbox::Eml->new($bref);
+sub emit_rfc822 {
+       my ($self, $k, undef, $bref) = @_;
+       $self->msg_more(" $k {" . length($$bref)."}\r\n");
+       $self->msg_more($$bref);
+}
 
-       $want->{ENVELOPE} and
-               $self->msg_more(' ENVELOPE '.eml_envelope($eml));
+# Mail::IMAPClient::message_string cares about this by default,
+# (->Ignoresizeerrors attribute).  Admins are encouraged to
+# --reindex for IMAP support, anyways.
+sub emit_rfc822_size {
+       my ($self, $k, $smsg) = @_;
+       $self->msg_more(' RFC822.SIZE ' . $smsg->{bytes});
+}
 
-       for ('RFC822.HEADER', 'BODY[HEADER]') {
-               $want->{$_} or next;
-               $self->msg_more(" $_ {".length(${$eml->{hdr}})."}\r\n");
-               $self->msg_more(${$eml->{hdr}});
-       }
-       for ('RFC822.TEXT', 'BODY[TEXT]') {
-               $want->{$_} or next;
-               $self->msg_more(" $_ {".length($$bref)."}\r\n");
-               $self->msg_more($$bref);
-       }
-       $want->{BODYSTRUCTURE} and
-               $self->msg_more(' BODYSTRUCTURE '.fetch_body($eml, 1));
-       $want->{BODY} and
-               $self->msg_more(' BODY '.fetch_body($eml));
-       if (my $partial = $want->{-partial}) {
-               partial_emit($self, $partial, $eml);
-       }
-       $self->msg_more(")\r\n");
-       requeue_once($self);
+sub emit_internaldate {
+       my ($self, undef, $smsg) = @_;
+       $self->msg_more(' INTERNALDATE "'.$smsg->internaldate.'"');
 }
 
+sub emit_flags { $_[0]->msg_more(' FLAGS ()') }
+
+sub emit_envelope {
+       my ($self, undef, undef, undef, $eml) = @_;
+       $self->msg_more(' ENVELOPE '.eml_envelope($eml));
+}
+
+sub emit_rfc822_header {
+       my ($self, $k, undef, undef, $eml) = @_;
+       $self->msg_more(" $k {".length(${$eml->{hdr}})."}\r\n");
+       $self->msg_more(${$eml->{hdr}});
+}
+
+# n.b. this is sorted to be after any emit_eml_new ops
+sub emit_rfc822_text {
+       my ($self, $k, undef, $bref) = @_;
+       $self->msg_more(" $k {".length($$bref)."}\r\n");
+       $self->msg_more($$bref);
+}
+
+sub emit_bodystructure {
+       my ($self, undef, undef, undef, $eml) = @_;
+       $self->msg_more(' BODYSTRUCTURE '.fetch_body($eml, 1));
+}
+
+sub emit_body {
+       my ($self, undef, undef, undef, $eml) = @_;
+       $self->msg_more(' BODY '.fetch_body($eml));
+}
+
+# set $eml once ($_[4] == $eml, $_[3] == $bref)
+sub op_eml_new { $_[4] = PublicInbox::Eml->new($_[3]) }
+
 sub uid_clamp ($$$) {
        my ($self, $beg, $end) = @_;
        my $uid_min = $self->{uid_min} or return;
@@ -520,8 +596,8 @@ sub refill_range ($$$) {
        undef; # keep looping
 }
 
-sub uid_fetch_m { # long_response
-       my ($self, $tag, $msgs, $range_info, $want) = @_;
+sub uid_fetch_msg { # long_response
+       my ($self, $tag, $msgs, $range_info) = @_; # \@ops, \@partial
        while (!@$msgs) { # rare
                if (my $end = refill_range($self, $msgs, $range_info)) {
                        $self->write(\"$tag $end\r\n");
@@ -532,6 +608,58 @@ sub uid_fetch_m { # long_response
                        \&uid_fetch_cb, \@_);
 }
 
+sub uid_fetch_smsg { # long_response
+       my ($self, $tag, $msgs, $range_info, $ops) = @_;
+       while (!@$msgs) { # rare
+               if (my $end = refill_range($self, $msgs, $range_info)) {
+                       $self->write(\"$tag $end\r\n");
+                       return;
+               }
+       }
+       for my $smsg (@$msgs) {
+               $self->msg_more("* $smsg->{num} FETCH (UID $smsg->{num}");
+               for (my $i = 0; $i < @$ops;) {
+                       my $k = $ops->[$i++];
+                       $ops->[$i++]->($self, $k, $smsg);
+               }
+               $self->msg_more(")\r\n");
+       }
+       @$msgs = ();
+       1; # more
+}
+
+sub uid_fetch_uid { # long_response
+       my ($self, $tag, $uids, $range_info, $ops) = @_;
+       while (!@$uids) { # rare
+               my ($beg, $end, $range_csv) = @$range_info;
+               if (scalar(@$uids = @{$self->{ibx}->over->
+                                       uid_range($beg, $end)})) {
+                       $range_info->[0] = $uids->[-1] + 1;
+               } elsif (!$range_csv) {
+                       $self->write(\"$tag OK Fetch done\r\n");
+                       return;
+               } else {
+                       my $next_range = range_step($self, \$range_csv);
+                       if (!ref($next_range)) { # error
+                               $self->write(\"$tag $next_range\r\n");
+                               return;
+                       }
+                       @$range_info = @$next_range;
+               }
+               # continue looping
+       }
+       for (@$uids) {
+               $self->msg_more("* $_ FETCH (UID $_");
+               for (my $i = 0; $i < @$ops;) {
+                       my $k = $ops->[$i++];
+                       $ops->[$i++]->($self, $k);
+               }
+               $self->msg_more(")\r\n");
+       }
+       @$uids = ();
+       1; # more
+}
+
 sub cmd_status ($$$;@) {
        my ($self, $tag, $mailbox, @items) = @_;
        return "$tag BAD no items\r\n" if !scalar(@items);
@@ -566,9 +694,8 @@ sub cmd_list ($$$$) {
                # request for hierarchy delimiter
                $l = [ qq[* LIST (\\Noselect) "." ""\r\n] ];
        } elsif ($refname ne '' || $wildcard ne '*') {
-               $wildcard = lc $wildcard;
-               $wildcard =~ s!([^a-z0-9_])!$patmap{$1} // "\Q$1"!eg;
-               $l = [ grep(/ \Q$refname\E$wildcard\r\n\z/s, @$l) ];
+               $wildcard =~ s!([^a-z0-9_])!$patmap{$1} // "\Q$1"!egi;
+               $l = [ grep(/ \Q$refname\E$wildcard\r\n\z/is, @$l) ];
        }
        \(join('', @$l, "$tag OK List done\r\n"));
 }
@@ -710,42 +837,63 @@ sub partial_emit ($$$) {
        }
 }
 
-sub fetch_common ($$$$) {
-       my ($self, $tag, $range_csv, $want) = @_;
-       my $ibx = $self->{ibx} or return "$tag BAD No mailbox selected\r\n";
+sub fetch_compile ($) {
+       my ($want) = @_;
        if ($want->[0] =~ s/\A\(//s) {
-               $want->[-1] =~ s/\)\z//s or return "$tag BAD no rparen\r\n";
+               $want->[-1] =~ s/\)\z//s or return 'BAD no rparen';
        }
-       my (%partial, %want);
+       my (%partial, %seen, @op);
+       my $need = 0;
        while (defined(my $att = shift @$want)) {
                $att = uc($att);
+               next if $att eq 'UID'; # always returned
                $att =~ s/\ABODY\.PEEK\[/BODY\[/; # we're read-only
                my $x = $FETCH_ATT{$att};
                if ($x) {
-                       %want = (%want, %$x);
+                       while (my ($k, $fl_cb) = each %$x) {
+                               next if $seen{$k}++;
+                               $need |= $fl_cb->[0];
+
+                               # insert a special op to convert $bref to $eml
+                               # the first time we need it
+                               if ($need == NEED_EML && !$seen{$need}++) {
+                                       push @op, $OP_EML_NEW;
+                               }
+                               # $fl_cb = [ flags, \&emit_foo ]
+                               push @op, [ @$fl_cb , $k ];
+                       }
                } elsif (!partial_prepare(\%partial, $want, $att)) {
-                       return "$tag BAD param: $att\r\n";
+                       return "BAD param: $att";
                }
        }
+       my @r;
 
        # stabilize partial order for consistency and ease-of-debugging:
        if (scalar keys %partial) {
-               $want{-partial} = [ map {;
-                       [ $_, @{$partial{$_}} ]
-               } sort keys %partial ];
+               $need = NEED_EML;
+               push @op, $OP_EML_NEW if !$seen{$need}++;
+               $r[2] = [ map { [ $_, @{$partial{$_}} ] } sort keys %partial ];
        }
-       $range_csv = 'bad' if $range_csv !~ $valid_range;
-       my $range_info = range_step($self, \$range_csv);
-       return "$tag $range_info\r\n" if !ref($range_info);
-       [ $tag, [], $range_info, \%want ];
+
+       $r[0] = $need & NEED_BLOB ? \&uid_fetch_msg :
+               ($need & NEED_SMSG ? \&uid_fetch_smsg : \&uid_fetch_uid);
+
+       # r[1] = [ $key1, $cb1, $key2, $cb2, ... ]
+       use sort 'stable'; # makes output more consistent
+       $r[1] = [ map { ($_->[2], $_->[1]) } sort { $a->[0] <=> $b->[0] } @op ];
+       @r;
 }
 
-sub cmd_uid_fetch ($$$;@) {
+sub cmd_uid_fetch ($$$$;@) {
        my ($self, $tag, $range_csv, @want) = @_;
-       my $args = fetch_common($self, $tag, $range_csv, \@want);
-       ref($args) eq 'ARRAY' ?
-               long_response($self, \&uid_fetch_m, @$args) :
-               $args; # error
+       my $ibx = $self->{ibx} or return "$tag BAD No mailbox selected\r\n";
+       my ($cb, $ops, $partial) = fetch_compile(\@want);
+       return "$tag $cb\r\n" unless $ops;
+
+       $range_csv = 'bad' if $range_csv !~ $valid_range;
+       my $range_info = range_step($self, \$range_csv);
+       return "$tag $range_info\r\n" if !ref($range_info);
+       long_response($self, $cb, $tag, [], $range_info, $ops, $partial);
 }
 
 sub parse_date ($) { # 02-Oct-1993
@@ -1022,7 +1170,10 @@ sub event_step {
        my $rbuf = $self->{rbuf} // \(my $x = '');
        my $line = index($$rbuf, "\n");
        while ($line < 0) {
-               return $self->close if length($$rbuf) >= LINE_MAX;
+               if (length($$rbuf) >= LINE_MAX) {
+                       $self->write(\"\* BAD request too long\r\n");
+                       return $self->close;
+               }
                $self->do_read($rbuf, LINE_MAX, length($$rbuf)) or return;
                $line = index($$rbuf, "\n");
        }
@@ -1085,9 +1236,7 @@ sub busy {
 sub close {
        my ($self) = @_;
        if (my $ibx = delete $self->{ibx}) {
-               if (my $sock = $self->{sock}) {;
-                       $ibx->unsubscribe_unlock(fileno($sock));
-               }
+               stop_idle($self, $ibx);
        }
        $self->SUPER::close; # PublicInbox::DS::close
 }
@@ -1097,4 +1246,9 @@ no warnings 'once';
 *cmd_select = \&cmd_examine;
 *cmd_fetch = \&cmd_uid_fetch;
 
+package PublicInbox::IMAP_preauth;
+our @ISA = qw(PublicInbox::IMAP);
+
+sub logged_in { 0 }
+
 1;