]> Sergey Matveev's repositories - public-inbox.git/blobdiff - lib/PublicInbox/LeiImport.pm
lei import: start rearranging code for IMAP support
[public-inbox.git] / lib / PublicInbox / LeiImport.pm
index a63bfdfd7cea49040f63791a79d3da2d082d01fd..b25d7e97987286a3b3f43e8a3b16ca5a02a1b214 100644 (file)
@@ -6,7 +6,6 @@ package PublicInbox::LeiImport;
 use strict;
 use v5.10.1;
 use parent qw(PublicInbox::IPC);
-use PublicInbox::MboxReader;
 use PublicInbox::Eml;
 use PublicInbox::InboxWritable qw(eml_from_path);
 use PublicInbox::PktOp;
@@ -30,17 +29,21 @@ sub import_done { # EOF callback for main daemon
        $imp->wq_wait_old(\&import_done_wait, $lei);
 }
 
-sub call { # the main "lei import" method
-       my ($cls, $lei, @argv) = @_;
-       my $sto = $lei->_lei_store(1);
-       $sto->write_prepare($lei);
-       $lei->{opt}->{kw} //= 1;
+sub check_fmt ($;$) {
+       my ($lei, $f) = @_;
        my $fmt = $lei->{opt}->{'format'};
-       my $self = $lei->{imp} = bless {}, $cls;
-       if (my @f = grep { -f } @argv && !$fmt) {
-               return $lei->fail("--format unset for regular files:\n@f");
+       if (!$fmt) {
+               my $err = $f ? "regular file(s):\n@$f" : '--stdin';
+               return $lei->fail("--format unset for $err");
        }
-       $self->{0} = $lei->{0} if $lei->{opt}->{stdin};
+       return 1 if $fmt eq 'eml';
+       require PublicInbox::MboxReader;
+       PublicInbox::MboxReader->can($fmt) ||
+                               $lei->fail( "--format=$fmt unrecognized\n");
+}
+
+sub do_import {
+       my ($lei) = @_;
        my $ops = {
                '!' => [ $lei->can('fail_handler'), $lei ],
                'x_it' => [ $lei->can('x_it'), $lei ],
@@ -48,14 +51,19 @@ sub call { # the main "lei import" method
                '' => [ \&import_done, $lei ],
        };
        ($lei->{pkt_op_c}, $lei->{pkt_op_p}) = PublicInbox::PktOp->pair($ops);
-       my $j = $lei->{opt}->{jobs} // scalar(@argv) || 1;
-       my $nproc = $self->detect_nproc;
-       $j = $nproc if $j > $nproc;
+       my $self = $lei->{imp};
+       my $j = $lei->{opt}->{jobs} // scalar(@{$self->{argv}}) || 1;
+       if (my $nrd = $lei->{nrd}) {
+               # $j = $nrd->net_concurrency($j); TODO
+       } else {
+               my $nproc = $self->detect_nproc;
+               $j = $nproc if $j > $nproc;
+       }
        $self->wq_workers_start('lei_import', $j, $lei->oldset, {lei => $lei});
        my $op = delete $lei->{pkt_op_c};
        delete $lei->{pkt_op_p};
        $self->wq_io_do('import_stdin', []) if $self->{0};
-       for my $x (@argv) {
+       for my $x (@{$self->{argv}}) {
                $self->wq_io_do('import_path_url', [], $x);
        }
        $self->wq_close(1);
@@ -65,6 +73,36 @@ sub call { # the main "lei import" method
        }
 }
 
+sub call { # the main "lei import" method
+       my ($cls, $lei, @argv) = @_;
+       my $sto = $lei->_lei_store(1);
+       $sto->write_prepare($lei);
+       $lei->{opt}->{kw} //= 1;
+       my $self = $lei->{imp} = bless { argv => \@argv }, $cls;
+       if ($lei->{opt}->{stdin}) {
+               @argv and return
+                       $lei->fail("--stdin and locations (@argv) do not mix");
+               check_fmt($lei) or return;
+               $self->{0} = $lei->{0};
+       } else {
+               my @f;
+               for my $x (@argv) {
+                       if (-f $x) { push @f, $x }
+                       elsif (-d _) { require PublicInbox::MdirReader }
+                       else {
+                               require PublicInbox::NetReader;
+                               $lei->{nrd} //= PublicInbox::NetReader->new;
+                               $lei->{nrd}->add_url($x);
+                       }
+               }
+               if (@f) { check_fmt($lei, \@f) or return }
+               if ($lei->{nrd} && (my @err = $lei->{nrd}->errors)) {
+                       return $lei->fail(@err);
+               }
+       }
+       do_import($lei);
+}
+
 sub ipc_atfork_child {
        my ($self) = @_;
        $self->{lei}->lei_atfork_child;
@@ -83,11 +121,9 @@ error reading $x: $!
 
                        my $eml = PublicInbox::Eml->new(\$buf);
                        _import_eml($eml, $lei->{sto}, $set_kw);
-               } else { # some mbox
-                       my $cb = PublicInbox::MboxReader->can($fmt);
-                       $cb or return $lei->child_error(1 >> 8, <<"");
---format $fmt unsupported for $x
-
+               } else { # some mbox (->can already checked in call);
+                       my $cb = PublicInbox::MboxReader->can($fmt) //
+                               die "BUG: bad fmt=$fmt";
                        $cb->(undef, $fh, \&_import_eml, $lei->{sto}, $set_kw);
                }
        };
@@ -109,8 +145,7 @@ unable to open $x: $!
 
                _import_fh($lei, $fh, $x);
        } elsif (-d _ && (-d "$x/cur" || -d "$x/new")) {
-               require PublicInbox::LeiToMail;
-               PublicInbox::LeiToMail::maildir_each_file($x,
+               PublicInbox::MdirReader::maildir_each_file($x,
                                        \&_import_maildir,
                                        $lei->{sto}, $lei->{opt}->{kw});
        } else {