]> Sergey Matveev's repositories - public-inbox.git/blobdiff - lib/PublicInbox/LeiMailSync.pm
lei_mail_sync: ensure URLs and folder names are stored as binary
[public-inbox.git] / lib / PublicInbox / LeiMailSync.pm
index 522a5ebc865e3e3a6b0e5b89e83f91d72eb226ac..d93a581042fcd0ae17fc7fc5c265810575b488ea 100644 (file)
@@ -1,4 +1,4 @@
-# Copyright (C) 2021 all contributors <meta@public-inbox.org>
+# Copyright (C) all contributors <meta@public-inbox.org>
 # License: AGPL-3.0+ <https://www.gnu.org/licenses/agpl-3.0.txt>
 
 # for maintaining synchronization between lei/store <=> Maildir|MH|IMAP|JMAP
@@ -6,7 +6,7 @@ package PublicInbox::LeiMailSync;
 use strict;
 use v5.10.1;
 use parent qw(PublicInbox::Lock);
-use DBI;
+use DBI qw(:sql_types); # SQL_BLOB
 use PublicInbox::ContentHash qw(git_sha);
 use Carp ();
 
@@ -15,9 +15,9 @@ sub dbh_new {
        my $f = $self->{filename};
        my $creat = $rw && !-s $f;
        if ($creat) {
-               require PublicInbox::Spawn;
+               require PublicInbox::Syscall;
                open my $fh, '+>>', $f or Carp::croak "open($f): $!";
-               PublicInbox::Spawn::nodatacow_fd(fileno($fh));
+               PublicInbox::Syscall::nodatacow_fh($fh);
        }
        my $dbh = DBI->connect("dbi:SQLite:dbname=$f",'','', {
                AutoCommit => 1,
@@ -47,7 +47,8 @@ sub lms_write_prepare { ($_[0]->{dbh} //= dbh_new($_[0], 1)); $_[0] }
 sub lms_pause {
        my ($self) = @_;
        $self->{fmap} = {};
-       delete $self->{dbh};
+       my $dbh = delete $self->{dbh};
+       eval { $dbh->do('PRAGMA optimize') } if $dbh;
 }
 
 sub create_tables {
@@ -89,29 +90,55 @@ CREATE INDEX IF NOT EXISTS idx_fid_name ON blob2name(fid,name)
 
 }
 
+# used to fixup pre-1.7.0 folders
+sub update_fid ($$$) {
+       my ($dbh, $fid, $loc) = @_;
+       my $sth = $dbh->prepare(<<'');
+UPDATE folders SET loc = ? WHERE fid = ?
+
+       $sth->bind_param(1, $loc, SQL_BLOB);
+       $sth->bind_param(2, $fid);
+       $sth->execute;
+}
+
+sub get_fid ($$$) {
+       my ($sth, $folder, $dbh) = @_; # $dbh is set iff RW
+       $sth->bind_param(1, $folder, SQL_BLOB);
+       $sth->execute;
+       my ($fid) = $sth->fetchrow_array;
+       if (defined $fid) { # for downgrade+upgrade (1.8 -> 1.7 -> 1.8)
+               $dbh->do('DELETE FROM folders WHERE loc = ? AND fid != ?',
+                       undef, $folder, $fid) if defined($dbh);
+       } else {
+               $sth->execute($folder); # fixup old stuff
+               ($fid) = $sth->fetchrow_array;
+               update_fid($dbh, $fid, $folder) if defined($fid) && $dbh;
+       }
+       $fid;
+}
+
 sub fid_for {
        my ($self, $folder, $rw) = @_;
        my $dbh = $self->{dbh} //= dbh_new($self, $rw);
-       my $sel = 'SELECT fid FROM folders WHERE loc = ? LIMIT 1';
-       my ($fid) = $dbh->selectrow_array($sel, undef, $folder);
-       return $fid if defined $fid;
+       my $sth = $dbh->prepare_cached(<<'', undef, 1);
+SELECT fid FROM folders WHERE loc = ? LIMIT 1
+
+       my $rw_dbh = $rw ? $dbh : undef;
+       my $fid = get_fid($sth, $folder, $rw_dbh);
+       return $fid if defined($fid);
 
        # caller had trailing slash (LeiToMail)
        if ($folder =~ s!\A((?:maildir|mh):.*?)/+\z!$1!i) {
-               ($fid) = $dbh->selectrow_array($sel, undef, $folder);
+               $fid = get_fid($sth, $folder, $rw_dbh);
                if (defined $fid) {
-                       $dbh->do(<<EOM, undef, $folder, $fid) if $rw;
-UPDATE folders SET loc = ? WHERE fid = ?
-EOM
+                       update_fid($dbh, $fid, $folder) if $rw;
                        return $fid;
                }
        # sometimes we stored trailing slash..
        } elsif ($folder =~ m!\A(?:maildir|mh):!i) {
-               ($fid) = $dbh->selectrow_array($sel, undef, "$folder/");
+               $fid = get_fid($sth, $folder, $rw_dbh);
                if (defined $fid) {
-                       $dbh->do(<<EOM, undef, $folder, $fid) if $rw;
-UPDATE folders SET loc = ? WHERE fid = ?
-EOM
+                       update_fid($dbh, $fid, $folder) if $rw;
                        return $fid;
                }
        } elsif ($rw && $folder =~ m!\Aimaps?://!i) {
@@ -128,8 +155,10 @@ EOM
        $dbh->do('DELETE FROM blob2name WHERE fid = ?', undef, $fid);
        $dbh->do('DELETE FROM blob2num WHERE fid = ?', undef, $fid);
 
-       my $sth = $dbh->prepare('INSERT INTO folders (fid, loc) VALUES (?, ?)');
-       $sth->execute($fid, $folder);
+       $sth = $dbh->prepare('INSERT INTO folders (fid, loc) VALUES (?, ?)');
+       $sth->bind_param(1, $fid);
+       $sth->bind_param(2, $folder, SQL_BLOB);
+       $sth->execute;
 
        $fid;
 }
@@ -181,16 +210,20 @@ sub mv_src {
        my ($self, $folder, $oidbin, $id, $newbn) = @_;
        my $lk = $self->lock_for_scope;
        my $fid = $self->{fmap}->{$folder} //= fid_for($self, $folder, 1);
+       $self->{dbh}->begin_work;
        my $sth = $self->{dbh}->prepare_cached(<<'');
 UPDATE blob2name SET name = ? WHERE fid = ? AND oidbin = ? AND name = ?
 
-       my $nr = $sth->execute($newbn, $fid, $oidbin, $$id);
-       if ($nr == 0) { # may race with a clear_src, ensure new value exists
+       # eval since unique constraint may fail due to race
+       my $nr = eval { $sth->execute($newbn, $fid, $oidbin, $$id) };
+       if (!defined($nr) || $nr == 0) { # $nr may be `0E0'
+               # may race with a clear_src, ensure new value exists
                $sth = $self->{dbh}->prepare_cached(<<'');
 INSERT OR IGNORE INTO blob2name (oidbin, fid, name) VALUES (?, ?, ?)
 
                $sth->execute($oidbin, $fid, $newbn);
        }
+       $self->{dbh}->commit;
 }
 
 # read-only, iterates every oidbin + UID or name for a given folder
@@ -299,17 +332,19 @@ sub locations_for {
 
 # returns a list of folders used for completion
 sub folders {
-       my ($self, $pfx) = @_;
-       my $dbh = $self->{dbh} //= dbh_new($self);
+       my ($self, @pfx) = @_;
        my $sql = 'SELECT loc FROM folders';
-       my @pfx;
-       if (defined $pfx) {
-               $sql .= ' WHERE loc LIKE ? ESCAPE ?';
-               @pfx = ($pfx, '\\');
-               $pfx[0] =~ s/([%_\\])/\\$1/g; # glob chars
-               $pfx[0] .= '%';
+       my $re;
+       if (defined($pfx[0])) {
+               $sql .= ' WHERE loc REGEXP ?'; # DBD::SQLite uses perlre
+               $re = !!$pfx[1] ? '.*' : '';
+               $re .= quotemeta($pfx[0]);
+               $re .= '.*';
        }
-       map { $_->[0] } @{$dbh->selectall_arrayref($sql, undef, @pfx)};
+       my $sth = ($self->{dbh} //= dbh_new($self))->prepare($sql);
+       $sth->bind_param(1, $re) if defined($re);
+       $sth->execute;
+       map { $_->[0] } @{$sth->fetchall_arrayref};
 }
 
 sub local_blob {
@@ -335,9 +370,12 @@ WHERE b.oidbin = ?
                        next unless -s $fh;
                        local $/;
                        my $raw = <$fh>;
-                       if ($vrfy && git_sha(1, \$raw)->hexdigest ne $oidhex) {
-                               warn "$f changed $oidhex\n";
-                               next;
+                       if ($vrfy) {
+                               my $got = git_sha(1, \$raw)->hexdigest;
+                               if ($got ne $oidhex) {
+                                       warn "$f changed $oidhex => $got\n";
+                                       next;
+                               }
                        }
                        return \$raw;
                }
@@ -462,7 +500,7 @@ sub arg2folder {
 # using `$res' instead of `$orig'
 EOM
                        } else {
-                               $lei->err($res) if defined $res;
+                               warn($res, "\n") if defined $res;
                                push @no, $orig;
                        }
                } elsif (m!\A(?:nntps?|s?news)://!i) {
@@ -474,7 +512,7 @@ EOM
 # using `$res' instead of `$orig'
 EOM
                        } else {
-                               $lei->err($res) if defined $res;
+                               warn($res, "\n") if defined $res;
                                push @no, $orig;
                        }
                } else {