]> Sergey Matveev's repositories - public-inbox.git/blobdiff - lib/PublicInbox/GitAsyncCat.pm
No ext_urls
[public-inbox.git] / lib / PublicInbox / GitAsyncCat.pm
index 8a54c608d7e1a87fa34c58e53822ca8bb1d8114f..c428f6ef0a520851e209365289060decbe250d4a 100644 (file)
-# Copyright (C) 2020 all contributors <meta@public-inbox.org>
+# Copyright (C) all contributors <meta@public-inbox.org>
 # License: AGPL-3.0+ <https://www.gnu.org/licenses/agpl-3.0.txt>
 #
 # internal class used by PublicInbox::Git + PublicInbox::DS
 # This parses the output pipe of "git cat-file --batch"
-#
-# Note: this does NOT set the non-blocking flag, we expect `git cat-file'
-# to be a local process, and git won't start writing a blob until it's
-# fully read.  So minimize context switching and read as much as possible
-# and avoid holding a buffer in our heap any longer than it has to live.
 package PublicInbox::GitAsyncCat;
-use strict;
+use v5.12;
 use parent qw(PublicInbox::DS Exporter);
+use PublicInbox::DS qw(awaitpid);
+use POSIX qw(WNOHANG);
 use PublicInbox::Syscall qw(EPOLLIN EPOLLET);
-our @EXPORT = qw(git_async_cat);
+our @EXPORT = qw(ibx_async_cat ibx_async_prefetch async_check);
+use PublicInbox::Git ();
+
+our $GCF2C; # singleton PublicInbox::Gcf2Client
+
+sub close {
+       my ($self) = @_;
+       if (my $git = delete $self->{git}) {
+               $git->async_abort;
+       }
+       $self->SUPER::close; # PublicInbox::DS::close
+}
+
+sub aclose { $_[1]->close } # ignore PID ($_[0])
 
 sub event_step {
        my ($self) = @_;
-       my $gitish = $self->{gitish};
-       return $self->close if ($gitish->{in} // 0) != ($self->{sock} // 1);
-       my $inflight = $gitish->{inflight};
+       my $git = $self->{git} or return;
+       return $self->close if ($git->{in} // 0) != ($self->{sock} // 1);
+       my $inflight = $git->{inflight};
        if ($inflight && @$inflight) {
-               $gitish->cat_async_step($inflight);
-               $self->requeue if @$inflight || exists $gitish->{cat_rbuf};
+               $git->cat_async_step($inflight);
+
+               # child death?
+               if (($git->{in} // 0) != ($self->{sock} // 1)) {
+                       $self->close;
+               } elsif (@$inflight || exists $git->{rbuf}) {
+                       # ok, more to do, requeue for fairness
+                       $self->requeue;
+               }
        }
 }
 
-sub git_async_cat ($$$$) {
-       my ($git, $oid, $cb, $arg) = @_;
-       my $gitish = $git->{gcf2c}; # PublicInbox::Gcf2Client
-       if ($gitish) {
-               $oid .= " $git->{git_dir}";
-       } else {
-               $gitish = $git;
+sub watch_cat {
+       my ($git) = @_;
+       $git->{async_cat} //= do {
+               my $self = bless { git => $git }, __PACKAGE__;
+               $git->{in}->blocking(0);
+               $self->SUPER::new($git->{in}, EPOLLIN|EPOLLET);
+               awaitpid($git->{pid}, \&aclose, $self);
+               \undef; # this is a true ref()
+       };
+}
+
+sub ibx_async_cat ($$$$) {
+       my ($ibx, $oid, $cb, $arg) = @_;
+       my $git = $ibx->{git} // $ibx->git;
+       # {topdir} means ExtSearch (likely [extindex "all"]) with potentially
+       # 100K alternates.  git(1) has a proposed patch for 100K alternates:
+       # <https://lore.kernel.org/git/20210624005806.12079-1-e@80x24.org/>
+       if (!defined($ibx->{topdir}) && !defined($git->{-tmp}) &&
+               ($GCF2C //= eval {
+               require PublicInbox::Gcf2Client;
+               PublicInbox::Gcf2Client::new();
+       } // 0)) { # 0: do not retry if libgit2 or Inline::C are missing
+               $GCF2C->gcf2_async(\"$oid $git->{git_dir}\n", $cb, $arg);
+               \undef;
+       } else { # read-only end of git-cat-file pipe
+               $git->cat_async($oid, $cb, $arg);
+               watch_cat($git);
        }
-       $gitish->cat_async($oid, $cb, $arg);
-       $gitish->{async_cat} //= do {
-               my $self = bless { gitish => $gitish }, __PACKAGE__;
-               $self->SUPER::new($gitish->{in}, EPOLLIN|EPOLLET);
+}
+
+sub async_check ($$$$) {
+       my ($ibx, $oidish, $cb, $arg) = @_; # $ibx may be $ctx
+       my $git = $ibx->{git} // $ibx->git;
+       $git->check_async($oidish, $cb, $arg);
+       return watch_cat($git) if $git->{-bc}; # --batch-command
+       $git->{async_chk} //= do {
+               my $self = bless { git => $git }, 'PublicInbox::GitAsyncCheck';
+               $git->{in_c}->blocking(0);
+               $self->SUPER::new($git->{in_c}, EPOLLIN|EPOLLET);
+               awaitpid($git->{pid_c}, \&aclose, $self);
                \undef; # this is a true ref()
        };
 }
 
+# this is safe to call inside $cb, but not guaranteed to enqueue
+# returns true if successful, undef if not.  For fairness, we only
+# prefetch if there's no in-flight requests.
+sub ibx_async_prefetch {
+       my ($ibx, $oid, $cb, $arg) = @_;
+       my $git = $ibx->git;
+       if (!defined($ibx->{topdir}) && $GCF2C) {
+               if (!@{$GCF2C->{inflight} // []}) {
+                       $oid .= " $git->{git_dir}\n";
+                       return $GCF2C->gcf2_async(\$oid, $cb, $arg); # true
+               }
+       } elsif ($git->{async_cat}) {
+               return $git->async_prefetch($oid, $cb, $arg);
+       }
+       undef;
+}
+
+1;
+package PublicInbox::GitAsyncCheck;
+use v5.12;
+our @ISA = qw(PublicInbox::GitAsyncCat);
+use POSIX qw(WNOHANG);
+use PublicInbox::Syscall qw(EPOLLIN EPOLLET);
+
+sub event_step {
+       my ($self) = @_;
+       my $git = $self->{git} or return;
+       return $self->close if ($git->{in_c} // 0) != ($self->{sock} // 1);
+       my $inflight = $git->{inflight_c};
+       if ($inflight && @$inflight) {
+               $git->check_async_step($inflight);
+
+               # child death?
+               if (($git->{in_c} // 0) != ($self->{sock} // 1)) {
+                       $self->close;
+               } elsif (@$inflight || exists $git->{rbuf_c}) {
+                       # ok, more to do, requeue for fairness
+                       $self->requeue;
+               }
+       }
+}
+
 1;