From: Sergey Matveev Date: Mon, 18 Mar 2024 07:09:35 +0000 (+0300) Subject: whisper.cpp то может и не работать X-Git-Url: http://www.git.stargrave.org/?a=commitdiff_plain;h=0a1f29f947892a13635bec94abdabcd1e9c55179;p=stargrave-blog.git whisper.cpp то может и не работать https://github.com/ggerganov/whisper.cpp/issues/1949 Поставил я тут распознаваться подкасты linkmeup-а (46e4d23a23a10eb1c05e5a20f0ceeebd5ff31016). Наобум взял один результирующий .txt файл и увидел: [00:50:46.080 --> 00:50:47.080] Внутри нашего, например, дата-центра, 800-гига-модов. [00:50:47.080 --> 00:50:48.080] То есть мы будем делать все, что угодно. [00:50:48.080 --> 00:50:49.080] То есть, мы будем делать все, что угодно. [00:50:49.080 --> 00:50:50.080] То есть, мы будем делать все, что угодно. и на час понёсся повтор одной и той же строчки. Взял наобум другой файл: [02:12:14.680 --> 02:12:17.580] очень активно развиваться. [02:12:17.580 --> 02:12:19.580] Это будет очень активно развиваться. [02:12:19.580 --> 02:12:21.580] И это будет очень активно развиваться. [02:12:21.580 --> 02:12:24.580] И это будет очень активно развиваться. [02:12:24.580 --> 02:12:27.580] И это будет очень активно развиваться. [02:12:27.580 --> 02:12:29.580] Это будет очень активно развиваться. [02:12:29.580 --> 02:12:31.580] Это будет очень активно развиваться. [02:12:31.580 --> 02:12:33.580] Это будет очень активно развиваться. [...] Нашёл багу в трэкере GitHub, где народ жалуется на аналогичное, даже использует тот же коммит. Если начать распознавать с seek-ом, то loop не возникает на этих участках. Короче глаз да глаз нужны. ---