From 0a1f29f947892a13635bec94abdabcd1e9c55179 Mon Sep 17 00:00:00 2001 From: Sergey Matveev Date: Mon, 18 Mar 2024 10:09:35 +0300 Subject: [PATCH] =?utf8?q?whisper.cpp=20=D1=82=D0=BE=20=D0=BC=D0=BE=D0=B6?= =?utf8?q?=D0=B5=D1=82=20=D0=B8=20=D0=BD=D0=B5=20=D1=80=D0=B0=D0=B1=D0=BE?= =?utf8?q?=D1=82=D0=B0=D1=82=D1=8C?= MIME-Version: 1.0 Content-Type: text/plain; charset=utf8 Content-Transfer-Encoding: 8bit https://github.com/ggerganov/whisper.cpp/issues/1949 Поставил я тут распознаваться подкасты linkmeup-а (46e4d23a23a10eb1c05e5a20f0ceeebd5ff31016). Наобум взял один результирующий .txt файл и увидел: [00:50:46.080 --> 00:50:47.080] Внутри нашего, например, дата-центра, 800-гига-модов. [00:50:47.080 --> 00:50:48.080] То есть мы будем делать все, что угодно. [00:50:48.080 --> 00:50:49.080] То есть, мы будем делать все, что угодно. [00:50:49.080 --> 00:50:50.080] То есть, мы будем делать все, что угодно. и на час понёсся повтор одной и той же строчки. Взял наобум другой файл: [02:12:14.680 --> 02:12:17.580] очень активно развиваться. [02:12:17.580 --> 02:12:19.580] Это будет очень активно развиваться. [02:12:19.580 --> 02:12:21.580] И это будет очень активно развиваться. [02:12:21.580 --> 02:12:24.580] И это будет очень активно развиваться. [02:12:24.580 --> 02:12:27.580] И это будет очень активно развиваться. [02:12:27.580 --> 02:12:29.580] Это будет очень активно развиваться. [02:12:29.580 --> 02:12:31.580] Это будет очень активно развиваться. [02:12:31.580 --> 02:12:33.580] Это будет очень активно развиваться. [...] Нашёл багу в трэкере GitHub, где народ жалуется на аналогичное, даже использует тот же коммит. Если начать распознавать с seek-ом, то loop не возникает на этих участках. Короче глаз да глаз нужны. -- 2.50.0