]> Sergey Matveev's repositories - stargrave-blog.git/commitdiff
whisper.cpp то может и не работать
authorSergey Matveev <stargrave@stargrave.org>
Mon, 18 Mar 2024 07:09:35 +0000 (10:09 +0300)
committerSergey Matveev <stargrave@stargrave.org>
Mon, 18 Mar 2024 07:40:00 +0000 (10:40 +0300)
https://github.com/ggerganov/whisper.cpp/issues/1949
Поставил я тут распознаваться подкасты linkmeup-а
(46e4d23a23a10eb1c05e5a20f0ceeebd5ff31016). Наобум взял один
результирующий .txt файл и увидел:

    [00:50:46.080 --> 00:50:47.080]   Внутри нашего, например, дата-центра, 800-гига-модов.
    [00:50:47.080 --> 00:50:48.080]   То есть мы будем делать все, что угодно.
    [00:50:48.080 --> 00:50:49.080]   То есть, мы будем делать все, что угодно.
    [00:50:49.080 --> 00:50:50.080]   То есть, мы будем делать все, что угодно.

и на час понёсся повтор одной и той же строчки. Взял наобум другой файл:

    [02:12:14.680 --> 02:12:17.580]   очень активно развиваться.
    [02:12:17.580 --> 02:12:19.580]   Это будет очень активно развиваться.
    [02:12:19.580 --> 02:12:21.580]   И это будет очень активно развиваться.
    [02:12:21.580 --> 02:12:24.580]   И это будет очень активно развиваться.
    [02:12:24.580 --> 02:12:27.580]   И это будет очень активно развиваться.
    [02:12:27.580 --> 02:12:29.580]   Это будет очень активно развиваться.
    [02:12:29.580 --> 02:12:31.580]   Это будет очень активно развиваться.
    [02:12:31.580 --> 02:12:33.580]   Это будет очень активно развиваться.
    [...]

Нашёл багу в трэкере GitHub, где народ жалуется на аналогичное, даже
использует тот же коммит.

Если начать распознавать с seek-ом, то loop не возникает на этих
участках. Короче глаз да глаз нужны.


No differences found