Czy ktosia z Was ma z tym praktyczne doświadczenia? Większość modeli wymaga więcej niż 12 GB na karcie grafiki, by generować tekst z modeli głosu. Czy ktosia działa na starszym sprzęcie?

  • naur@tech.pr0n.pl
    link
    fedilink
    Polski
    arrow-up
    3
    ·
    4 days ago

    Niskie wymagania sprzętowe i sporo dostępnych modeli ma Piper.
    Niestety jakością wyraźnie ustępuje dużym modelom. Nie radzi sobie zbyt dobrze z czytaniem liczb i skrótów.
    Do czytania krótkich komunikatów może wystarczyć, ale słuchanie audiobooka wygenerowanego tym TTS byłoby chyba męczące.

  • gfle@szmer.info
    link
    fedilink
    Polski
    arrow-up
    3
    ·
    5 days ago

    Kilka ładnych lat temu miałem czytnik Boox ze zingegrowaną Ivoną. Tak więc był to TTS, a nie AI, natomiast działało na naprawdę bieda sprzęcie.

    Czy brzmiało naturalnie? Nie, doskonale było słychać, że to TTS. Ale było bardziej niż zrozumiałe, i w sumie kilka książek tak przesłuchałem.

    • deck5955@szmer.infoOP
      link
      fedilink
      Polski
      arrow-up
      2
      ·
      5 days ago

      dzięki, ja na tej zasadzie używałem programu Balabolka i polskich “głosów” z githuba. Konwertnąłem sobie tak “Podróż do kresu nocy” i niezbyt się jednak dało słuchać, dlatego pytam o Wasze doświadczenia z łączeniem AI z TTS

      • gfle@szmer.info
        link
        fedilink
        Polski
        arrow-up
        2
        ·
        edit-2
        5 days ago

        Kiedyś szukałem bezpłatnego TTSa do prostego projekciku mającego działać na śmieciowym sprzęcie i znalazłem coś takiego: https://github.com/coqui-ai/TTS Brzmiało zrozumiale i działało na zwykłym laptopie bez większych problemów. Ale testowałem tylko na krótkich komunikatach.