Hörbücher von Software gesprochen

ultimat2k · 8 Oktober 2024

Es kam in einem Board die Diskussion auf, was man mit Hörbüchern macht, die von einer Software vorgelesen werden ( Text-To-Speach - TTS) anstatt von einem richtigen Menschen.
Das wollte ich auch hier mal zur Sprache bringen. Meiner Meinung nach sollten solche Hörbücher nicht erlaubt werden und wenn doch, muss man im Titel klar darauf hinweisen.
Ich habe zufällig so ein Hörbuch geladen und auch für mich war das nix.

XO. · 8 Oktober 2024

ultimat2k schrieb:
Bitte, Anmelden oder Registrieren um den Inhalt zu sehen!

Da fehlt nicht nur der Mensch, der da vorliest. Da fehlen sämtlich Emotionen.

ultimat2k schrieb:
Bitte, Anmelden oder Registrieren um den Inhalt zu sehen!

Bei Bedarf mal melden.

BalmungD · 8 Oktober 2024

Also ich finde das nicht schlimm.

Ein paar Bücher gibt es einfach nicht als Audio Book da wäre mir schon manchmal eine Gesprochene Version lieb und bei dem einen oder anderen Buch hab ich mir schon gedacht ... boar das kann man sich nicht anhören.

tastebin · 8 Oktober 2024

Wenn man das entsprechend deklariert, so das jeder im Vorfeld entscheiden kann ob er sich das antut isses in meinem Augen nicht so schlimm. Die Enttäuschung versteh ich gut. Ich habe das auch schon versucht.🫣 Da ist qualitativ noch richtig viel Luft nach oben.

Tilly · 8 Oktober 2024

Dafür gibt es doch Lösungen !

EBook, PDF usw. können über KI eingelesen und mit einer Sprache, nach Wahl, wiedergegeben werden.

Dieses geht ebenso mit Emotionen, Gefühle usw. ! Dafür gibt es selbst kostenlose Tools.

Empfehlen würde ich dafür Stable Diffusion Automatic1111 und die passenden Anwendungen. Dafür gibt es genug Open Source Anwendungen.

Die Stimmen hören sich nicht wie Roboter an sondern menschlich.

Man kann die Datei danach noch beliebig ändern wie zB. leise Musik im Hintergrund.

Geile Sache !

Einfach nur Text to Speech kann müllig sein. Das kann man lieber selber machen.
So wie man es will ! Bücher als .pdf gibt es im Netz reichlich.

Ebenso kann man solche mülligen Hörbücher selber als Speech to Text wandeln und dieses ändern.

GuyFawkes667 · 8 Oktober 2024

BalmungD schrieb:
Bitte, Anmelden oder Registrieren um den Inhalt zu sehen!

Na, das ist ja wirklich Geschmackssache.

BalmungD schrieb:
Bitte, Anmelden oder Registrieren um den Inhalt zu sehen!

Geht mir mit jedem Hörbuch (nicht Hörspiel) mit David Nathan so. Ich ertrage den seine monotone Lesungen einfach null.
Aber als jemand, der halt Simon Jäger als Sprecher aller Christopher Moore Hörbücher erlebt habe, ist das wohl kein Wunder.
Mark Bremer ist mir als Synchrosprecher auch massiv ans Herz gewachsen.
Und damn, was vermisse ich Franzika Pigulla.
Wenn es etwas nicht als Hörbuch gibt, kaufe ich mir lieber das Werk in Papierform. (Wobei ich viel zu viel Papier ansammle, obwohl ich es als Hörbuch hatte. Bücher machen sich einfach nur gut im Schrank. Ich LIEBE Bücher^^)

level9 · 10 Oktober 2024

Tilly schrieb:
Bitte, Anmelden oder Registrieren um den Inhalt zu sehen!

Wenn Du damit offenbar Erfahrung hast, poste doch mal ein Sample.

Tilly · 10 Oktober 2024

Ich habe einmal kurz eine Hörprobe erstellt aus Der dunkle Turm ! Ich habe dieses als Epub in .pdf gewandelt und Text generiert zur Sprache !

Die könnt Ihr hier runterladen =

Bitte, Anmelden oder Registrieren um die Links zu sehen!

Nach 30 Tagen wird der Link automatisch gelöscht und steht dann nicht mehr zur Verfügung !

Ich finde das dieses durchaus gelungen gut ist und man so auch seine eigenen EBook´s als Hörbuch wandeln kann.

Über KI lässt sich vieles machen. Ich arbeite zb. derzeit noch daran vollständige Videos via VoiceCloning zu übersetzen.

Ich habe eine türkische Serie die es nicht auf Deutsch gibt oder sogar nie geben wird (Destan - The Princess Warrior 2021).

Diese Serie will ich komplett mit den Originalstimmen in Deutsch übersetzen.

Die Untertitel habe ich bereits in Deutsch erstellt (falls ich die überhaupt brauche). Jetzt warte ich nur noch auf meine neue Grafikkarte und dann
kann es eigentlich losgehen.

Buster_01 · 10 Oktober 2024

Tilly schrieb:
Bitte, Anmelden oder Registrieren um den Inhalt zu sehen!

Danke!
Kann man sich anhören.

Höre ja Hörbücher und auch Hörspiele, teils Original, gibt aber auch Bücher, die jemand selber eingesprochen hat,
das so was auch mit KI geht, kannte ich noch nicht.

Tilly · 10 Oktober 2024

Buster_01 schrieb:
Bitte, Anmelden oder Registrieren um den Inhalt zu sehen!

Das ist auch gar nicht so schwer. Wenn man die richtigen Programme hat dann kann man seine Zeit damit vertreiben und richtig was Schönes daraus machen.
Wie auch zB. die Titelmusik im Hintergrund mit einfügen oder die original deutschen Synchronsprecher (VoiceCloning) vorlesen lassen.

level9 · 10 Oktober 2024

Ja gut, schade, ein 14 sekündiges Sample gibt aber nicht so viel Eindruck wieder. Das ist ja "nicht viel mehr" als Text-to-Speech zu einer der neueren KI-Sprachmodelle wie Elevenlabs. Die 'lesen' zwar schon relativ natürlich, aber eben auch nicht entsprechend mit Emotionen oder gar leicht angepasster Stimme für die verschiedenen Sprecherrollen.

Klar, besser als nichts und schon viel mehr als die bisherigen TTS-Versuche, aber schon doch noch weg von 'nem Menschen.

Schwabbel · 10 Oktober 2024

Ich les Euch gern da was vor - wenns mit fränkischen Akzent in Ordnung geht

...frali, des nemma doch etz a so...

DrMabuse1977 · 11 Oktober 2024

Tilly schrieb:
Bitte, Anmelden oder Registrieren um den Inhalt zu sehen!

Ja, ist auch nicht schlecht. Ich würde gerne etwas mehr davon hören, am liebsten etwas, wo Dialoge gelesen werden, hier ist es halt die Sache, ob man dem auch folgen kann.

Und dann würde mich natürlich dein Workflow, inkl. genutzter Programme interessieren, es geht mir hier um zwei Schriftsteller, wo es bei dem einen kaum etwas, beim anderen gar nichts in deutsch gibt: Robert Ludlum und Steve Berry.

tastebin · 11 Oktober 2024

@DrMabuse1977 exakt mein denken. Wäre auch interessiert. Keine Ahnung ob ne 1050 das packt. Aber es gibt ja auch workarounds für cpu

Edit: Ohmann, das wäre so geil... Dean Koontz

Shadowhead · 12 Oktober 2024

@Tilly
Wäre interessiert, damit meine Kurzgeschichten, evt. auch die Romane, zu vertonen.
Was brauche ich dafür an Programmen und Systemvoraussetzungen?

level9 · 12 Oktober 2024

Zum Mal herumprobieren kannst Du das hier mal testen:

Bitte, Anmelden oder Registrieren um die Links zu sehen!

Damit hab ich mal aus einer Rede von unseren Bundeskanzler einen Voiceclon erstellt und "ihn" damit jemanden einen Geburtstagsgruß einsprechen lassen.
Das klang schon unglaublich echt, weil er da in seinem "Redemodus" war und auch die Grußnachricht entsprechend wie eine kleine Rede 'rüberkam.

Längere Texte kosten halt...

DrMabuse1977 · 12 Oktober 2024

tastebin schrieb:
Bitte, Anmelden oder Registrieren um den Inhalt zu sehen!

...und Alan Burt Akers (ich darf erst gar nicht anfangen drüber nachzudenken)

Shadowhead · 13 Oktober 2024

@level9
Ich bräuchte schon eine deutsche Stimme.

level9 · 13 Oktober 2024

Elevenlabs erzeugt problemlos deutsche Stimmen.

Tilly · 15 Oktober 2024

Es gibt etliche Tools um Text zu Sprache (Text to Speech) zu wandeln.
Balabolka zB. ist free und unter Windows zu nutzen. Mehrere Sprachen kann man nach installieren.

Gibt es hier =

Bitte, Anmelden oder Registrieren um die Links zu sehen!

Ich selber nutze Automatic1111.

Hierbei muss Python, GIT und Automatic 1111 installiert werden.

Anleitung =

Bitte, Anmelden oder Registrieren um die Links zu sehen!

Die Installation muss peinlichst genau gemacht werden. Sonst funzt es nicht.

Anleitungen dazu gibt es reichlich. Hier muss man sich nur die Richtige aussuchen. Es hängt davon ab welche GPU genutzt wird. Ob AMD, Nvidia oder Intel.
Bei Automatic kann man sich dann Open Vino und Open Voice installieren und dementsprechend nutzen.
Es gibt es dort den Punkt Extensions. Einmal darauf klicken dann werden sie im unteren Bereich angezeigt.

Hier kann man sich einige aussuchen und installieren. Danach muss Automatic1111 neu gestartet werden.

Auch gibt es bei Github oder Huggingface.co genug Tools für Text to Speech.

Bei einigen braucht man nur die PDF oder Epub ins Fenster ziehen.
Es wird automatisch der Text gezeigt.

Die entsprechenden Einstellungen vornehmen und generieren.

" Anleitungen beim installieren beachten."

Man kann das Beste für sich aussuchen.

Ohne Models läuft es zwar aber man muss dieses dann selber anlernen.

Lasst es ! Dauert zu lang und umständlich.

Ladet Euch die Models herunter und legt sie in den Ordner Models in Automatic1111 ab. Diese Models sind vortrainiert (Deep Learning).
Bei Hugging gibt es eine große Auswahl. Einfach runterladen und in den Ordner damit.
Sehr wichtig bei der Installation von Python ist das Häckchen bei "add to PATH". Das muss gesetzt werden sonst funktioniert es nicht.
Automatic1111 habe ich mir als Ordner auf den Desktop gelegt und in dem Ordner die "cmd" Eingaben gemacht.
So landen die Installationen genau dorthin wo sie hin sollen.

Ich kann jetzt nicht für jede Graka einen Workflow schreiben. Für AMD gibt es diese Anleitung =

Bitte, Anmelden oder Registrieren um die Links zu sehen!

Bei Nvidia Karten passt eigentlich jede Stable Diffusion.

Intel und für die anderen GPU's kann man auch diese Anleitung nehmen =

Bitte, Anmelden oder Registrieren um die Links zu sehen!

Jetzt sollte man eigentlich genug Input haben um die richtige Automatic1111 für sich zu finden.
Wenn sich Automatic weigert zu starten gibt es am Ende der Installation einen Hinweis im Terminal was zu tun ist.

Den befolgen oder Info im Netz suchen. Nur nicht aufgeben, da die Fehler schnell zu beheben sind.

Ich selber habe das Ganze schon sehr oft wieder gelöscht und neu installiert, da es nicht funktionierte. Wenn es aber läuft dann läuft es auch.

Vorsicht bei DeOldify ! Hier ist Nymph ein Problem. Es kann sein das es dann mit AMD oder Intel nicht mehr läuft. Dann den Ordner in Automatic löschen !

DeOldify ist zum Colorieren von schwarz / weiß Fotos und schwarz / weiß Videos gedacht.

Auch hier gibt es Farbschwankungen wie bei jedem anderen Programm aber DeOldify ist eindeutig das Beste was es gibt.

Viel Spaß beim tüfteln, antesten und installieren !

Beachtet das alles Open Source ist (also kostenlos).
Ebenso soll Automatic1111 die beste Stable Diffusion sein. Zumindest als Open Source.
Es gibt dafür alles was man haben will auf Github und Huggingface.co !
Auch rendern, Upscalen von Videos, Face Swap, colorieren, Text to Speech, GPT, Musik machen, Singen mit der eigenen Stimme, Fotos erstellen, eigene Videos produzieren, Videos mit einer anderen Sprache ins Deutsche mit der Sprache der Darsteller übersetzen (Voice Cloning) usw. usw. usw. !

Hörbücher von Software gesprochen

Namhafter Pirat

Möchte Gern Pirat

Namhafter Pirat

InventarNr. #290621

Namhafter Pirat

Namhafter Pirat

Pirate of the 777-Seas

Namhafter Pirat

Namhafter Pirat

Namhafter Pirat

Pirate of the 777-Seas

ich bin nicht dick

Namhafter Pirat

InventarNr. #290621

Der wahre Captain

Pirate of the 777-Seas

Namhafter Pirat

Der wahre Captain

Pirate of the 777-Seas

Namhafter Pirat