Hörbücher von Software gesprochen

ultimat2k

Namhafter Pirat
Registriert
4 Mai 2022
Beiträge
145
Erhaltene Likes
142
Es kam in einem Board die Diskussion auf, was man mit Hörbüchern macht, die von einer Software vorgelesen werden ( Text-To-Speach - TTS) anstatt von einem richtigen Menschen.
Das wollte ich auch hier mal zur Sprache bringen. Meiner Meinung nach sollten solche Hörbücher nicht erlaubt werden und wenn doch, muss man im Titel klar darauf hinweisen.
Ich habe zufällig so ein Hörbuch geladen und auch für mich war das nix.
 

XO.

Möchte Gern Pirat
Crew
Registriert
9 Mai 2021
Beiträge
1.095
Erhaltene Likes
2.686
Kommentieren

BalmungD

Namhafter Pirat
Registriert
11 November 2021
Beiträge
120
Erhaltene Likes
172
Also ich finde das nicht schlimm.

Ein paar Bücher gibt es einfach nicht als Audio Book da wäre mir schon manchmal eine Gesprochene Version lieb und bei dem einen oder anderen Buch hab ich mir schon gedacht ... boar das kann man sich nicht anhören.
 
Kommentieren

tastebin

InventarNr. #290621
Crew
Registriert
29 Juni 2021
Beiträge
2.829
Erhaltene Likes
6.296
Wenn man das entsprechend deklariert, so das jeder im Vorfeld entscheiden kann ob er sich das antut isses in meinem Augen nicht so schlimm. Die Enttäuschung versteh ich gut. Ich habe das auch schon versucht.🫣 Da ist qualitativ noch richtig viel Luft nach oben.
 
Kommentieren

Tilly

Namhafter Pirat
Registriert
5 August 2023
Beiträge
96
Erhaltene Likes
192
Dafür gibt es doch Lösungen !

EBook, PDF usw. können über KI eingelesen und mit einer Sprache, nach Wahl, wiedergegeben werden.

Dieses geht ebenso mit Emotionen, Gefühle usw. ! Dafür gibt es selbst kostenlose Tools.

Empfehlen würde ich dafür Stable Diffusion Automatic1111 und die passenden Anwendungen. Dafür gibt es genug Open Source Anwendungen.

Die Stimmen hören sich nicht wie Roboter an sondern menschlich.

Man kann die Datei danach noch beliebig ändern wie zB. leise Musik im Hintergrund.

Geile Sache !

Einfach nur Text to Speech kann müllig sein. Das kann man lieber selber machen.
So wie man es will ! Bücher als .pdf gibt es im Netz reichlich.

Ebenso kann man solche mülligen Hörbücher selber als Speech to Text wandeln und dieses ändern.
 
Zuletzt bearbeitet:
Kommentieren

GuyFawkes667

Namhafter Pirat
Registriert
21 September 2021
Beiträge
1.711
Erhaltene Likes
4.019
Bitte, Anmelden oder Registrieren um den Inhalt zu sehen!
Na, das ist ja wirklich Geschmackssache.
Bitte, Anmelden oder Registrieren um den Inhalt zu sehen!
Geht mir mit jedem Hörbuch (nicht Hörspiel) mit David Nathan so. Ich ertrage den seine monotone Lesungen einfach null.
Aber als jemand, der halt Simon Jäger als Sprecher aller Christopher Moore Hörbücher erlebt habe, ist das wohl kein Wunder.
Mark Bremer ist mir als Synchrosprecher auch massiv ans Herz gewachsen.
Und damn, was vermisse ich Franzika Pigulla.
Wenn es etwas nicht als Hörbuch gibt, kaufe ich mir lieber das Werk in Papierform. (Wobei ich viel zu viel Papier ansammle, obwohl ich es als Hörbuch hatte. Bücher machen sich einfach nur gut im Schrank. Ich LIEBE Bücher^^)
 
Kommentieren

Tilly

Namhafter Pirat
Registriert
5 August 2023
Beiträge
96
Erhaltene Likes
192
Ich habe einmal kurz eine Hörprobe erstellt aus Der dunkle Turm ! Ich habe dieses als Epub in .pdf gewandelt und Text generiert zur Sprache !

Die könnt Ihr hier runterladen =

Bitte, Anmelden oder Registrieren um die Links zu sehen!


Nach 30 Tagen wird der Link automatisch gelöscht und steht dann nicht mehr zur Verfügung !


Ich finde das dieses durchaus gelungen gut ist und man so auch seine eigenen EBook´s als Hörbuch wandeln kann.

Über KI lässt sich vieles machen. Ich arbeite zb. derzeit noch daran vollständige Videos via VoiceCloning zu übersetzen.

Ich habe eine türkische Serie die es nicht auf Deutsch gibt oder sogar nie geben wird (Destan - The Princess Warrior 2021).

Diese Serie will ich komplett mit den Originalstimmen in Deutsch übersetzen.

Die Untertitel habe ich bereits in Deutsch erstellt (falls ich die überhaupt brauche). Jetzt warte ich nur noch auf meine neue Grafikkarte und dann
kann es eigentlich losgehen.
 
Zuletzt bearbeitet:
Kommentieren

Tilly

Namhafter Pirat
Registriert
5 August 2023
Beiträge
96
Erhaltene Likes
192
Bitte, Anmelden oder Registrieren um den Inhalt zu sehen!
Das ist auch gar nicht so schwer. Wenn man die richtigen Programme hat dann kann man seine Zeit damit vertreiben und richtig was Schönes daraus machen.
Wie auch zB. die Titelmusik im Hintergrund mit einfügen oder die original deutschen Synchronsprecher (VoiceCloning) vorlesen lassen.
 
Kommentieren

level9

Pirate of the 777-Seas
Crew
Registriert
12 Mai 2021
Beiträge
1.718
Erhaltene Likes
5.880
Ja gut, schade, ein 14 sekündiges Sample gibt aber nicht so viel Eindruck wieder. Das ist ja "nicht viel mehr" als Text-to-Speech zu einer der neueren KI-Sprachmodelle wie Elevenlabs. Die 'lesen' zwar schon relativ natürlich, aber eben auch nicht entsprechend mit Emotionen oder gar leicht angepasster Stimme für die verschiedenen Sprecherrollen.

Klar, besser als nichts und schon viel mehr als die bisherigen TTS-Versuche, aber schon doch noch weg von 'nem Menschen.
 
Kommentieren

DrMabuse1977

Namhafter Pirat
Registriert
5 Mai 2021
Beiträge
3.345
Erhaltene Likes
2.352
Bitte, Anmelden oder Registrieren um den Inhalt zu sehen!
Ja, ist auch nicht schlecht. Ich würde gerne etwas mehr davon hören, am liebsten etwas, wo Dialoge gelesen werden, hier ist es halt die Sache, ob man dem auch folgen kann.

Und dann würde mich natürlich dein Workflow, inkl. genutzter Programme interessieren, es geht mir hier um zwei Schriftsteller, wo es bei dem einen kaum etwas, beim anderen gar nichts in deutsch gibt: Robert Ludlum und Steve Berry.
 
Kommentieren

tastebin

InventarNr. #290621
Crew
Registriert
29 Juni 2021
Beiträge
2.829
Erhaltene Likes
6.296
@DrMabuse1977 exakt mein denken. Wäre auch interessiert. Keine Ahnung ob ne 1050 das packt. Aber es gibt ja auch workarounds für cpu

Edit: Ohmann, das wäre so geil... Dean Koontz
 
Grund: Jammern und so
Zuletzt bearbeitet:
Kommentieren

Shadowhead

Der wahre Captain
Registriert
19 Mai 2021
Beiträge
2.085
Erhaltene Likes
11.752
@Tilly
Wäre interessiert, damit meine Kurzgeschichten, evt. auch die Romane, zu vertonen.
Was brauche ich dafür an Programmen und Systemvoraussetzungen?
 
Kommentieren

level9

Pirate of the 777-Seas
Crew
Registriert
12 Mai 2021
Beiträge
1.718
Erhaltene Likes
5.880
Zum Mal herumprobieren kannst Du das hier mal testen:
Bitte, Anmelden oder Registrieren um die Links zu sehen!


Damit hab ich mal aus einer Rede von unseren Bundeskanzler einen Voiceclon erstellt und "ihn" damit jemanden einen Geburtstagsgruß einsprechen lassen.
Das klang schon unglaublich echt, weil er da in seinem "Redemodus" war und auch die Grußnachricht entsprechend wie eine kleine Rede 'rüberkam.

Längere Texte kosten halt...
 
Kommentieren

Tilly

Namhafter Pirat
Registriert
5 August 2023
Beiträge
96
Erhaltene Likes
192
Es gibt etliche Tools um Text zu Sprache (Text to Speech) zu wandeln.
Balabolka zB. ist free und unter Windows zu nutzen. Mehrere Sprachen kann man nach installieren.

Gibt es hier =
Bitte, Anmelden oder Registrieren um die Links zu sehen!


Ich selber nutze Automatic1111.

Hierbei muss Python, GIT und Automatic 1111 installiert werden.

Anleitung =
Bitte, Anmelden oder Registrieren um die Links zu sehen!


Die Installation muss peinlichst genau gemacht werden. Sonst funzt es nicht.

Anleitungen dazu gibt es reichlich. Hier muss man sich nur die Richtige aussuchen. Es hängt davon ab welche GPU genutzt wird. Ob AMD, Nvidia oder Intel.
Bei Automatic kann man sich dann Open Vino und Open Voice installieren und dementsprechend nutzen.
Es gibt es dort den Punkt Extensions. Einmal darauf klicken dann werden sie im unteren Bereich angezeigt.

Hier kann man sich einige aussuchen und installieren. Danach muss Automatic1111 neu gestartet werden.

Auch gibt es bei Github oder Huggingface.co genug Tools für Text to Speech.

Bei einigen braucht man nur die PDF oder Epub ins Fenster ziehen.
Es wird automatisch der Text gezeigt.

Die entsprechenden Einstellungen vornehmen und generieren.

" Anleitungen beim installieren beachten."

Man kann das Beste für sich aussuchen.

Ohne Models läuft es zwar aber man muss dieses dann selber anlernen.

Lasst es ! Dauert zu lang und umständlich.

Ladet Euch die Models herunter und legt sie in den Ordner Models in Automatic1111 ab. Diese Models sind vortrainiert (Deep Learning).
Bei Hugging gibt es eine große Auswahl. Einfach runterladen und in den Ordner damit.
Sehr wichtig bei der Installation von Python ist das Häckchen bei "add to PATH". Das muss gesetzt werden sonst funktioniert es nicht.
Automatic1111 habe ich mir als Ordner auf den Desktop gelegt und in dem Ordner die "cmd" Eingaben gemacht.
So landen die Installationen genau dorthin wo sie hin sollen.

Ich kann jetzt nicht für jede Graka einen Workflow schreiben. Für AMD gibt es diese Anleitung =
Bitte, Anmelden oder Registrieren um die Links zu sehen!

Bei Nvidia Karten passt eigentlich jede Stable Diffusion.

Intel und für die anderen GPU's kann man auch diese Anleitung nehmen =

Bitte, Anmelden oder Registrieren um die Links zu sehen!
Jetzt sollte man eigentlich genug Input haben um die richtige Automatic1111 für sich zu finden.
Wenn sich Automatic weigert zu starten gibt es am Ende der Installation einen Hinweis im Terminal was zu tun ist.

Den befolgen oder Info im Netz suchen. Nur nicht aufgeben, da die Fehler schnell zu beheben sind.

Ich selber habe das Ganze schon sehr oft wieder gelöscht und neu installiert, da es nicht funktionierte. Wenn es aber läuft dann läuft es auch.

Vorsicht bei DeOldify ! Hier ist Nymph ein Problem. Es kann sein das es dann mit AMD oder Intel nicht mehr läuft. Dann den Ordner in Automatic löschen !

DeOldify ist zum Colorieren von schwarz / weiß Fotos und schwarz / weiß Videos gedacht.

Auch hier gibt es Farbschwankungen wie bei jedem anderen Programm aber DeOldify ist eindeutig das Beste was es gibt.

Viel Spaß beim tüfteln, antesten und installieren !

Beachtet das alles Open Source ist (also kostenlos).
Ebenso soll Automatic1111 die beste Stable Diffusion sein. Zumindest als Open Source.
Es gibt dafür alles was man haben will auf Github und Huggingface.co !
Auch rendern, Upscalen von Videos, Face Swap, colorieren, Text to Speech, GPT, Musik machen, Singen mit der eigenen Stimme, Fotos erstellen, eigene Videos produzieren, Videos mit einer anderen Sprache ins Deutsche mit der Sprache der Darsteller übersetzen (Voice Cloning) usw. usw. usw. !
 
Zuletzt bearbeitet:
Kommentieren
Oben