Audio to text Transkription

lakukanaZ

Namhafter Pirat
Registriert
19 Juni 2022
Beiträge
142
Erhaltene Likes
149
Hallo Leute,

ich bin nach viel Google und Chat GPT nicht weitergekommen und brauche eure Hilfe.

Ich suche eine Windows Software (und zusätzlich auch eine Android App) mit folgenden Anforderungen:

- Audio to text
- Deutsch -> Deutsch
- Bedienung über eine GUI wäre wünschenswert
- Upload von bestehenden .mp3-Files (primär)
- Upload von bestehenden Audiofiles mit bis zu vier Stunden Aufzeichnungsdauer
- Speaker Diarization (der Text sollte ggf. im NAchhinein verschiedenen Sprechern zugeordnet werden können)
- Live Transkription (sekundär)
- qualitativ sehr hochwertige Ergebnisse wichtig
- Datenschutz egal

Ich habe es mit Whisper probiert, aber die Kombination aus Installtion und Bedienung mit GUI und Auswahl verschiedener V3 und eines V2 Modells hat zu schlechten Ergebnissen gefüht. Speaker Diarization ist darüber nicht möglich.

Würde mich über eure Unterstützung sehr freuen.

Könnt ihr mir bitte alternativ ein gutes Forum empfehlen, wo man solche Fragen stellen kann?

VG
 

NewD

Neuer Pirat
Registriert
28 November 2021
Beiträge
3
Erhaltene Likes
1
moin... ich glaube in Onenote gibt es diese Funktion. Müsstest die Audiodatei aber in onedrive hochladen. Ich hatte/habe noch diese Aufgabe offen und mich etwas damit befasst.
 
Kommentieren

prana

Namhafter Pirat
Registriert
29 November 2022
Beiträge
68
Erhaltene Likes
90
[DELETED]

Im Grunde tut Whisper.cpp die Übersetzung (BASIC) und WhisperX tut alles andere was man braucht, inclusive Diarization. Und nein, praktisch nichts ist out of the box, gute Nerven, Script-Skills, Complilieren (vor allem wenn man die GPU haben will), was no Brainer ist da es 10-50x schneller ist ...


PS: Habe den harten Weg rausgefunden, Python 3.10, 3.11 und 3.13 etc. das sind keine UPDATES. Es sind neue Versionen, die praktisch alles kaputt machen bzw. die Scripte laufen nicht. Bei WhisperX und generell bei vielen Python Scripten muss man bei 3.11 bleiben.

Ach ja bin begesitert weitgehend. Werde untertietel machen.
 
Zuletzt bearbeitet:
Kommentieren
Oben