Die One Man Show, der lesene Clon der eigenen Stimme war der neue Ansatz. Aber ich verstricke mich mehr mit technischen Details wie Installation von irgendwelchen Bibliotheken für Python und dem Scripting, dass ich zum eigentlichen Thema, der automatisierten Audioaufbereitung, sowas von nicht wirklich weiter kam, weil mir die Qualität vom Ergebnis Null zugesagt hat.
Ich kämpfte mehr mit technischen und computerbezogenen Problemen, wie dem Scripting des Automatisierungsprogramm als am Wording und der inhaltlichen Textbearbeitung der Geschichte zu werkeln. Klar die Technik muss erst laufen, aber ich fühlte mich dabei so mehr und mehr, wie der Copy Paster Hiwi, um ein Problem nach dem anderen zu lösen. Ihnen fehlt die Biblieothek xyz - installieren sie noch das und jenes. Änderen Siie die Einstellungen hier und da, installieren sie das und dies noch nach. Man wird schier bekloppt und wenn das eigene Script dann nicht laufen will, weil wieder irgendwo eine Zeile falsch eingerückt ist, könnte man aus der Haut hüpfen. Doch auch das Scripting selbst machte mich wahnsinnig. Wobei mir das Coden eigentlich immer sehr viel Spaß macht, vor allem, wenn das Programm auch genau das tut, was man sich gedacht hat.
Allem Aufwand aber zum Trotz, ziehe ich das Fazit vor, es klingt scheiße und funktioniert nicht so einfach, wie ich mir das Vorstelle. Das Simple hier haste das Buch als Text, mach mal Audio draus, geht ziemlich in die Hose, wenn man glaubt man bekäme hier eine brauchbare Qualität.
Nichts destotrotz finde ich diese Technik sehr faszinierend. und die Beschäftigung mit dem ganzen technischen Kram hat meine Synapsen wieder befügellt und mich auf andere Gedanken gebracht. Es ist echt erstaunlich, mit wie wenig eigenem Audio als Basis die Maschine dazu bringt einen täuschend echt klingenden Clon der eigenen Stimme erstellt. Und dieser Clon macht aus Sätzen, die man per Text einfach nur übergibt., wunderschöne Sprachfiles, die Du so nie im Leben gesagt hast. Je besser das K.I. Modell trainiert wurde, ist es in der Lage auch Betonungen mit der Clon-Stimme zu erstellen. Text-To-Speech ist ganz schön modern geworden. Ich erinnere mich noch an die 80er, da konnte ich Dank einer eingebauten Speicherkartenerweiterung in meinem Schneider CPC 464 per Befehl aus den Computer etwas sprechen lassen. Und heute wird nach dem gleichen Prinzip Text per Befehl mit meiner eigenen Stimme zur Tonausgabe des Textes gebracht.
Persönlichkeitsklau, Stimmenklau alles machbar und das innerhalb weniger Stunden und etwas Aufwand auf seinem eigenen Rechner zu Hause und das völlig kostenlos.
Wozu das Ganze hier eigentlich erzählen und warum hab ich mich damit überhaupt beschäftigt? Hier treffen zwei Dinge aufeinander Neugier und Faulheit - Die Idee, ich hab Text, und kann die Maschine die Audio davon machen lassen ohne mich selbst vors Mikrofon zu stellen. Die Gefahr dabei,
man gibt sich vielleicht mit dieser unzureichenden Qualität zufrieden und der Spaß, selbst am Mikrofon zu stehen und zu sprechen, dahinschwinded. Schnell mal durch die K.I. gejagd.
Lerneffekt - Faulheit siegt und K.I.s sind noch dumm, auch wenn sie in vielem uns was das Gedächtnis angeht im Vorteil sind, sie drehen sich gerne mal im Kreis und wenn Du da nicht wachsam bist, dass die K.I. dir wieder Grütze erzählt und Mist macht, hängst Du nur Stunden um Stunden an Problemlösungen, die dich immer weiter von dem fortbringen, was Du eigentlich tun und machen wolltest.
So klingt es übrigens im Auzug, wenn der Clon spricht:
Gulli - und das passiert leider häufig
aber dann auch wieder besser als man es selbst hinbekommen hätte
Manche Sätze haben nun mal Stolperfallen, der K.I.. ist das aber wumpe.