Telliminator

Sample-Collector
Sprechprobe
Link

Pharao des Eisens - Das Gizeh-Protokoll​


Die Götter wohnen nicht in der Unterwelt. Sie warten im All.

Ägypten im Alten Reich: Die Große Pyramide von Gizeh wächst in den Himmel, doch sie ist kein Grabmal. Unter der brennenden Wüstensonne treibt Pharao Chufu, der „Große Konstrukteur“, sein Reich an den Rand des Zusammenbruchs. Seine Arbeiter bauen kein Monument für die Ewigkeit, sondern eine gigantische, blitzebetriebene Maschine aus Isolatorsteinen, Kupferadern und säuregespeisten Bronzekolossen. Ihr einziger Zweck: Ein Sonnenschiff zu den Sternen des Orion zu schießen.

Drei Schicksale prallen auf dieser titanischen Baustelle aufeinander: Der geniale, von seiner Vision besessene Professor-Pharao. Der furchtlose Gardekommandant Menes, der als stählerne Speerspitze bereit ist, die Grenzen des menschlichen Daseins zu durchbrechen. Und der einfache Steinmetz Kaelo, der das verborgene Flüstern des Steins hören kann, sich aber vor der unendlichen Schwärze des Himmels sträubt.

Als der Tag des großen Feuers anbricht, droht die unbarmherzige Energie der Maschine das Fundament der Erde zu zerreißen. Die Entscheidung über den Aufbruch der Menschheit liegt plötzlich in den Händen des Mannes, dessen Füße für immer im Sand verankert bleiben wollten.

Ein fesselnder utopischer Roman, der antiken Mythos mit visionärer Steampunk-Technologie vereint.
 

Anhänge

  • Pharo_des_Eisens.pdf
    181,7 KB · Aufrufe: 21

Telliminator

Sample-Collector
Sprechprobe
Link
Pharao des Eisens



Downgrade 24kBit MP3 - 44:44 Minuten Laufzeit
Phyton Edge-TTS Audio Testumsetzung / maschinell erzeugte Lesung

Wieder mal was gelernt. Umgang mit Phython und edge-tts.
Was es alles für Möglichkeiten gibt, Dinge zu automatisieren.
Hätten wir weniger Anspruch würde uns Vieles auch schon so reichen.
 

Telliminator

Sample-Collector
Sprechprobe
Link
Es hat nicht sollen sein. Stunde um Stunde habe ich mir die Finger wund getippt und gemacht und getan, bin
aber letztlich im Ergebnis an verfügbaren freien "Credits" gescheitert. Das Projekt. Automatisierte Generierung eines erstellten Textes als Lesung mit verschiedenen Stimmen für die Rollen der Charaktere der Geschichte ist im Prinzip und in der Theorie geglückt, aber in der Praxis an der Kohle gescheitert.

Der Funken Ergebnis den die Credits noch lieferten.... :



Testfile
 

Anhänge

  • Pharo_des_Eisens - Dokumentation.pdf
    94,9 KB · Aufrufe: 12
Zuletzt bearbeitet:

Telliminator

Sample-Collector
Sprechprobe
Link
Projektpause für die Audio-Automatisierung.

Geplante neue Ansätze:
Google Cloud TTS API zum Einsatz bringen
Vorteil; liefert bereits eine Reihe von K.I. gestützten Neuro2-Stimmen.

ToDos:
Einrichtung des Accounts *Dauer 3 Tage, wegen Verifiierzbg
Einrichtung und Installation nötiger Komponenten für Python
Erstellung des ersten Testballons und Check des Scriptes
 

Telliminator

Sample-Collector
Sprechprobe
Link
Zwischenstand.

K.I. ist schön und gut, sie hilft wo sie kann, schmeißt aber auch alles durcheinander. Der formale technische Aufbau, Text, Stimme, gib sie per API an Google Cloud TTS und erhalte MP3 zurück funktioniert. Nur die Aufbereitung des Textes in die richtigen Phrasen mit automatischer Erkennung, was ist Erzähler und welche Figur spricht gerade, ist dem System scheinbar ein unmögliches Unterfangen zu erkennen. Ich bekomme immer wieder Rotze zurück. Es wird gekürzt, es fehlt plötzlich Text, dann wieder ein Sprecher weg. Zuordnungen der Stimmen wieder weg. Ich versteh es einfach nicht. Und zuletzt hat mich das System verarscht und im Scripting nur noch eine Stimme verwendet. Der Text Originale Text wurde auch noch radikal eingekürzt. Diese Kürzung wäre im Grunde genommen vertretbar, würden die unterschiedlichen Stimmen auch benutzt werden.



Wie man hört klappt die Steuerung auch nicht. Es wird durch den Text gehetzt und auch die Betonungen aus der Regie sind im Gulli gelandet.

Das hat die K.I. bisher als Unterstützung geleistet. Das Buch eingelesen und den Text aufgeteilt auf Erzähler und die sprechende Figuren zerlegt. Daraus resultierte eine Steuerdatei, die um Regie-Anweisungen wie Sprechpausen und Impressionen erweitert wurden. Dann wurde das ganze durch ein Script gejagt, was jeden einzelnen Part an die API schickt und fertige MP3 als Ergebnis zurück bekommt. Das ganze noch zusammenrödeln zu einer Datei.

Ich bin von meinem Ziel Buchtext rein, fertiges Audio mit verschiedenen Stimmen als Automatiesierung hinten raus Meilenweit weg. Es ist auch schlichtweg zu teuer. Kostet ja schließlich alles Geld.
 

Telliminator

Sample-Collector
Sprechprobe
Link

Protokoll: Fehlgeschlagene Datenaufbereitung (audio_skript.csv)​

Datum: 01. Juni 2026 Betroffene Datei: audio_skript.csv (aus Pharao des Eisens) Status: Abbruch der Zusammenarbeit

1. Problemstellung​

Der Nutzer benötigte eine lokale Lösung zur korrekten Aufbereitung des Textes „Pharao des Eisens“ für eine Audio-TTS-Anwendung. Das Ziel war eine saubere CSV-Struktur mit den Spalten [Typ], [Sprecher], [Text].

2. Fehleranalyse (Identifizierte Ursachen)​

  • Fehlerhafte Datenstruktur: Die bereitgestellte CSV-Datei enthielt in der dritten Spalte bereits einen kombinierten Datensatz im Format Sprecher|Text.
  • Inkonsistente Logik: Die KI hat mehrfach versucht, den Sprecher anhand externer Regeln oder KI-gestützter Analyse zu bestimmen, anstatt die bereits vorhandenen Informationen im |-Format der Spalte 3 zu nutzen.
  • Dateizugriffsfehler: Durch Annahmen über Dateinamen (_2.txt) und Pfade traten wiederholt FileNotFoundErrors auf, da das lokale Skript die Quelldatei nicht unter den erwarteten Namen fand.
  • Kommunikationsversagen: Die KI hat die vorliegende CSV-Struktur ignoriert und sich auf das "Interpretieren" des Rohtextes konzentriert, was zu ineffizienten und fehlerhaften Skript-Vorschlägen führte.

3. Chronik der Fehlversuche​

  • Versuch 1-2: Fokus auf Regex-Parsing und manuelle Namenslisten (scheiterte an der Komplexität des Roman-Kontextes).
  • Versuch 3: Vorschlag einer lokalen KI-Installation (Ollama), was vom Nutzer als ineffizient und unnötig komplex abgelehnt wurde.
  • Versuch 4-5: Fokus auf CSV-Struktur-Korrektur, wobei die KI jedoch die bereits vorhandene |-Trennung in der dritten Spalte falsch behandelte.

4. Ergebnis​

Die KI konnte die Erwartungen des Nutzers an eine präzise, fehlerfreie und lokal funktionierende Lösung nicht erfüllen. Die wiederholten Fehlversuche führten zum Abbruch durch den Nutzer.
 
Hoerspielprojekt.de

Neu

Discord Server
Oben