Draxes

Mitglied
Hallo liebe HoerTalk Community!

ich arbeite momentan an einer Sprachausgabe für eine Gothic II Modifikation. Die meisten Aufnahmen kommen von Sprechern hier aus dem Forum, die jeweils ihr eigenes Setup zum Aufnehmen benutzt haben. Die Nachbearbeitung habe ich aus der Hand gegeben und wurde mit Hilfe von Stapelverarbeitung für jede bereits geschnittene Voiceline durchgeführt. Grundsätzliches Vorgehen für jeden Datei war dabei:
- Normalisieren
- Equalizer
- "Leichter" Multiband-Kompressor

Jetzt habe ich über 17.000 lustige Dateien und merke, dass es zwischen vielen Voicelines noch Laustärkeunterschiede gibt. Zeilen, wo ein Sprecher an einer Stelle besonders laut und an anderen Stellen besonders leise ist, wirken viel leiser als Takes, wo ein Sprecher eine einheitliche Laustärke bewahrt hat.

Und nun stelle ich mir die Frage: Wie bekomme ich diese Laustärkeunterschiede am besten in den Griff, ohne zu viel kaputt zu machen? Meine bisherigen laienhaften Ideen waren folgende:
1) Alle Dateien nochmal einzeln kontrollieren und per Hand die sehr leisen Stellen nochmal separat normalisieren/lauter ziehen (Vermutlich seeehr zeitaufwendig und nicht bei allen Dateien gleich gut durchführbar)
2) So wie Idee 1, bloß nicht manuell nachbearbeiten sondern einen Kompressor nutzen
3) Holzhammermethode: Alles durch einen Kompressor jagen (was vermutlich einiges an Sprach-Dynamik zerstören dürfte)

Da ich selbst noch nicht so viel Erfahrung mit so etwas habe, fühle ich mich gerade nicht im Stande, eine gute Entscheidung zu treffen und würde es gerne "richtig" machen.

Um es konkret zu machen: Hier kann man sich einen Eindruck von der Sprachausgabe machen. Ein gutes Beispiel für so einen Laustärkeunterschied ist der Part bei 5:29. Da beginnt der Spielercharakter recht laut, dann folgt ein verhältnismäßig sehr leiser Take vom Gesprächspartner und dann ein viel lauterer.

Vielen Dank schon mal für Tipps und Ratschläge! =)
 

Delay

Mitglied
Sprechprobe
Link
Hi Draxes, das wird leider nur händisch möglich sein.
In Studios wo Sprachaufnahmen für Spiele gemacht werden wird nachträglich nach der Aufnahme auch erstmal eine manuelle Lautstärkeanpassung nach Gehör gemacht. Geht relativ fix wenn man es eben gleich nach der Aufnahme des Sprechers macht. Das ist aber nur der erste Schritt, danach folgt die Nachbearbeitung bzw. das generelle Anpassen der Lautstärke.
Hier hat der Sprecher im ersten Take leiser gepegelt und dann im zweiten Nachkorrigiert und mehr Pegel auf die Aufnahme gegeben. Am besten man nimmt durchgehend in einer Lautstärke auf, was allerdings auch nur dann gut möglich ist wenn der Charakter auch durchgehend gleich spricht. Schreien und Flüstern muss natürlich gepegelt werden aber da sollte man auch durchgehend alle Sachen in einem Pegel machen. War bei einer Aufnahme meinerseits ja auch der Fall für das Spiel, das hätte man direkt beim schneiden der Takes nebenher bequem machen können. Hätte ich es gewusst, hätte ich dir meine Aufnahmen auch direkt schon Lautstärketechnisch nach Gehör ein wenig zurechtgebogen.
 

Delay

Mitglied
Sprechprobe
Link
1) Alle Dateien nochmal einzeln kontrollieren und per Hand die sehr leisen Stellen nochmal separat normalisieren/lauter ziehen (Vermutlich seeehr zeitaufwendig und nicht bei allen Dateien gleich gut durchführbar)
Das wäre also das Beste meiner Meinung nach, aber erst die Aufnahmen nach Gehör anpassen und danach erst weiterbearbeiten und nicht jetzt an den bereits verarbeiteten Aufnahmen rumdoktoren, das geht schief. Von Normalisieren halte ich persönlich wenig...
 

Draxes

Mitglied
Danke für die Erklärung Delay! Das nächste Mal weiß ich es dann auf jeden Fall besser. Nur... für dieses Projekt werde ich es nicht mehr schaffen, nochmal alles von vorne zu machen. Dafür ist der Arbeitsaufwand einfach viel zu hoch. Deshalb werde ich mich mit den jetzt vorhandenen Aufnahmen arrangieren müssen und schauen, was damit jetzt noch möglich ist. Auch, wenn das dann sicherlich nicht die Bilderbuchlösung sein wird und so perfekt, wie man es mit einem anfänglichen Laustärkeabgleich hinbekommt.
 

jam

Absolut
Sprechprobe
Link
Ich schließe mich @Delay an. Ein nachträglicher automatischer Prozeß wird nicht besonders gut funktionieren. Verstärkt man ein Flüstern auf Maximalpegel, klingt es ebenso unnatürlich wie zu leises Schreien. Das kann man am sichersten wirklich nur von Hand prüfen.
In einem anderen Projekt hatten wir auch fertig abgemischt, so daß wir die Grundlautstärken selbst im Griff hatten. Das muß man dann für alle Takes durchziehen. Das könnte der Dialogpartner aber wieder anders gemacht haben. Daher muß man mindestens das angleichen, oder man muß die jeweiligen Sprecher im Dialog sprechen lassen, damit die Sprechstimmungen zueinander passen, und, und, und...
Aber das nimmt bei so vielen Takes sehr viel Zeit in Anspruch. Da muß man dann einen sinnvollen Mittelweg zwischen Qualität und Zeitaufwand finden, fürchte ich...:)
 

Draxes

Mitglied
Hättet ihr Tipps, mit welcher Strategie ich das mit meinen Voraussetzungen (= viele einzelne normalisierte Dateien) am besten bewerkstelligen kann? Wenn ich an jede Datei nochmal ran muss, dann ist es halt so... Es wäre jetzt zu schade drum, den Holzweg nicht zu Ende zu gehen.
 

Delay

Mitglied
Sprechprobe
Link
Das Problem ist jetzt leider das du gerade aufgrund der Normalisierung jetzt keine Lautstärkeschwankungen mehr in den Dateien sehen wirst.
Wären die unbehandelt würdest du es relativ leicht auf einem Blick erkennen können, zumindest meistens.
Ich hätte jetzt gesagt geh die Skript durch und schau wo es lauter wird bzw. der Charakter schreit / bzw. flüstert und hör dir dann die entsprechenden Aufnahmen an, allerdings ist es so wie im Beispiel zu hören das du dich nicht unbedingt darauf verlassen kannst das du so alle erwischst. Ich denke aber für eine MOD die so groß und aufwendig ist wird das auch verschmerzbar sein wenn du nicht alles erwischst. Das du dir überhaupt die Mühe machst das ganze mit Sprachausgabe aufzuziehen ist schon sehr löblich und das was ich bisher hören konnte klingt echt tipp topp.
Du könntest die Beta Tester bitten aufzuschreiben wo ihnen etwas auffällt, aber das ist sicherlich auch schwieriger und aufwendiger für dich dann alles raus und zusammen zu suchen... Die Aufnahmen vom Hauptprotagonisten, die ja den größten Teil ausmachen sollten ja weniger das Problem sein, er redet ja eigentlich durchgehend normal, damit fällt bestimmt schon ein Großteil der 17000 Voicelines für dich weg, die du durchhören müsstest. Beschränke dich erstmal auf die NPCs bzw. alles andere.
 

Draxes

Mitglied
Das klingt doch erstmal nach einem Plan. Nehmen wir an, ich habe dann Flüster-Takes oder Schrei-Takes gefunden. Was genau wäre da der richtige Ansatz, um dem Laustärkeunterschied korrekt entgegenzuwirken?
 

Draxes

Mitglied
Für Interessierte, die mal in der gleichen Klemme stecken wie ich, beschreibe ich hier mal meinen letztendlichen Lösungsansatz. Das ist sicherlich nicht der, den man von Anfang an anstreben sollte, da er mit Nachteilen verbunden ist. Aber für meine Ausgangslage (= viele Peak-normalisierte einzelne Takes) war es der Gamechanger.

Dafür habe ich Adobe Auditions verwendet. Sicherlich gibt es aber auch andere Programme, die ähnliche Funktionen besitzen und sich das damit genauso machen lässt. Und zwar gibt es dort eine "Match Loudness" Funktion, mit der sich per Stapelverarbeitung mehrere Dateien an ein gleiches LUFS angleichen lassen. Anschließend wird ein Hard-Limiter angewendet, um Übersteuerungen zu verhindern.
Takes, die vorher schon einen sehr unterdurchschnittlichen LUFS-Wert hatten, habe ich vor dem Prozess manuell angepasst.

Für mich hat ein Wert von -17LUFS Sinn ergeben. Am liebsten wäre ich noch tiefer gegangen, allerdings unterscheidet Gothic leider nicht zwischen Sprache und sonstigen Sounds, weshalb die Sprachlautstärke nicht zu leise sein darf. Dadurch wurden die besonders dynamischen ein wenig vom Limiter komprimiert. Allerdings fällt dies nach meiner Empfindung weniger auf, als vorher noch einen Kompressor auf alles anzuwenden.

Dadurch bekomme ich ein vernünftig gepegeltes, nicht all zu sehr komprimiertes Endergebnis mit einer recht soliden, gleichmäßig verteilten Laustärke.
 
Zuletzt bearbeitet:
Oben