Stimme wie Apple`s "Siri" klingen lassen

Dieses Thema im Forum "Offtopic" wurde erstellt von Moè, 19. April 2018.

  1. Moè

    Moè Die Stimme aus der Dunkelheit

    Zur Sprechprobe
    Beiträge:
    131
    Hallo zusammen,

    eine etwas seltsame Frage, aber wisst ihr wie man dieser Siri-Stimme vom roboterhaften Stil nahe kommen kann.
    Also nicht die Stimmfarbe an sich, aber diesen zum teil abgehackten, roboterhaften Klang würde ich auf eine normale Frauenstimme gerne machen.
    Allerdings überhaupt keine Ahnung wo ich da ansetzen soll? Roboterstimmen-Effekte passen nicht drauf :)

    Vielleicht stellenweise mit Tempoarten arbeiten? Keine Ahnung...
     
  2. Ellerbrok

    Ellerbrok Hoer-Stalker Mitarbeiter

    Zur Sprechprobe
    Beiträge:
    2.370
    Lass die Frau verschiedene Sätze einsprechen in denen die Wörter die du verwenden willst vorkommen, schnippel die einzelnen Wörter aus den Sätzen aus und bau sie zu einem neuen Satz zusammen.
     
    Phollux, Moè, Eric und einer weiteren Person gefällt das.
  3. Marius K

    Marius K Composer Reaction Manifest

    Beiträge:
    157
    Oder sag Siri, dass sie den Satz sagen soll?
     
    SeGreeeen gefällt das.
  4. petermax1

    petermax1 Independent Security Researcher

    Zur Sprechprobe
    Beiträge:
    811
    Oder mache es mit einem Mac und einer TTS App, ja es gibt auch kostenlose im Appstore die gut funktionieren.
     
  5. Nightblack

    Nightblack Meinhard Schulte

    Zur Sprechprobe
    Beiträge:
    2.036
    Jepp, gibt´s glaube ich auch kostenlos online. (TTS-Systeme / Webseiten)
     
  6. Scarala

    Scarala Super-Hoertalker

    Zur Sprechprobe
    Beiträge:
    181
    Discord hat z.b. ne interne Sprachsynthese integriert. Einfach in einem Chatroom, in dem TTS aktiviert ist /tts und dann den text schreiben und sie liest es vor ;)
     
  7. Ani

    Ani Die Frau im Schrank :D

    Zur Sprechprobe
    Beiträge:
    856
    Ist es nicht aber fraglich, ob man das dann einfach so verwenden darf?
     
    petermax1 gefällt das.
  8. petermax1

    petermax1 Independent Security Researcher

    Zur Sprechprobe
    Beiträge:
    811
  9. Lupin Wolf

    Lupin Wolf Klaus S. Bau auf Stelle

    Beiträge:
    3.558
    Also wenn ich Mo'e richtig verstehe, gibt es schon eine Sprecherin. Da jetzt mit TTS zu kommen dürfte verkehrt sein. Auf der anderne Seite klingen die Stimmen bei Siri, Alexa und Co. um einiges natürlicher als das der meisten freien TTS Systeme (ein wenig Kunstklang ja, natürlich. Aber auch nicht mehr so völlig Roboterhaft).

    Ist ein bisschen ein Mix aus Ellerbroks Vorschlag (wobei man das mehr bei Navis so vorfindet) und der Art, wie man die Sprecherin arbeiten läßt. Bedeutet: Sie muss völlig normal reden, völlig unbeeindruckt von jeder Art Situation. ganz so als würde sie einen wissenschaftlichen Vortrag emotionslos vorbringen, obwohl Sir nach allem gefragt wird. Das kriegt man nicht mit Effekten hin. Künstliche nebengeräusche, kleine Knackser und schnitte, die kleine Wortschwankungen verursachen können - das ist Pfriemelarbeit. Dann noch Klangeinstellungen aus welchem Gerät/Lautsprecher das zu hören ist oder welchen Raum-Rundum-Umfang das haben soll (Mix aus EQ und Impulsantworten/Reverb/Delay/Stimmquellen-Verortung).

    Wenn du allerdings die echte Siri Stimme dafür brauchst - ich weiß nicht welche Dame ihr Stimmprofil in Deutschland dazu gegeben hat (falls überhaupt). Im englischen war es die Amerikanerin Susan Bennet

    .
     
    Moè gefällt das.
  10. Marius K

    Marius K Composer Reaction Manifest

    Beiträge:
    157
    Ich denke, es würde schon helfen, mit einem Autotune VST alles auf den gleichen Pitch zu heben/senken
     
    Moè gefällt das.
  11. Lupin Wolf

    Lupin Wolf Klaus S. Bau auf Stelle

    Beiträge:
    3.558
    Oh verdammt, hast recht. Eigentlich hasse ich Autotune (Pitch Correction, Autotune und Melodyne sind die bekanntesten davon). Spielen mir zu viele (erfolgreiche) Sänger und Rapper exessiv damit herum, die mit oder ohne "das" sowieso keinen geraden Ton auf die Reihe kriegen. Aber für sowas ist es, wenn man es überzogen einstellt, wirklich gut um Stimmen absolut künstlich klingen zu lassen. Gibt auch ein paar freie Plugins dafür (Liste - Plattformübergreifend):

    Free Autotune Plugins: 7 of the Best In 2018!
    Auto-Tune Alternatives and Similar Software - AlternativeTo.net
    Do It On Linux: Pitch Correction (Auto-Tune)
     
    Zuletzt bearbeitet: 20. April 2018
    Moè gefällt das.
  12. Moè

    Moè Die Stimme aus der Dunkelheit

    Zur Sprechprobe
    Beiträge:
    131
    Danke für Eure vielen Ideen!
    Was ich über`s Wochenende testen werde ist mit Autotune und notfalls die pfriemelei mit den einzelnen Textstellen.

    Genau, ich habe eine Sprecherin die diesen "Effekt" in der Postbearbeitung bekommen soll.
    Mit TTS etc. hat man das Problem das es auf größeren Anlagen einfach qualitativ schlecht klingt (bereits ausgetestet, sogar mit "Siri"). Außerdem ist die Betonung einzelner Wörter teilweise sehr miserabel, so das man den Sinn gar nicht mehr versteht.

    Deswegen speziellen Dank nochmal an Klaus, Marcel und Marius!
    Autotune ist eine gute Idee und werde das mal austesten.
     
  13. Lupin Wolf

    Lupin Wolf Klaus S. Bau auf Stelle

    Beiträge:
    3.558
    Kein Ding Moe. Alternativ könntest du noch Vocoder einsetzen, aber das würde eher zu künstlich klingen (Robosize oder Schlumpfeffekte im Dauerzustand, je nachdem was erreicht werden soll). Disortion (gezielte Übersteuerungseffekte fallen damit sicher ebenfalls flach, denk ich.
     
    Zuletzt bearbeitet: 20. April 2018
  14. Marius K

    Marius K Composer Reaction Manifest

    Beiträge:
    157
    Was ich mir auch noch vorstellen könnte: Die Sätze zwei mal einsprechen, per Audiowarp genau aneinander anpassen und dann innerhalb der Wörter hin und her blenden (evtl. per LFO)
     
  15. Masterofclay

    Masterofclay Marco Rosenberg

    Zur Sprechprobe
    Beiträge:
    1.034
    Die einfachste Lösung wurde hier bisher nicht genannt: Die Sprecherin so sprechen lassen wie eine künstliche Stimme. Das geht, indem man neutral und abgehackt spricht und einzelne Wörter absichtlich anders betont, so als wären sie reingeschnitten worden. So haben wir das mit Maria Koschny für ein Computerspiel auch mal gemacht. Hängt natürlich davon ab, ob die Sprecherin das hinbekommt.
     
    Grissom gefällt das.