• Blut-Tetralogie   Dark Space

MissMotte

Mitglied
Hey Zusammen,

ich habe mit einer Autorin ein Hörbuch produziert (wenn man es denn so nennen möchte ;-) ) und jetzt möchte sie es gerne veröffentlichen. Allerdings gibt es auf der Seite, auf der sie es hochladen möchte, Formatanforderungen, mit denen ich als Techniklaie leider fast gar nichts anfangen kann.
Kann mir evtl. jemand von euch schlauen Köpfen weiterhelfen?

Dort steht:
------------------------------
- RIFF/WAV (ich habe das in Audacity aufgenommen und als Mp3 abgespeichert. Dann kann ich es doch einfach nochmal öffnen und als WAV abspeichern, oder?)
- 2 Kanal Stereo (ich habe es in Mono aufgenommen :-((( Ich könnte die Spur natürlich jetzt kopieren und nachher zusammführen, aber wäre das dann das gleiche?)
- PCM (keine Ahnung, was das heisst...)
- Konstante Bitrate (???)
- Samplingfrequenz: 44.1 kHz (???)
- 16 Bit pro Sample (???)
Die WAV Datei kann mit FLAC oder Shorten komprimiert sein. (NOCH MEHR FRAGEZEICHEN :-((( )
------------------------------
Hier ist ein kleiner Auszug der Datei, evtl. hilft das ja weiter...
 

Wir wären unheimlich dankbar für ein bisschen Hilfe.

Liebe Grüße!
Marlene
 

Dagmar

I'm not weird, I'm gifted
Sprechprobe
Link
AW: Formatanforderungen

- RIFF/WAV (ich habe das in Audacity aufgenommen und als Mp3 abgespeichert. Dann kann ich es doch einfach nochmal öffnen und als WAV abspeichern, oder?)

Kannst du machen, ist aber scheiße. mp3 ist ein komprimiertes Format, aiff bzw. wav nicht. D.h. du hast nach der Aufnahme bereits die gute Datei schlechter gemacht ohne die gute Version zu behalten. Jetzt kannst du das zwar wieder als wav speichern,a ber die Qualität bleibt schlechter. Kannst halt hoffen dass sie es nicht merken.
- 2 Kanal Stereo (ich habe es in Mono aufgenommen :-((( Ich könnte die Spur natürlich jetzt kopieren und nachher zusammführen, aber wäre das dann das gleiche?)
Ist nicht direkt das gleiche, aber sogar besser. Denn dann hast du keine Abweichung zwischen linker und rechter Spur, sondern eben eine gedoppelt. Das ist bei Sprachaufnahmen gut.

- PCM (keine Ahnung, was das heisst...)
http://www.audio.de/ratgeber/digitale-audioformate-dsd-vs-pcm-1532849.html
Was die da genau meinen... keine Ahnung...


- Konstante Bitrate (???)

wenn du nur eine Datei hast egal. Die wollen dass alle Dateien die du hast (wenn du z.B. 10 Tracks hast) die gleiche bitrate haben.

- Samplingfrequenz: 44.1 kHz (???)
Ist an sich auch normal... aber da du komische Sachen machst (siehe "als mp3 gespeichert") bin ich natürlich n icht sicher. Mach mal audacity auf und guck was da am Anfang des Tracks links steht... da m üsste so was wie 16 bit, 44,1khz stehen. Dann passt es.

- 16 Bit pro Sample (???)
wenn du eh nur einen Track hast ist der durchgängig in einer Bitrate - meistens sind dsa 16 oder 24bit - je nachdem was du eben aufgenommen hast. Audacity hat glaub ich in der Grundeinstellung 16... wenn du da nix verstellt hast müsste das passen. Wenn es 24 oder so sind musst du neu abspeichern als 16bit wave (zum wave Problem hab ich oben schon was geschrieben).


Die WAV Datei kann mit FLAC oder Shorten komprimiert sein. (NOCH MEHR FRAGEZEICHEN :-((( )
is für dich jetzt eh egal... bei dir gehts drum ob du denen ne verhundste wave unterschummeln kannst ;)
 

MissMotte

Mitglied
AW: Formatanforderungen

Erstmal vielen lieben Dank für deine ausführliche Antwort Dagmar, damit hast du mir schon sehr geholfen :)

Das mit dem Mp3-Format ist ja dann ziiiiemlich ärgerlich :-( Da kann man dann wohl nur hoffen, dass sie es tatsächlich nicht merken.
Mal schauen... Für das nächste Mal weiß ich es dann besser...

Hab nochmal geschaut und es ist in 32 Bit aufgenommen. Was bedeutet denn das genau? Ist die Qualität dann besser als bei 16Bit?

Vielen Dank nochmal für die Antwort! :)
 

Corlanus

Cutter - zur Zeit in Auszeit
AW: Formatanforderungen

Um es mal kurz und in einem Satz zu beschreiben:
Die Anforderungen beschreiben eine stinknormale Stereo Wav-Datei.

Riff beschreibt die Art des Datei-Headers (das ist eine Dateiinterne Kennzeichnung des Dateityps/Datenformats).
PCM ist das von Windows für normale Wav-Dateien verwendete Kompressions-Format.
Das PCM-Format hat übrigens auch eine konstante Bitrate.

Einfach ganz normal in Audacity in als Stereo-Wav abspeichern, dann hast Du exakt was sie wollen.

Edit:
In 32 Bit ist die Signalabstufung besser als in 16 Bit.
16 Bit ist aber der Standard für alle (Hardware)-MP3-Player.
 
Zuletzt bearbeitet:

jam

Absolut
Sprechprobe
Link
AW: Formatanforderungen

32 Bit hört man nicht als "bessere Qualität". 16 Bit ist ausreichend und erzeugt die kleinsten Datein (wenn man das bei WAV so sagen kann). Wenn Du MP3 als WAV speicherst, merkt man das erstmal nicht. Man könnte vielleicht bei sehr schlechten MP3-Dateien darauf schließen, daß das WAV mal MP3 war, aber an der Datei selbst erkennt man das nicht. PCM ist nur ein Schlagwort, weil man das bei unkomprimiertem WAV automatisch hat (Pulse Code Modulation - aber unwichtig).
 

Dagmar

I'm not weird, I'm gifted
Sprechprobe
Link
AW: Formatanforderungen

an sich ist 32 bit "hochwertiger" als 16bit.. wobei das eh kein normaler Mensch hört :p
Wenn du eh als wave nochmal abspeicherst, dann wähl dieses 16bit-wave dingens aus, das ist da im dropdownmenue wenn du das Dateiformat beim Speichern auswählst. Dann wird es automatisch auf 16bit runtergerechnet.
 

MissMotte

Mitglied
AW: Formatanforderungen

Ihr seid echt klasse!
Vielen, VIELEN lieben DANK!
 

An Eid Sensortyp

Dennis Prasetyo
AW: Formatanforderungen

Vielleicht auch ein paar kleine (unnötige) Ergänzungen von mir, auch wenn das meiste bereits gesagt wurde:

*Klugscheisser on

PCM: Pulse Code Modulation ist ein Digitalisierungsverfahren, dass genutzt wird, um analoge Signale umzuwandeln. Dabei wird in regelmäßigen Abständen der Wellenform eines Signals eine "Probe entnommen". Das Signal wird "abgetastet". Hier fällt auch der Begriff Quantisierung, welches gaaanz einfach ausgedrückt das zuordnen von Werten meint. WAV ist ein Format, welches PCM nutzt.

Puls-Code-Modulation


Samplingfrequenz: Die "Abtastrate", gibt an, wie oft das Signal pro Sekunde abgetastet werden soll. 44,1 kHz bedeutet demnach, dass das Signal 44100 Mal pro Sekunde abgetastet und ein Wert zugeordnet wird. Das "Nyphist-Shannon-Theorem" besagt dabei, dass die Samplingfrequenz mindestens doppelt so hoch wie die am höchsten zu wiedergebene Frequenz sein soll. Da dies für das menschliche Gehör für Sprache und Musik bedeutet, dass 20 kHz (obere Hörwahrnehmungsgrenze bei jungen, gesunden und frischen Ohren) zum Hören ausreichen, hat sich eine Samplingfrequenz von 44,1 kHz eingebürgert.
Ist diese Frequenz zu niedrig, kann es zu hörbaren digitalen Artefakten/Fehlern kommen.

Bit-Tiefe: Die Bit-Tiefe gibt Aussage über hörbare Lautstärke-Dynamik des Signals. Ein gesundes Ohr kann Pegel von 0 dB bis 120 dB wahrnehmen, alles darüber wird unangenehm laut bis schmerzhaft. Um z.B. Musik oder Sprache von einer digitalen Aufnahme "realistisch" wiederzugeben benötigen wir also eine gewisse Dynamik, die wiedergegeben werden soll. 1 Bit kann eine Dynamik von 6 dB wiedergeben. 16 Bit (16 * 6 dB) kann 96 dB an Dynamik wiedergeben.
96 dB hat sich als "ausreichend" rausgestellt, um z.B. Sprache realistisch wiederzugeben.

Bei Musikproduktionen hat sich jedoch 24 Bit (manchmal auch 32 Bit) als klanglich "besser" rausgestellt, da durch die Dynamik von 144 dB (bei 24 Bit) "mehr Headroom" nach oben und unten vorhanden ist. Es klingt auch bei lauten Pegeln "klarer/präziser" (z.B. bei Schlagzeugaufnahmen) und leise Pegel können besser wiedergegeben werden. Das switchen einer Aufnahme zwischen 16 Bit und 24 Bit kann man hören.

Wichtig: Die Bit-Tiefe wird durch den AD-Wandler vorgegeben, in deinem Programm kannst du diese jedoch auswählen. Kann dein AD-Wandler, welcher in deinem Audio-Interface sitzt, max. 16 Bit aufnehmen, kannst du zwar 24 Bit WAV in Audacity auswählen, hören wirst du es jedoch nicht.

Zum Thema MP3: MP3 ist ein Kompressions-Format, welches aus einer PCM-Aufnahme so ziemlich alles an Informationen aus dem Signal rausschmeisst, was die Hörwahrnehmung nicht mitbekommt. Hier werden psychoakustische Effekte genutzt. Ist jedoch das Kompressionsformat ungünstig gewählt, klingt die Aufnahme verwaschen und kommt zu hörbaren Verzerrungen.
Dies ist abhängig von der Bitrate.

Grobes Beispiel: WAV ist unkomprimiert und die Datei 50 MB groß, selbe Aufnahme als MP3 z.B. 5 MB.

Die Kompression ist dabei abhängig von der BITRATE. Ich nutze Bitraten bei 320 kB/s, da hier in MEINEN Ohren KEIN Unterschied hörbar ist.

*Klugscheisser off
 
Zuletzt bearbeitet:

Lupin Wolf

Klaus S. - The Evil Master of Deasaster
Sprechprobe
Link
AW: Formatanforderungen

Vielleicht auch ein paar kleine (unnötige) Ergänzungen von mir, auch wenn das meiste bereits gesagt wurde:

*Klugscheisser on

Grobes Beispiel: WAV ist unkomprimiert und die Datei 50 MB groß, selbe Aufnahme als MP3 z.B. 5 MB.

*KlugscheißZusatzmodus On*

Stimmt nicht so ganz. WAV ist ein Kontainer-Format, genauer gesagt ist WAV eigentlich eine RIFF Datei. Corlanus erwähnte es schon, wnn auch nur sehr Oberflächlich. Zu den RIFF Formaten zählt übrigens auch das Videoformat AVI. Ich könnte jetzt mit meinem alten Programmierwissen anfangen und Euch etwas genauer über die Struktur von RIFFs, deren Chunks, Datenblocklängen etc. langweilen - aber das würde zu weit führen. Also kurz: RIFF kann Audio, Video, Text, Untertitel, Bilder, Bildfolgen/Animationen und noch zig andere Sorten von Dateiformaten enthalten - sogar bunt gemischt und mehrere Varianten davon (bis 32 verschiedene Arten gleichzeitig kann der Kontainer fassen - also bei WAV sind durchaus 32 Stereo Audiospuren möglich in EINER Datei). Geschcihtlich hat sich das ganze ein wenig nach dem Amiga IFF Format gerichtet, das ähnlich funktioniert. Aber da auf DOS/Windows basierten Computer-Betriebssystemen die Dateienendung zur Erkennung des Formats dient, während auf Mac, Amiga, Linux, Unix, BSD basierenden Systemen eben die in der Datei enthaltenen "Erkennungsfolgen" ausmacht. Dadurch sind dann die Endungen WAV, AVI etc. entstanden und halten sich bis heute zur rein Optischen Erkennung. (grober Entwicklungs-Geschcihtsklugscheiß Ende)

Und nein, WAV kann sehr wohl Bit komprimiert sein. Dabei werden die 0 und 1 in Folge zusammen gezählt und Hexadezimal gespeichert, was WAV Audiodateien dann eigentlich kleiner werden läßt. Nur ist diese einfache Komprimierungsmethode nicht gar so aggressiv wie das verfahren bei zB. MP3, OGG oder Flac.

Unkomprimierte Audiodateien wären im übrigen RAW Dateie.

Die Kompression ist dabei abhängig von der BITRATE. Ich nutze Bitraten bei 320 kB/s, da hier in MEINEN Ohren KEIN Unterschied hörbar ist.

*Klugscheisser off

Tschuldige, aber das kann ich leider nicht so stehen lassen. Dann da muss ich wiedersprechen. Diese Komprimierungsrate bei MP3 ist zwar das am schonendsten angewendete, Dateien schrumpfen dadurch weniger. Aber je nach Art des Klangs finden sich immer noch Störende Fragmente, die sogar hörbar sind. Klassische Musik selbst mit 320KB/s zu komprimieren ist ein absolutes NoGo (nur um ein Beispiel zu nennen wo mir hörbar komprimierung auffällt). Hohe Tonfrequenzen leiden auch häufig darunter und Variable Bitraten, die innerhalb einer Datei dynamisch je nach Klang die bestmögliche komprimierung an bestimmten Stellen verursachen haben noch schlimmere Effekrte.

Tut mir leid wenn das jetzt zu technisch war...ich machs auch gern wieder ;)

*KlugscheißZusatzmodus OFF*
 

An Eid Sensortyp

Dennis Prasetyo
AW: Formatanforderungen

Tut mir leid wenn das jetzt zu technisch war...ich machs auch gern wieder ;)

Super, danke Klaus!

Ja, man lernt doch nie aus. :D Danke für die Korrektur!

Zu mp3.: Musst mal schauen, gibt einige Studien die besagen, dass die meisten Menschen über 192 kB/s keine Unterschiede mehr hören können.

Guck mal hier, ist ganz interessant! : http://www.music.mcgill.ca/~hockman/documents/Pras_presentation2009.pdf

Ich fahre mit 320 kB/s ganz gut, muss aber auch zugeben, dass ich keine klassische Musik mache und von daher keine Aussage über den Bounce machen kann :D Für Hobby-Pop/Rock-Demos reicht es für mich allemal (Dateigröße und Sound). Und die Klassik-Stücke die ich auf meiner Platte habe, kenne ich nur mit ihrer Bitrate und befinde sie für "gut" :D Aber ein AB-Vergleich würde mich auch nochmal interessieren, werd da denke ich nochmal eine Hörprobe unternehmen.

Vielleicht kann man hier auch mal eine Spaßumfrage im Forum starten?
 
Zuletzt bearbeitet:

Wavedancer

Mitglied
AW: Formatanforderungen

Ich empfehle bei sowas grundsätzlich sich um viel Speicherplatz zu kümmern. Also für die Quelldateien, für die die höchste Qualitätsstufe erstrebenswert sind um daraus akzeptabel komprimierte Duplikate erstellen zu können. Bei Hörbüchern kann es durchaus sehr viel Festplattenspeicher fressen, aber so hast du immer ein "Original", das man nach Belieben mastern kann.
Sprachaufnahmen in Mono sind schlichtweg normal und nicht in Stereo notwendig. Stereo wird erst dann notwendig wenn du mit Raumdynamik und Hintergrundeffekten arbeiten möchtest. Dazu reicht aber nachwievor die Sprachaufnahme in Mono.
 

Lupin Wolf

Klaus S. - The Evil Master of Deasaster
Sprechprobe
Link
AW: Formatanforderungen

...Ich fahre mit 320 kB/sHeavy gut, mus auch zugeben, das ich keine klassische Musik mache und von daher keine Aussage über den Bounce machen kann :D Für Hobby-Pop/Rock-Demos reicht es für mich allemal (Dateigröße und Sound). Und die Klassik-Stücke die ich auf meiner Platte habe, kenne ich nur mit ihrer Bitrate und befinde sie für "gut" :D Aber ein AB-Vergleich würde mich auch nochmal interessieren, werd da denke ich nochmal eine Hörprobe unternehmen.

Tu das. Es trifft aber nicht nur Klassische Stücke. Beispielsweise ein Heavy Metal Gitarrensolo, gerade in höheren Tonlagen, kannst du damit genauso verhunzen. Synthi und Experimental von klassisch bis modern leidet auch. Pop oder HipHop sind dagegen tatsächlich "Schmerzfreier" mit der komprimierung von mp3 und ogg.

Es liegt viel am verwendeten Instrument, Tonhöhe und verwendeter Klang Effektbatterien, wo einem das auffällt. Und je nach zusammengestellter Geräuschkulisse gehen so manche komprimierungsfehler auch unter.
 
Oben