44,1 kHz / 48 kHz / 96 kHz – aus heutiger Sicht...

Ich nehm seit fast 20 Jahren ausschließlich 48 kHz und 24 Bit - aber werd angeregt durch diesen Thread nochmal ein paar Vergleiche machen...

Damals war das definitiv eine Entscheidung die auch mit Ressourcen zu tun hatte, die DAW ging da einfach deutlich schneller in die Knie. Ich hab mir aber eingebildet, dass ich einen sehr kleinen Unterschied zu 96 kHz höre.

Zum Thema "floating point" ist es genau wie oben schon angedeutet: bei kleinen Werten wird die Genauigkeit sehr groß, aber je größer die Werte werden desto gröber wird es auch. Der Prozessor in einem PC rechnet immer mit 32 oder 64 Bit, deswegen bringt es für reine Berechnungen und "interne Darstellung" auch kaum einen Gewinn wenn man das reduziert.
 
Letztlich geht es ja darum, welcher Wertebereich davon für Zustände unter 0 db verwendet werden.

dazu muss ich einen neunen begriff in die diskussion einführen.

was in einem digitalen wertebereich ist 0 db ist, das ist eine frage der definition. das legt man willkürlich fest. man spricht da (ich leite das einfach mal so aus dem englischen ab) von repräsentation.

beispiel 1:

du kannst z.b. einen wertebereich von 16 bit, der bekanntermaßen 0 - 65535 (dezimal) beträgt, was binär dann 0000000000000000 - 1111111111111111 wäre, auch als sogeannten "signed" wertebereich benutzen.

das sind dann im rechner immer noch werte von 0000000000000000 bis 1111111111111111, aber 0000000000000000 repräsentiert dann nicht mehr den dezimalwert 0, sondern den dezimalwert -32768, und 1111111111111111 repräsentiert dann nicht mehr 65535 sondern 32767.

beispiel 2:

genau so könntest du auch einfach von einem 16 bit wertebreich immer nur die ersten 14 bits benutzen, und dann willkürlich festlegen, dass jedes dieser 14 einzelen bits für einen parameter in deiner sofware steht, die jeweils den zustand 0 oder 1 für an oder aus haben können.

beispiel 3:

das seltene 24.8 audioformat ist technisch identisch mit einem 32 bit stream. es macht ganz grob das, was du ursprünglich vermutet hast und was diese artikelschreiber fälchlicherweise dem flaot format zugeschrieben haben: man darf mit 24 bits rein, und dann weder 8 drangehängt, so dass es jetzt 32 sind.

diese zusätzlichen 8 bits könnte man, wenn man wollte, nun entweder für headroom zum lauter machen nutzen, oder um die werte fortan in einem höhren wertebreih zu arbeiten.

das was aber tatsächlich damit gemacht wird, ist was anderes: die DAW braucht diesen platz als sog. overflow bits, denn in einem 24 bit bereich würde beim summieren von 2 spuren sonst 1111111111111111 + 0000000000000001 = 1111111111111111 ergeben, was ziemlich falsch wäre.

da es in der praxis nur sehr selten vorkommt, dass werte über 0001111111111111 überhaupt in musiksignalen drin sind, sind 8 zusätzlich bits vollkommen ausreichend, um zu erreichen, dass clipping jetzt nur noch bei jedem dreißigtausendsten sample vorkommt. (chaostheorem)

beispiel 4:

wieder eine andere art von repräsentation ist dann eben bei "float" vorhanden.

float formate kann man machen wie man will, aber das macht niemand, es gibt industriestandards dafür. und die benutzen noch nicht mal überhaupt bytes (also gruppen von 8 bits), die man irgendwie ergänzen oder abschneiden könnte.

während in 32 bit 10000111100000000000000000001111 als 2273312783 interpretiert wird, was nichts anderes als eine binär zu dezimal kovertierung ist (also im prinzip die gleiche zahl bleibt), wird die gleiche bitfolge als 32 bit float auf wundersame weise zu -1.92593338821834177772641144474275121183598588258713655096509946573757332544118980877101421356201171875e-34

ganz schöner unterschied was?

Mein Verständnis war bisher: für den Bereich unter 0 nach wie vor 16,7 Mio, und dann eben nahezu unendlicher Headroom für den Bereich über 0.

kannst du vergessen. :)

Für mich ist immer wichtig, z.B. bei welchen Umwandlungen Verluste entstehen.

eine mehrfach hin- und herwandlung von 24 bit und flaot wäre für die ohren unproblematisch. es gibt aber andere gründe, warum (in nativer audiosofware) fast nur noch float benutzt wird.


Das Fazit war dabei immer: mit 24 Bit Audio Daten erfolgt "im Prinzip" keine Umwandlung, sondern es wird mehr Headroom zur Verfügung gestellt.

es ist eine "umwandlung" insofern, als dass es ein vollkommen anderes datenformat ist.

wenn jemand behauptet, dass in einer DAW das 24 bit sample 000011111111111111111111 zu einem 32 bit float sample
00000000 000011111111111111111111 werden würde, ist das unhaltbar. das wäre eher das prinzip von "24.8".

in float32 ergäbe es nämlich 0 10010010 11111111111111111110000

und wie du sehen kannst, ist das einerseits ein anderes format, andererseits kann man aber auch erahnen, dass diese einerreihe im hinteren teil noch "fehlerfrei" vorhanden ist. das bleibt sie allerdings nur so lange, wie man den float wert nicht noch mal mit irgendwas verändert. (leerzeichen dienen nur der lesbarkeit)

wie immer gilt: irrtum vorbehalten, und nimm das alles nicht zu ernst, ich hab grad einfach nur zuviel zeit.
 
Zuletzt bearbeitet:
Ich hab mir aber eingebildet, dass ich einen sehr kleinen Unterschied zu 96 kHz höre

Das kann daran liegen, dass die AA Filter dann eben nicht so steil sein müssen, was Auswirkungen auf die Linearität des Frequenzgangs hat.

Der Prozessor in einem PC rechnet immer mit 32 oder 64 Bit, deswegen bringt es für reine Berechnungen und "interne Darstellung" auch kaum einen Gewinn wenn man das reduziert.

Zudem bekommen Plugins die Audiodaten als Gleitkommazahlen übergeben. Spätestens hier ist dann alles 32 / 64 Bit float - egal, was man eingestellt hat.
 
  • Daumen hoch
M.i.a.u.: Max
Hatten wir schon den Link?

"...
Während in Festkommaarithmetik der maximale Pegel 0 dBFS beträgt und eine weitere Erhöhung des Pegels zu einem Beschnitt der Amplitude und damit zu einem Clipping führt, ermöglicht die Gleitkommadarstellung einen Headroom. Der Dynamikbereich eines in Gleitkommazahlen dargestellten Audiosignals teilt sich also in zwei Bereiche {\displaystyle \leq }
\leq
0 dBFS und {\displaystyle >}
>
0 dBFS. Die maximale Auflösung hingegen ist durch die Mantisse der Gleitzahl beschränkt. Eine 32 bit Gleitkommaarithmetik nach IEEE 754 hat daher maximal 23 bit Auflösungsvermögen pro Halbwelle, mit Vorzeichenbit also 24 bit für den gesamten positiven und negativen Aussteuerungsbereich.
..."

Grüße
Omega Minus
Dieser Beitrag scheint ja irgendwie meine Vorstellungen zu stützen, wenn ich das richtig verstehe.
wenn jemand behauptet, dass in einer DAW das 24 bit sample 000011111111111111111111 zu einem 32 bit float sample 00000000000011111111111111111111 werden würde, ist das unhaltbar. das wäre eher das prinzip von "24.8".
so in etwa hatte ich mir das vorgestellt. In dieser Hinsicht lag ich vllt. falsch.
 
24 Bit plus 8 Bit mehr für Headroom nach oben über 0 dBFS – das wäre dann 32 bit fix.
Creamware Pulsar hat z.B. so oder so ähnlich gearbeitet. Da wurde mit 32 bit fix gearbeitet, und im Manual wurde beschrieben, wie viele Bits für Headroom benutzt werden.
 
Habe ich mir das immer eingebildet...Wenn ich ein Projekt mit 96Khz starte und ein VST oder was externes einschleife dann wird doch das Eingangsignal auch mit 96Khz abgetastet. Also folglich höre ich mehr Informationen.
Wenn ich jetzt einjen Hall dazu nutze dann höre ich die feineren Nuancen heraus folglich Mischt man doch dann wieder etwas anders da man mehr hört, wie wenn ich gleich das Projekt mit 44 Khz starte.

Schon einfach Mischtechnisch macht es einen Unterschied ob ich mit 44/48KHz oder 96 Khz starte..da man filigraner abmischen kann da man gewisse feinheiten besser heraushört.Auf jedenfall ergibt sich ein leicht anderes Mischungsverhältiss bei 96Khz was ja nicht währe wenn man es mit 48KHz gemacht hätte.Oder sehe ich da was flasch?
 
Ich glaube Nordcore müsste mal was dazu sagen, wenns den User noch gäbe. Ich selbst bin ja nicht so der Tech-Nerd, aber den habe ich immer verstanden.
 
augenblick, du hast ja "fixed" gesagt, ich habe "int" verstanden.

dann hast du nur halb unrecht, schade.

aber pulsar ist ja auch sowieso ein ganz anderer planet. das bringt jetzt echt zuviel verwirrung rein.
 


da steht nichts widersprüchliches zu meiner Aussage.
 
"23 Bit Auflösungsvermögen pro Halbwelle, mit Vorzeichenbit also 24 bit für den gesamten positiven und negativen Aussteuerungsbereich" beschreibt doch 24 Bit Integer. Was hat das mit Gleitkomma zu tun?
Und warum wird hier nur von der Mantisse gesprochen. Die Zahlen werden doch nicht allein durch die Mantisse, sondern durch Mantisse und Exponent dargestellt. Man hat 32 Bit zur Verfügung mit Mantisse und Exponent, um die Werte möglichst fein aufzulösen.
Mein Eindruck ist, dass der Text kompletter Blödsinn ist. :agent:

Wie im Text steht:
"Die maximale Auflösung hingegen ist durch die Mantisse der Gleitzahl beschränkt."
Vermittels Exponenten hat man diese Auflösung aber auch bei sehr leisen Signalen (bei Festkomma hast Du einfach weniger Bits zur Verfügung) oder es clippt nicht bei "sehr lauten" Signalen.

Quasi die Maximalauflösung ist (nahezu) lautstärkeunabhängig. So verstehe ich das.

Grüße
Omega Minus
 
da steht nichts widersprüchliches zu meiner Aussage.

da irrst du dich aber ... 96 kHz erhöht nicht nur die maximale abbildbare Frequenz , es erhöht auch die Auflösung , wodurch komplexes Audio (FM, Verzerrungen, schnelle Transienten) besser dargestellt wird

das kann man auch ohne Goldohren hören
Dazu zwei Zitate aus:

"suggerieren, dass durch eine höhere Samplingrate eine Qualitätsverbesserung im gesamten Übertragungsbreich erfolgt, was falsch ist. Fakt ist, der Übetragungsbreich wird durch eine höhere Samplingrate erweitert. Die Signalanteile, die bereits mit einer tieferen Samplingrate erfasst wurden, werden durch die erhöhte Samplingrate (Abtastrate) nicht genauer dargestellt."

"Die Frequenzen unterhalb von 22.05 kHz, die bereits mit 44.1 kHz Abtastrate (Samplingfrequenz) erfasst wurden, werden mit einer höheren Abtastrate von 96 kHz nicht präziser reproduziert, denn auch die bei der zeitdiskreten, digitalen Abtastung nicht erfassten Signalanteile zwischen den Samples (Abtastwerte), können exakt rekonstruiert werden. Die 96 kHz Abtastrate erweitert den übertagbaren Frequenzbereich von 22.05 kHz auf 48 kHz und bringt nicht grundsätzlich mehr Genauigkeit im gesamten übertagbaren Frequenzbereich 20 Hz bis 48 kHz."

Vielleicht verstehe ich nur einfach nicht ? was du damit meinst:
"96 kHz erhöht nicht nur die maximale abbildbare Frequenz , es erhöht auch die Auflösung"
 
Aber wie ist das denn, wenn ich etwas mit doppelter Genauigkeit abtaste, also theoretisch, dann müsste sich doch die doppelte Datenmenge ergeben und somit eine bessere Auflösung des resultierden Klanges. Oder nicht? Also so habe ich mir das zumindest immer vorgestellt.
 
Aber wie ist das denn, wenn ich etwas mit doppelter Genauigkeit abtaste, also theoretisch, dann müsste sich doch die doppelte Datenmenge ergeben und somit eine bessere Auflösung des resultierden Klanges. Oder nicht? Also so habe ich mir das zumindest immer vorgestellt.

Wie ich schon oben schrieb: Du verbindst nicht die Samples mit einem lustigen Linienzug und deklarierst das als das rekonstruierte Signal. :cool:

Umgekehrt: Hat Du ein Signal mit einer höchsten Frequenz von 11kHz, dann reicht 22kHz Abtastfrequenz. Du hast nicht mehr Informationen, wenn Du mit 44kHz abtastest. Woher sollen die auch kommen!? Es ist ja schon alles im 22er drin. Wegen Nyquist-Theorem.

Grüße
Omega Minus
 
bin übrigens gerade von @bohor darauf aufmerksam gemacht worden, dass mein beispiel mit dem "signed" unzutreffend ist.

es gibt zwar solche audio dateiformate, bei denen man einen offset benutzt, aber "signed" geht eigentlich anders und das wort gehörte daher aus dem ansonsten gültigen "beispiel 1" gestrichen, weil der satz sonst falsch ist.

steht eben nur scheiße im internet, selbst wenns von mir ist.
 
Für uns ist ja wichtig, mit welcher Genauigkeit die Werte gespeichert werden.
Ein 24 Bit-Wandler liefert 24 Bit Integer, richtig?
Das kann man so speichern, oder nach der Bearbeitung in einer 32 Bit Engine auch mal als 32 Bit speichern.
 
Umgekehrt: Hat Du ein Signal mit einer höchsten Frequenz von 11kHz, dann reicht 22kHz Abtastfrequenz. Du hast nicht mehr Informationen, wenn Du mit 44kHz abtastest. Woher sollen die auch kommen!? Es ist ja schon alles im 22er drin. Wegen Nyquist-Theorem.

ja und nein. beispiel: combfilter. du hast ein signal mit 44 khz und willst es um ein drittel sample verzögern. das klingt mit 4x oversampling besser wie ohne.
 
Für uns ist ja wichtig, mit welcher Genauigkeit die Werte gespeichert werden.
Ein 24 Bit-Wandler liefert 24 Bit Integer, richtig?
Das kann man so speichern, oder nach der Bearbeitung in einer 32 Bit Engine auch mal als 32 Bit speichern.

siehe meinen hinweis auf die entwicklungsgeschichte: 32 bit dateien schon beim aufnehmen zu schreiben wurde parallel mit der einführung von plug-ins, durch die man aufnimmt, eingeführt.

ansonsten: ja klar.
 
Aber wie ist das denn, wenn ich etwas mit doppelter Genauigkeit abtaste, also theoretisch, dann müsste sich doch die doppelte Datenmenge ergeben und somit eine bessere Auflösung des resultierden Klanges. Oder nicht? Also so habe ich mir das zumindest immer vorgestellt.

Wenn Dein Signal bereits bei der niedrigeren Samplerate korrekt erfasst wurde (also beispielsweise Audiosignale < 22.05 kHz bei 44.1 kHz Samplerate), wird das durch eine höhere Abtastung nicht "besser". Dem Rekonstruktionsfilter reicht das bereits für eine korrekte Wiedergabe. Die größere Datenmenge entsteht zwar, enthält dann aber unnötige Redundanzen.
 
Dazu zwei Zitate aus:

"suggerieren, dass durch eine höhere Samplingrate eine Qualitätsverbesserung im gesamten Übertragungsbreich erfolgt, was falsch ist. Fakt ist, der Übetragungsbreich wird durch eine höhere Samplingrate erweitert. Die Signalanteile, die bereits mit einer tieferen Samplingrate erfasst wurden, werden durch die erhöhte Samplingrate (Abtastrate) nicht genauer dargestellt."

"Die Frequenzen unterhalb von 22.05 kHz, die bereits mit 44.1 kHz Abtastrate (Samplingfrequenz) erfasst wurden, werden mit einer höheren Abtastrate von 96 kHz nicht präziser reproduziert, denn auch die bei der zeitdiskreten, digitalen Abtastung nicht erfassten Signalanteile zwischen den Samples (Abtastwerte), können exakt rekonstruiert werden. Die 96 kHz Abtastrate erweitert den übertagbaren Frequenzbereich von 22.05 kHz auf 48 kHz und bringt nicht grundsätzlich mehr Genauigkeit im gesamten übertagbaren Frequenzbereich 20 Hz bis 48 kHz."

Vielleicht verstehe ich nur einfach nicht ? was du damit meinst:
"96 kHz erhöht nicht nur die maximale abbildbare Frequenz , es erhöht auch die Auflösung"
Die Zeilen hatte ich überlesen. War n bisschen viel Text.

Wie dem auch sei, ich kann den Unterschied doch sogar hören .. und nein ich hab keine Goldohren die z.B. 44 kHz wahrnehmen.
 
Cubase VST/32 hat mit 32 Bit aufgenommen. Das waren noch keine Plugins, sondern internes Ding mit Tape-Simulation und so.

entweder hast du meinen entsprechenden post oben nicht gelesen oder kennst dein eigenes cubase nicht.

denn erstens ist es egal ob der process es ein plug-in ist oder nicht und zweitens ist "truetape 32" (man beachte den namen) sehr wohl ein VST plug-in. genau übrigens wie auch EQ und dynamics im mixer channel.

wenn man den kopierschutz dieser plug-ins versehentlich entfernt, läuft das auch unter anderen programmen. das sieht dann sehr lustig aus. :)
 
Zuletzt bearbeitet:
ja und nein. beispiel: combfilter. du hast ein signal mit 44 khz und willst es um ein drittel sample verzögern. das klingt mit 4x oversampling besser wie ohne.

Die Frage, auf die ich antwortete, bezog sich auf das Abtasten, nicht auf die Bearbeitung.

Für die Bearbeitung ist es immr gut, wenn man "Schutzstellen", "Headroom" hat oder wie man auch immer nennen mag. Ist aber eine andere Fragestellung.

Grüße
Omega Minus
 
Zuletzt bearbeitet:
Nein, tut man nicht, unter Bittiefe verstehe ich Bittiefe. Das hat mit Auflösung nichts zu tun.

nun, wie du merkst, gibt es durchaus ein paar leute, die es anders kennen. darüber zu streiten, welche gruppe nun größer ist, finde ich ziemlich langweilig.

das gegenargument würde dann lauten "und unter samplingrate verstehe ich samplginrate, das hat mit auflösung auch nix zu tun"

ich hatte euch ja als kompromiss oben angeboten, zwischen auflösung und auflösung in der zeitachse zu unterscheiden.

denn natürlich gehört beides zur resolution.
 


News

Zurück
Oben