Brainstorm Was kommt nach Ultra HD Audio??

Vielleicht entwickelt sich unser Gehör ja im Zuge der Evolution dahin, das wir signifikante Unterschiede zwischen CD und Super Duper Mega Krawum Audio HD Plus Musik hören können.
Vielleicht meins auch noch zu Lebzeiten, ansonsten bleibt es dabei, mehr wie 16Bit 44,1kHz kann ich nicht mehr trennen. Ich glaube selbst 12Bit 32kHz wären absolut nicht unterscheidbar für mich, das müsste ich allerdings mal probieren.
 
Ich glaube selbst 12Bit 32kHz wären absolut nicht unterscheidbar für mich, das müsste ich allerdings mal probieren.

zum bloßen aufnehmen und wiedergeben langt das auch in der tat fast. spektrum und SNR entsprechen dann ungefähr einer kupferkasette.

wenn du allerdings eine "normale" produktion in 32 bit machst und die dann nach 12 bit konvertierst, dann hört man sofort, dass da dann etwas rauscht wie blöd.
 
ja, kann schon sein, aber ob ich nun in 16Bit oder 24Bit rausrendere
 
in bestimten konstellationen von ohr, lautsprecher, raum, und vor allem material wirst du froh sein, wenn dir für das 16 bit master eine noiseshaping funktion zur verfügung steht. die, die du auswählen wirst, ist zwar dann nur für dich perfekt, aber immerhin.

manchmal hört man sofort, dass das 16 bit irgendwie kälter klingt, in anderen fällen hörst du nicht mal beim AB vergleich etwas.

außerdem ist der vergleich immer imperfekt, weil der wandler nicht der gleiche ist.
 
Lautsprecher und Raum habe ich nicht, da ich alles über Kopfhörer mache. Aber meine Ohren wollen bei 16 Bit einfach kein Rauschen hören, von daher fällt es mir auch schwer den Unterschied von 16 zu 24 Bit zu hören oder gar irgendwas über 44,1kHz da ei mir bei 12kHz absolut Schluss ist mit Hören und damit selbst die 44,1kHz viel mehr sind als ich je hören könnte. Vielleicht spielen dann noch Phasenunterschiede von L und R eine Rolle, aber fakt ist: Ich höre selbst bei MP3 320 nicht wirklich immer sicher den Unterschied zu WAV.

Ich kann somit mit Sicherheit sagen, dass 16Bit 44,1kHz weit mehr bietet als ich hören kann.
 
umgekehrt gibt es aber auch genug leute, die meinen zu hören, was nachweislich nicht existent ist. zum beispiel das rauschen von DSD. was sich weit oberhalb von 40 KHz bewegt. :P

Das Rauschen von DSD64 der SACD beginnt bereits bei 15kHz, so dass man mit einem Gehör bis z.B. 18kHz und bei sehr leisen Passagen voll aufgedreht durchaus hochfrequentes Rauschen hören kann:
Frecuenz_01.jpg
 
Ich meine mit Dynamik nicht die Endlautstärke, sondern ob der Rekonstruktion 65000 oder 16 Millionen Abstufungen zur Verfügung stehen. So gesehen kann man 12 Bit Rechnerisch natürlich anführen, aber es geht ja um das , was dazwischen passiert..

Ich kann eine Widergabe mit 16 Bit 44,1 und 24 Bit 44,1 sehr wohl unterscheiden, wenn auch auf einem Zugegebenermaßen eher subtilen Niveau. Und man muss schon etwas hören, was zb verschieden Entfernungen im Raum auf allen Achsen besitzt und eventuell sind es auch gleich noch mehrere Instrumente, sagen wir ein Orchester.
Ich habe jetzt nicht den Rest des Threads gelesen, aber ich denke, dass Du hier vergisst, dass unser Gehirn massivst mit Bewertungsmethoden arbeitet, die bestimmen, was von Gehörtem vernachlässigt wird. Das Ohr nimmt zwar physiologisch die Vielfalt des Schalls auf, aber das Gehirn transportiert nur einen Bruchteil des physiologisch Übermittelten ins Bewusstsein. Das ist ja genau das, was MP3 mit seinem Maskierungseffekt nutzt.

Gegenbeweis ist, das Orchester mal mit 12 Bit abzuspielen - viel Spaß bei dem Phasen Wirrwarr! Ganz tolles Erlebnis..
Da vermengst Du zwei Sachen: Die dynamisch Auflösung hat für Phasenbeziehungen nur einen sehr geringen Einfluss (ja es gibt den Einfluss, und er gilt meinethalben auch schon bei 12bit vs 16bit, aber sicher nicht mehr relevant für 16 vs 24).

Bedeutender für Phasenbeziehungen wäre die Samplingrate. Und da sind wir mit 22kHz echter Bandbreite (44.1 Samplingrate) weit über dem Notwendigen. Rechenbeispiel gefällig?:

Wir haben einen Phasenlaufzeit von einem Ohr zum anderen von grob 1ms (Schallgeschwindigkeit ~340m/s macht für 34cm 0.001s, und die 34cm sind grob genähert der Abstand Ohr<->Ohr). Wir nehmen Laufzeitdifferenzen bis ca 2kHz wahr und können Positionsunterscheidungen von ca 30 Grad machen (im 180Grad Hörfeld L<->R). Also sieben unterschiedliche Positionen. Das bedeutet für die Phasen/Laufzeitdifferenz eines 2000Hz-Signals, dass wir ein Delta von ca 0.15ms darstellen müssen; weil der Kopf ein bisschen schmaler ist, sagen wir 0.1ms. Da bedeutet, dass eine maximal wiederzugebende Frequenz von 10000Hz (!!!) bzw eine Samplingrate von 20kHz komplett ausreichend ist, um die Fähigkeiten unseres räumlichen Hörwahrnehmung zu befriedigen. Alles was mehr an maximal wiedergebbarer FrequenzSamplingrate ist, dient dem Frequenzgang, aber nicht dem räumlichen Hören oder der vermeintlichen Aufhebung eines "Phasen Wirrwarrs".

(Wer Quellen nachlesen möchte: Fleischer, H. "Hörbarkeit von Phasenunterschieden bei verschiedenen Arten der Schalldarbietung", in Acoustica, Band 77, S.90ff)
 
Zuletzt bearbeitet:
Wir nehmen Laufzeitdifferenzen bis ca 2kHz wahr und können Positionsunterscheidungen von ca 30 Grad machen (im 180Grad Hörfeld L<->R). Also sieben unterschiedliche Positionen.
Dass wir in der Horizontalen wesentlich genauer als 30° auflösen können, kann jeder mit einem einfachen Experiment feststellen:

Augen schließen und eine Person bitten, in ein paar Metern Abstand vor sich zu reden und sich dabei langsam seitlich zu bewegen. Mit dem Finger permanent auf die Person zeigen. Die Person wird einem bestätigen, dass man nahezu die gesamte Zeit immer genau auf sie gezeigt hat. Dabei ging es um Winkel kleiner als 10°.

In der Literatur geht man sogar von einer Auflösungsfähigkeit des Gehörs von bis zu 1° Abweichung aus der Medianebene (also bei frontaler Schallquelle) aus. Das Gehör kann also Laufzeitunterschiede von unglaublichen 10µs gerade noch wahrnehmen (Hellbrück 1993 S.138).

Das entspräche rein rechnerisch 100kHz Samplerate, wenn nicht durch Antialiasing- und Rekonstruktionsfilter mit jeder beliebigen Samplerate jeder beliebige Laufzeitunterschied nahezu fehlerfrei kodiert und dekodiert werden würde.

Auf die räumliche Lokalisationsfähigkeit wirkt sich bei einem guten digitalen Aufnahme-/Wiedergabesystem die Samplerate nicht aus (es wäre aber denkbar, dass Filter-Ringing im deutlich hörbaren Bereich, also bei einer Samplerate deutlich unter 40 kHz, diese Lokalisationsfähigkeit stört).
 
Zuletzt bearbeitet:
Augen schließen und eine Person bitten, in ein paar Metern Abstand vor sich zu reden und sich dabei langsam seitlich zu bewegen. Mit dem Finger permanent auf die Person zeigen. Die Person wird einem bestätigen, dass man nahezu die gesamte Zeit immer genau auf sie gezeigt hat. Dabei ging es um Winkel kleiner als 10°.
Im geschlossenen Raum mit Erstreflektionen der Schallquelle ja. Im offenen Schallfeld nein.
 
Da wäre aber m.E. noch zu klären, ob das Gehirn vielleicht aufgrund der stetigen Bewegung eine Art Interpolation (Forward-Guess) durchführt ... als Gegentest müsste sich die Person _leise_ an bestimmte zufällige Positionen begeben und dann anfangen zu sprechen. Zeigt der Proband auch dann noch entspr. genau auf den Sprecher?
 
Das Rauschen von DSD64 der SACD beginnt bereits bei 15kHz, so dass man mit einem Gehör bis z.B. 18kHz und bei sehr leisen Passagen voll aufgedreht durchaus hochfrequentes Rauschen hören kann:

bei -144 beginnt gar nichts, außer deine PA schafft 160.^^

aber in einem hast du recht: das noiseshaping bei DSD überlebt die wiedergabe am endgerät nicht und ist daher komplett sinnlos.
 
Zuletzt bearbeitet:


Neueste Beiträge

News

Zurück
Oben