MP3...die wahrheit, vor lauter unwahrheiten?!

Dieses Thema im Forum "Media 2.0" wurde erstellt von roechel, 7. März 2012.

  1. powmax

    powmax aktiviert

    Die Frage ist doch eher: Ab welcher Codierungsrate wird der Unterschied zum Orginal marginal !

    grüsslies
    carlos mc drei
     
  2. ich denke nicht, dass das ist hier die frage ist obwohl sicher nicht ganz unrelevant...

    es wird ja allgemein bei allen datenraten behauptet es würden frequenzen abgeschnitten.

    letztens...es geht wie so oft um empfinden und geschmacksfrage...das wird am schluss des videos "ganz schön ausgedrückt" :D
     
  3. Aber genau das sagt ja der Interviewte, dass das nicht stimme.

    Im übrigen habe ich anhand dieser Beschreibung von Heller nicht verstanden, wie die eigentliche Datenreduktion stattfindet. Nur dass halt frequenzabhänig datenreduziert wird und dass die dabei entstehenden Artefakte irgendwie maskiert werden.
     
  4. Cyborg

    Cyborg aktiviert

    Kurze Zeit nach Einführung von MP3 galten 128 kbps als völlig ausreichend und tatsächlich fand man die meisten MP3 mit dieser Auflösung. Später dann gab es nicht nur kostenlose Programme die auch höher auflösten und vor allem: Speicherplatz wurde sehr viel billiger. Ich speichere mit höchstmöglicher Auflösung wenn das in Hinsicht auf das Ausgangsmaterial Sinn macht. Wenn ich mal was ins Netz stelle, reduziere ich die Qualität wegen der Dateigröße. Ob ich Unterschiede höre hängt auch von der Musik ab, Unterschiede von 160 zu 320kbps höre selbst ich noch bei vielen Aufnahmen. Es klingt irgendwie dynamischer
     
  5. weils mir grade einfällt: auf einer Keys-CD (irgendwann in den 90ern) gab es mal Beispiele, wie wenig man reduzierte Daten wahrnimmt. Soweit ich mich erinnere, war es ein Stück mit einer äußerst im Vordergrund stehenden Akustikgitarre. Man hörte dann die Gitarre solo, dann wurde die Gitarrenspur übelst mit einem Noisegate zerhackt, sodass nur noch die lautesten Teile zu hören waren, und dann wurde zu dieser zerhackte Spur das Playback wieder dazugefahren --- und man hat NICHTS von dem Geschredder mehr mitbekommen. Das Playback hat einfach die Fehler in der eigentlichen Hauptspur überdeckt. Das fand ich damals sehr beeindruckend.
     
  6. Xpander-Kumpel

    Xpander-Kumpel engagiert

    ...stammte der Artikel/Beitrag nicht von Dir selber :D ?
     
  7. Nоrdcore

    Nоrdcore deaktiviert

    Das eingehende Signal wird zunächst in Bänder aufgeteilt. Diese Bänder werden dann mit einer DCT (Discrete Cosinus Transformation, stell dir eine FFT vor) in den Frequenzbereich transformiert. Die so erhaltenen Koeffizienten ("Spektrallinien") werden jetzt mit unterschiedlicher genauigkeit (3Bit, 7 Bit ...) quantisiert. Dabei spart man halt Bits ein.
    Der Fehler, den man macht, gibt ein Quantisierungsgeräusch. Dieses Geräusch wird jetzt so geformt (wo wirft der Encoder viele Bits, wo nimmt er wenige?), das es möglichst gut vom Signal verdeckt wird.

    Insofern ist die Vorstellung vom "Weglassen" psychoakustisch (=bezogen auf das, was wie hören) Unsinn. Es wird ein (Fehler-)Signal zugefügt.

    Bei mp3 - bezogen auf das Gehörte - von weglassen zu reden ist genau so wie, wie bei einem Tonband von weglassen zu reden, denn auch da verschwindet Rauminformation. (Dadurch, das Rauschen hinzugefügt wird und den Raumklang verdeckt. )

    Tatsächlich lässt mp3 übrigens doch was weg: durch eine Macke im Entwurf braucht man unnötig oft einen Tiefpassfilter im 17kHz bereich. Daran hören Leute die so hoch sehr gut hören, solche mp3 dann raus.(Das sind allerdings sehr wenige, und die bemerken den Effekt dann auch sehr konkret. )
     
  8. gringo

    gringo aktiviert

    Irgendein Programm hat genau das hören lassen, was sonst an Frequenzen wegfällt, bevor man codiert hatte. Das war sehr interessant. Mehrere Jahre her, weiss gar nicht wie das hieß. Bei 192 kbit hatte ich so kaum noch Fehlendes gehört, bei 128 kbit deutlich und bei 320 gar nicht. Aber ob Produzent, Musiker oder Endhörer. Die Ansprüche sind ja unterschiedlich. Man sieht es ja an der Masse, der 128 kbits reichen.
     
  9. ...eben...hab ja nicht geschrieben ich würde das behaupten... :roll:

    das mit dem rauschgeschredere hat er ja auch demonstriert...oder meinst du was anderes?!
    :floet:
     
  10. Ausnahmsweise nicht ;-)))

    Habs gefunden:
    Keys-CD 11/96, Track Nummer 14
    Es ging damals nicht um mp3 sondern um ATRAC (MiniDisc).


    play: http://fa.utfs.org/tmp/Keys_11_96_14.mp3
     
  11. swissdoc

    swissdoc back on duty

  12. Nоrdcore

    Nоrdcore deaktiviert

    Das hört man aber nicht. Man hört ein zugefügtes Störgeräusch.
     
  13. Xpander-Kumpel

    Xpander-Kumpel engagiert

    ...was witzig ist, ist das die Atrac-Schlußsequenz als einzige auf meinen Lappie-Spiekern verzerrt!?
    Sony setzen, 6!
     
  14. Nоrdcore

    Nоrdcore deaktiviert

    Mach mal einen ABX-Test.
    Die klingen beide exakt gleich verzerrt :selfhammer:
     
  15. gibts nicht noch mehr tiefpassfilter bei niedrigeren bitraten? also bei 96 und 64? 14 bzw. 10 kHz ungefähr? für die berüchtigte "telefonqualität"...

    jedenfalls eine sehr gute beschreibung!

    zwei dinge möchte ich auch nicht unerwähnt lassen:
    1. der kern des encoders ist das psychoakustische modell, eben der satz von regeln, der bestimmt, wann es für welches frequenzband wieviele bits geben soll. dabei gibt immer kritische items / signale, bei denen encoder es schwierig haben, die bits so zu verteilen, dass es absolut transparent klingt. und zwar auch bei hohen bitraten. es gibt also immer signale, die dazu tendieren, probleme im encoder zu provozieren.
    2. wie bei mpeg üblich, ist der encoder auch nicht durch den standard spezifiziert, sondern nur der decoder. das heißt, alle encoder von unterschiedlichen anbietern unterscheiden sich zwangsläufig. und im zweifel klingen encoder unterschiedlich.
    die allermeisten encoder, die im umlauf sind, sind aber ziemlich fein abgestimmt, immerhin ist das eine recht alte technologie, und die hersteller haben interesse daran, ihre encoder möglichst gut klingen zu lassen. ein lame encoder von 2002 wird unter umständen deutlich transparenter klingen als der jüngste lame encoder. das trifft im übrigen auf alle psychoakustischen codecs zu - sei es nun mp3, ac3, dts, atrac-3, aac, vorbis oder sonstwas. die entsprechenden hersteller lassen es sich mitunter richtig kohle kosten, die encoder zu "tunen" (in der regel verifiziert über MUSHRA hörtests, bisweilen auch ABX hörtests).
     
  16. Nоrdcore

    Nоrdcore deaktiviert

    Mp3 ist für Bitraten unter 128k eine schlechte Wahl. Das zugefügte Quantisierungsgeräusch ist dann zu störend, das können andere Verfahren besser.
    Dort haben die Tiefpassfilter dann auch nicht mehr den Anspruch wenig hörbar zu sein - sie sind einfach der beste Kompromiss bei der in Kauf genommen Klangverschlechterung.

    Sogar sehr deutlich. Allerdings ist Lame der einzige mp3 Encoder der noch weiterentwickelt wird, auf diese Weise hat er inzwischen auch den Fraunhofer-Encoder überholt. Viele Vorurteile gegen mp3 basieren auf wirklich schlechten Encodern (Blade, Xing), oder dem festen Vorsatz, dem Encoder die Arbeit möglichst schwer zu machen. (Also eine feste Bitrate einzustellen, Joint-Stereo abzuschalten usw... ). In der Anfangszeit kamen da auch schlechte Analogkopien der gerippten CDs hinzu, der eine oder andere hat auch einen 128k Stream auf 196k "hochkodiert" um die Qualität zu verbesseren, was natürlich auch völliger Unsinn ist, ebenso wie mehrfaches kodieren generell sehr problematisch ist.


    Man sollte das vielleicht eher umgekehrt schreiben: die meisten Signale machen (heute!) keine Probleme, insofern ist Hörbarkeit bei akzeptablen Bitraten vor allem die Suche nach für den Encoder schwierigen Stellen.
    128k fest ist übrigens die Bitrate, bei der man noch häufiger auf hörbare Artefakte stößt. Wobei die bei einem aktuellen Lame dann auch nicht mehr so schlimm klingen, d.h. man kann die Tracks zwar unterschieden, aber nicht sofort sagen, welches das mp3 ist - und wenn man "das schlechtere" rät, dann ist das nicht immer das Original.

    Wenn man hohe Kompression braucht, dann ist eine variable Bitrate *weit* überlegen, man erzielt mit weniger Datenmenge eine bessere Qualität.
     
  17. Eeehm, das ist ja ein MP3 (keine Ahnung, welche Qualität das aus iTunes rauskommt), nicht mehr das originale AIFF-File. Wenn man Datenreduktion hört, dann muss man sie natürlich bei beiden hören.

    Mir gings ja auch mehr um das Beispiel mit der gegateten Gitarrenspur.
     
  18. Nоrdcore

    Nоrdcore deaktiviert

    Datenrate: 192k fix. Qualtität weiß ich nicht, k.a. welcher Encoder dahinter steckt.

    Das es nicht wirklich sinnvoll ist, das hier noch zu vergleichen, ist schon klar, allerdings war die Ansage ja, dass es da einen absurd großen Unterschied geben solle, der real aber auf einem trivialen Höreffekt (Testfehler) basiert.
     
  19. psicolor

    psicolor Busfahrer und Bademeister

    Wie oft muss man sich selfhammern um auf die Idee zu kommen MP3 anhand eines (undynamischen) Fahrstuhltracks zu beurteilen?
    :selfhammer:
    ich bin echt großer Fan von MP3enc seit der ersten Stunde, auch wenn der Code seine Schwächen hat. Aber um die zu beurteilen, braucht man Material mit Dynamik und vielen unterschiedlichen Klängen.
     
  20. klar, bei <128k würde ich persönlich sowieso immer einen moderneren codec (psychoakustischer core codec + parametrisches coding für niedrige bitraten) nutzen.
    ich wollt's nur der vollständigkeit hinzugefügt haben, dass man auch deutlich niedriger angesetzte tiefpassfilter beim mp3 encoder finden kann, wenn man nur danach sucht ;-)
    du hast natürlich völlig recht, wenn dein einwand ist, dass das ein wenig sinnvoller usecase ist.

    stimmt, das fraunhofer hat sich ja auch zunehmend anderen codecs zugewendet. jedenfalls gut, dass der lame encoder noch weiter entwickelt wird. in encoder tunings steckt ja richtig arbeit, und die leute, die die von dir genannten vorurteile pflegen, tun mp3 leider unrecht.

    ja diese formulierung trifft es besser, als meine. solche schwierigen stellen trifft man aber tatsächlich ab und zu auch schonmal in "echten" signalen (z.b. in tatsächlichen musikstücken).

    Da hilft ja dann der Mushra test, wo es eine Referenz gibt (die ist gekennzeichnet) und dann nicht gekennzeichnet einen Anker und nochmal die Referenz (und natürlich das signal, um das es eigentlich geht). Wenn man dann zwischen bekannter Referenz, "blinder" Referenz und dem Test Signal nicht mehr unterscheiden kann, dann kann man wirklich getrost von Transparenz sprechen. Das ist dann aber bei 128k i.d.r. noch nicht der Fall.

    vor allem ist es aber hilfreich wenn man weiß, worauf man achten muss. für manche encoder artefakte (oder eher: für manche eigenarten des encoder-klangs) kann man sich auch sensibilisieren. beim hörtest ist noch kein meister vom himmel gefallen. ich könnte mir vorstellen, dass das auch beim ABX test hilft, ein geschultes ohr zu haben.

    das führt jetzt über mp3 hinaus, aber manche codecs können auch gar nicht auf konstanter bitrate laufen.

    ein geneigter leser dieses posts, der der statistik zugeneigt ist, möge in betracht ziehen, nordcores (korrekte) aussage mathematisch herzuleiten. ;-)
     
  21. diese pauschalaussage ist so pauschal erst mal falsch.

    du kannst sehr wohl mit signalen, die wenig unterschiedliche klänge beinhalten, viele schwächen eines codecs aufzeigen. vielleicht nicht unbedingt bei 320k, wo es bei mp3 einfach kaum noch schwächen gibt, aber bei 128k ganz sicher.

    edit: ich möchte das noch etwas relativieren ;-)
    beurteilen ist so ein schönes wort, worüber man sich vortrefflich streiten kann. wenn beurteilen hier also heißt, zu bewerten wie sehr eine schwäche die qualität unter normalen umständen beeinflusst, dann, ja, sollte man vielleicht wirklich dynamische, vielfältige signale nehmen, denn das ist ja später auch der normale use-case für den encoder.
    wenn beurteilen aber heißt: die schwachstelle an sich charakterisieren, dann bleibe ich bei meiner aussage.
    aber die wahrheit ist wohl eine mischung aus beidem...
     
  22. ...ich hab ferstgestellt, das bei 16KHz Schluss ist, regelrecht abgeschnitten (MP3 128-320 KBit fest). Im Samplitude Spektrumanalyser ist da nichts mehr zu sehen, wohl aber beim WAV-Orginal. Bei allen Musikmaterialien, die ich besher geladen hatte.

    Kann das jemand bestätigen?

    Gruß
    Andreas
     
  23. Anonymous

    Anonymous Guest

    http://de.wikipedia.org/wiki/Mp3
     
  24. psicolor

    psicolor Busfahrer und Bademeister

    Ich hör da oben nix mehr! Wie siehts da bei euch aus?
     
  25. Nоrdcore

    Nоrdcore deaktiviert

    Inzwischen auch nix mehr. :opa:
    Fand aber auch damals als ich es noch gehört habe, Bandgrenzen oberhalb von 16kHz wenig störend.
    (... hab das damals aber nur wenig systematisch untersucht - da waren FFT-Analysatoren noch schrankgroße Apparate für rund 60.000DM. )

    Wobei es sicherlich völliger Unsinn ist, auf Analysatoren, die für Lagerschaden-Analyse skaliert sind, zu starren, um die klanglichen Mängel von mp3 zu finden. Das ist esoterische Befindlichkeit: "wer das nicht hört, ist blind".

    *Generell* haben die Encoder da übrigens keine Bandgrenze, bei LAME kann man sie auch einstellen. Die Bandgrenze wird passend zur Bitrate gewählt. Wie oben erwähnt, hat mp3 da ein Design-Problem, dass in dem Bereich die Bits etwas vorzeitig knapp werden, weshalb eine Bandgrenze bei marginalen Klangeinbussen (das hört eh fast keiner, und wenn, dann stört es nicht) die Resultate im Bereich, in dem man gut hört, verbessert.
    Ein typischer Mangel eines schlechten Encoders ist übrigens gerade, dass er *keinen* Tiefpass hat. Dann kann er knappe Bitraten (insbesondere natürlich 128k fix) nicht gut kodieren.
     
  26. jo.
    bei 128k encodiert der aktuelle lame jedenfalls einen einzelnen sinus von 17kHz auch ohne aktiviertes filter.
    das filter ist also zumindest bei 128k nicht zwingend angeschaltet - bei wirklich niedrigen bitraten habe ich es allerdings nicht ausprobiert.
    ich habe jedenfalls den eindruck, dass die logik ausreichend "intelligent" zu sein scheint - wie du schon sagst: filter aktivieren, wenn man dadurch einen für den höreindruck relevanteren bereich mit mehr bits aufbessern könnte, ansonsten "don't care".
     

Diese Seite empfehlen