von pelmazo klug geschissen: Über Ohren, Äpfel und Birnen

Zu den audiophilen Märchen, die highendige Großväter gern am knisternden Forenfeuer in gemütlicher Runde ihren highendigen Enkeln weitererzählen, gehört auch die Geschichte der unbegreiflichen Überlegenheit des menschlichen Ohres über die Technik. Oftmals sind diese Erzählungen eher anekdotisch geprägt, an die Erzählungen des Freiherrn von Münchhausen erinnernd, oder an die von Großonkel Böde.

Manchmal begegnet man aber auch Geschichten, die mit Zahlen und Begriffen gewürzt sind, so daß man sie für bare Münze halten könnte wenn man die Währung nicht kennt mit der sie geprägt sind. So unterhaltsam die Geschichten auch manchmal sein mögen, so bekommt man doch meist Zahl ohne Kopf, und es werden Währungen gegeneinander aufgerechnet, die nicht konvertibel sind.

Ein Beispiel dreht sich um die angeblich unerreichte Empfindlichkeit des menschlichen Ohres gegenüber den erhältlichen Mikrofonen. Ein besonders eifriger Erzähler dieser Mär ist seit Langem einer, der sich "kammerklang" nennt. Siehe z.B. hier, hier oder hier (letztere Stelle war übrigens der Anfang, und man sieht wie wenig man hier mit Argumenten ausrichtet, denn bis heute behauptet kammerklang man habe ihm noch kein Mikrofon nennen können das empfindlicher wäre als das Ohr - ein eindeutiger Wahn).

Um zu verstehen warum man es hier mit einem Versuch zu tun hat, Äpfel mit Birnen zu vergleichen, muß ich ein bißchen ausholen.

Wenn man bei Mikrofonen den Dynamikumfang angibt, dann gelten dafür ganz bestimmte Randbedingungen ohne die man die Meßwerte nicht korrekt einordnen kann. Als untere Grenze nimmt man dabei das Eigenrauschen des Mikrofons. Wie immer wenn's um Rauschen geht muß man wissen über welche Bandbreite gemessen wurde, und ob man eventuell noch irgendwelche Frequenzgewichtungen vorgenommen hat. Wenn z.B. die Meßbandbreite kleiner wird, dann hat man auch einen geringeren Rauschpegel und dadurch einen größeren Dynamikumfang, ohne daß sich am Mikrofon selbst etwas geändert hätte.

Als praxisgerechte Meßbandbreite nimmt man natürlich üblicherweise den hörbaren Frequenzumfang, also in etwa 20 Hz bis 20 kHz. Und was die Gewichtungen angeht gibt's mehrere alternative Bewertungsfilter, die man im Zusammenhang mit Mikrofonen verwendet, und der gemessene Rauschpegel ist entsprechend verschieden. Ein Beispiel eines Mikrofons von Schoeps soll das illustrieren. Schoeps gibt den Ersatzgeräuschpegel mit zwei verschiedenen Bewertungsfiltern an, und das Ergebnis unterscheidet sich um 12 dB.

Um solche Werte mit dem Ohr zu vergleichen müßte man den Ersatzgeräuschpegel des Ohres bestimmen, und zwar unter Verwendung einer entsprechenden Gewichtungsfunktion. Das ist gar nicht so einfach wie man vielleicht denkt, schließlich kann man keinen Pegelmesser an den Hörnerv anklemmen wie an ein Mikrofonkabel. Man muß das indirekt untersuchen indem man z.B. von außen ein Rauschsignal bekannter Stärke auf's Ohr gibt und feststellt ab welcher Stärke es über das Eigenrauschen des Ohrs hinaus geht.

Mit der Hörschwelle hat das nichts zu tun, denn bei der Hörschwelle geht's nicht um die Stärke des "Grundrauschens", sondern um die Hörbarkeit von einzelnen Tönen, und die sind auch noch hörbar wenn ihre Stärke weit unterhalb des Grundrauschens ist. Der Vergleich der Hörschwelle des Ohres mit dem Grundrauschpegel eines Mikrofons ist also ein Vergleich von Äpfeln mit Birnen. Richtig wäre ein Vergleich des Grundrauschpegels des Mikrofons mit dem Grundrauschpegel des Ohres.

Was das Grundrauschen angeht haben Mikrofon und Ohr erst einmal die gleiche Ausgangslage. Die physikalische Grenze ist das Rauschen der Membran selbst, welches aus der thermischen Bewegung der Luft an der Membran resultiert. Die Luftmoleküle trommeln zufallsverteilt an die Membran, und das Ergebnis ist ein Rauschsignal. Das bedeutet aber auch bereits daß man in der Technik theoretisch zur Verbesserung des Dynamikbereiches eine Maßnahme zur Verfügung hat, die beim menschlichen Ohr nicht möglich ist: Man kühlt die ganze Anordnung stark ab. Besonders praktisch für normale Mikrofone ist das nicht, aber eine definitive Möglichkeit für Forschungszwecke ist es auf jeden Fall. Zum Glück gibt's auch noch einfachere Möglichkeiten. Wenn man z.B. die Membranfläche verdoppelt, so steigt die Signalstärke des Nutzsignals um 6 dB, während der Grundrauschpegel bloß um 3 dB steigt. Man hat also 3 dB Dynamik gewonnen. Eine einfache und durchaus praktikable Maßnahme, die man beim Ohr ebenfalls nicht hat.

Neben der Membran selbst gibt es aber sowohl beim Mikrofon als auch beim Ohr weitere Rauschquellen. Beim Mikrofon ist das z.B. der Mikrofonvorverstärker. Bei vielen Mikrofonen rauscht der mehr als die Membran, das Gesamtergebnis ist also nicht durch die Membran sondern durch die Elektronik begrenzt. Das muß aber nicht so sein. Es gibt durchaus Mikrofone, deren Elektronikrauschen in der gleichen Größenordnung liegt wie das der Membran. Bei Großmembranmikrofonen ist das leichter als bei Kleinmembranmikrofonen, aber es geht und ist praktikabel, auch ohne solche Tricks wie in flüssigem Stickstoff gekühlte Transistoren.

Beim Ohr gibt es Rauschquellen die die Membran weit übertreffen, schon das Geräusch des in den Adern zirkulierenden Blutes ist weit stärker als das Membranrauschen. Wir würden es eigentlich dauernd hören wenn nicht unsere Wahrnehmung das Geräusch ausblenden würde. Da das Spektrum dieses Rauschens nicht weiß ist hängt es stark von der Bewertung ab wie sich das in Zahlen ausdrückt, aber es ist nicht unrealistisch von Werten um 30 dB(SPL) für das Grundrauschen des Ohres anzugeben, ein Wert den ein Mikrofon bequem unterbietet.

Wenn man anders herum die Hörschwelle bei Sinustönen betrachtet, wie das üblicherweise beim Ohr getan wird (die entsprechende frequenzabhängige Kurve werdet Ihr schon gesehen haben, z.B. hier), dann müßte man dagegen setzen wie schwach ein Sinuston sein darf den man gerade noch meßtechnisch inmitten des Grundrauschens isolieren kann. Der Pegel des Grundrauschens selbst ist dafür kein Maß, denn genauso wie das Ohr kann auch die Meßtechnik Signale nachweisen die weit unterhalb des Rauschpegels liegen. Das ist weniger mysteriös wie es scheint:

Ein einzelner Sinuston enthält nur eine Frequenz. Die kann man auch sehr schmalbandig messen, das heißt man braucht bloß ein Meßgerät, das für andere Frequenzen unempfindlich ist, und bloß empfindlich für die interessierende Frequenz. Damit wird der allergrößte Teil des Rauschens ausgeblendet, weil es sich bei anderen Frequenzen abspielt. Letztlich ist das wieder das oben schon erwähnte Bandbreitenargument bei Rauschen. Wenn man nur die Meßbandbreite schmal genug macht, dann sinkt der Rauschpegel der Messung so weit daß das Sinusignal irgendwann aus dem Rauschen hervor tritt.

Vor diesem Hintergrund gesehen hängt die "Hörschwelle" der Meßtechnik lediglich von der erzielbaren "Schmalheit" der Meßbandbreite ab. Es gibt diverse technische Tricks wie man diese Bandbreite verringern kann. Extrembeispiel ist der sog. Lock-In-Verstärker, der eigentlich kein Verstärker ist sondern eine deutlich komplexere Apparatur, der aber so schmalbandig gemacht werden kann daß man Signale messen kann die 80 dB und mehr unter dem Rauschteppich sind. Das sind Größenordnungen besser als es das Ohr vermag, und so etwas ist auch nötig wenn man z.B. mit Jupitersonden kommunizieren will oder physikalische Phänomene untersuchen will.

Für den "Hausgebrauch" braucht man so weit nicht zu gehen, man kann ausreichend tief unter den Rauschteppich schauen indem man seinen Computer eine hochauflösende FFT des Spektrums machen läßt, was man bekanntlich heutzutage mit Soundkarten und freier Software kann. Die FFT unterteilt letztlich den Frequenzbereich in schmale Bereiche, deren Pegel auf dem Bildschirm in Einzelpunkten dargestellt wird. Je größer die Anzahl der FFT-Punkte, desto schmaler sind die Breiten der Bereiche (auch "Bins" genannt) und desto tiefer der scheinbare Rauschpegel. Könnt Ihr leicht feststellen, indem Ihr mal von ein und demselben Signal eine FFT mit 1000 Punkten und eine mit 8000 Punkten macht. Der Rauschteppich ist auf einem signifikant tieferen Niveau bei der zweiten Darstellung.

Das Beispiel mit der FFT ist sogar der fairere Vergleich mit dem Ohr, denn auch das Ohr macht letztlich eine Spektralanalyse des Signals. Im Innenohr werden die Frequenzen räumlich so getrennt daß für unterschiedliche Frequenzen unterschiedliche Sinneshärchen zuständig sind. Jedes Sinneshärchen kriegt dadurch bloß einen sehr schmalen Bereich aus dem Spektrum mit, und genau diese Schmalbandigkeit ist es was die Detektion schwacher Signale weit unterhalb des Rauschteppichs erlaubt. Wenn man also mit ähnlichen Methoden arbeitet kann man auch zu ähnlichen Ergebnissen kommen.

Wenn man also das Mikrofon mit den Möglichkeiten der Meßtechnik kombiniert, und das dann mit dem Ohr vergleicht, dann verliert das Ohr haushoch. Das Eigenrauschen des Mikrofones selbst ist schon geringer, und zusätzlich kann man in der Auswertung noch schmalbandiger arbeiten als es das Ohr vermag. Der Unterschied summiert sich so auf mehrere Zehnerpotenzen.

Am anderen Ende der Skala, bei den maximalen Schalldrücken, sieht es nicht besser aus. Ein Vergleich zwischen dem maximalen angegebenen Schalldruck eines Mikrofons mit der Schmerzschwelle des Ohrs geht ebenfalls in die Irre. Wieder vergleicht man da Äpfel mit Birnen, weil die Randbedingungen nicht vergleichbar sind.

Der maximale Schalldruck eines Mikrofons wird unter der Bedingung einer ganz bestimmten Grenze der Verzerrungen angegeben. Schoeps z.B. gibt ihn bei einer Verzerrung von 0,5% an. Das heißt es ginge auch lauter, bloß nehmen dann die Verzerrungen deutlich zu. Wären die Verzerrungen egal, dann wäre das nächste Limit ein Schalldruck bei dem das Mikrofon beschädigt würde. Diese "Überlebensgrenze" kann aber ohne weiteres nochmal 30 oder 40 dB über der Verzerrungsgrenze liegen.

Beim Ohr ist die Schmerzgrenze ohne Rücksicht auf die Verzerrungen angegeben. Auch das Ohr produziert eigene nichtlineare Verzerrungen, und wenn der Schallpegel steigt immer mehr. Das Äquivalent der Schmerzgrenze wäre beim Mikrofon eher die "Überlebensgrenze", denn wenn man das Ohr an der Schmerzgrenze belastet nimmt es recht schnell bleibenden Schaden.

Bei einem in diesem Sinne fairen Vergleich gewinnen wieder die Mikrofone, denn da findet man "Überlebensgrenzen" von 160 oder 170 dB(SPL), während die Schmerzgrenze beim Gehör bei um die 140 dB(SPL) angesetzt wird. Noch krasser ist es wenn man die Verzerrungsgrenze als Maßstab nimmt, denn dann müßte man beim Ohr etwa 70 bis 80 dB(SPL) als Grenze ansetzen, wenn man das Limit wie bei Schoeps auf 0,5% Verzerrungen bezieht. Bei mehr Schalldruck verzerrt das Ohr dann schon zu viel. Das Mikrofon kann unter diesen Umständen auch noch 130 dB(SPL) verkraften.

Spiel, Satz und Sieg für die Mikrofone. Das ist das Ergebnis eines fairen und nicht durch völlig unterschiedliche Bewertungskriterien verzerrten Vergleichs. Die Sache zeigt wie sehr man durch solche Apfel-Birne-Vergleiche die Ergebnisse manipulieren kann, selbst wenn man mit realen Rohdaten arbeitet.

Trotzdem will ich damit nicht das Ohr schlecht reden. Es ist bloß so daß dessen erstaunlichste Fähigkeiten gar nicht vom Ohr selbst kommen, sondern vom Gehirn das die aufgenommenen Signale auswertet. Im Grunde ist es eher so daß das Gehirn aus einem relativ mäßigen Datenangebot des "Sensors" Ohr das Maximum herausholt. Oft genug holt es auch mehr heraus als drin ist, denn ein bedeutender Teil der Wahrnehmung stammt nicht aus den Sensordaten sondern aus im Gehirn gespeicherten Mustern, also aus "Vorwissen" in der allgemeinsten Form.

Auch das ist ein Grund warum das Gehör einem Vergleich mit der Meßtechnik nicht standhält. Die Meßtechnik versucht einen Aspekt unter vielen zu isolieren um ihn unabhängig und unverfälscht quantifizieren zu können. Das kann man bis ins Extreme treiben, weit jenseits dessen was das Gehör könnte. Das ist nicht und war aber nie der Zweck des Gehörs. Da geht es eher darum Bezüge herzustellen zu Erfahrungen und zu Interpretationsmustern.

Kommentare bitte im üblichen Thread im Hifi-Forum.

Sonntag, 23. Januar 2011

Über Ohren, Äpfel und Birnen