Irgendwie hatte ich heute mal wieder Lust, einen Blogartikel zu schreiben. Immerhin bleibt so nach länglicher Pause das Jahr 2019 nicht gänzlich leer.
Das Thema ist allerdings nicht gerade taufrisch, im Gegenteil scheint es ungefähr 20 Jahre alt zu sein, denn HeadRoom Audio rühmt sich, vor 20 Jahren den Trend mit ihrem Verstärker BlockHead ausgelöst zu haben. Die Firma scheint verblichen zu sein, und der Verstärker war erlesen häßlich. Zudem noch unpraktisch, denn man mußte den Kopfhörer mittels zweier 3-pol XLR Stecker anschließen. Kein Wunder also daß der Tester von Stereophile damals begeistert war. War bei einem Preis von fast $4000 auch zu erwarten.
Inzwischen haben sich diverse Firmen dieses Themas angenommen, und bieten Geräte und Kopfhörer für symmetrischen Anschluß an. Immerhin hat man sich inzwischen auf einen einheitlichen Stecker geeinigt, nämlich einen 4-pol XLR, so daß man wenigstens nicht mit zwei Steckern pro Kopfhörer rummachen muß. In jüngster Zeit ist schließlich mit dem "Pentaconn" ein 5-pol Klinkenstecker aus Japan für den gleichen Zweck auf uns gekommen, der wegen seines anderen Durchmessers von 4,4 mm nicht mit den bekannten Klinkensteckern kompatibel ist.
Ich finde es geradezu ironisch, daß man sich ausgerechnet bei Kopfhörern um Symmetrierung bemüht, wo das am wenigsten bringt. Ebenfalls ironisch ist, daß der in Deutschland normierte und weithin verwendete Kopfhörerstecker der 70-er Jahre, der sog. "Würfelstecker", schon symmetrisch war. Es hätte überhaupt keinen Grund gegeben, sich nach einem neuen Stecker umzusehen, man hätte einfach den alten Würfelstecker wieder herauskramen können. Schließlich, noch eine Ironie, ist ein Kopfhörer, genauer gesagt der Schallwandler an jedem Ohr, eigentlich ohnehin grundsätzlich symmetrisch.
Der einzige Unterschied zum heutigen System auf Klinkenstecker-Basis ist daher, ob man für einen der zwei Anschlüsse jedes Schallwandlers einen gemeinsamen Kontakt im Stecker nimmt, oder zwei getrennte. Natürlicherweise hat nämlich ein Kopfhörer 4 Anschlüsse, für jede Seite zwei, denn Strom fließt bekanntlich im Kreis, weswegen man von Stromkreis spricht, und Stromkreise hat man bei Stereo nun einmal zwei. Damit der Strom hin und auch wieder zurück fließen kann, braucht es für jeden Stromkreis eben zwei Anschlüsse. Macht zusammen vier.
Ein Schallwandler ist als Bauteil mit 2 Anschlüssen für sich genommen automatisch symmetrisch, genauso wie ein Lautsprecher, ein Tonabnehmer oder ein dynamisches Mikrofon. Wenn man die Anschlüsse vertauscht ändert sich nichts außer die "Phase", also die Polarität des Signals. Im Prinzip kann man daher jeden Kopfhörer symmetrisch anschließen, es ist bloß eine Frage der Verdrahtung.
Die konventionelle Verdrahtung nimmt einen der beiden Anschlüsse jeder Seite zu einem gemeinsamen Anschluß zusammen, um einen Steckerkontakt zu sparen. Der gemeinsame Kontakt wird meist als "Masse" bezeichnet, es gibt aber keinen zwingenden Grund warum er mit der Masse irgendeines Gerätes verbunden sein müßte, denn der Kopfhörer ist "massefrei". Dieses Zusammenlegen zweier Kontakte ist der einzige Grund warum man davon spricht, der Kopfhörer sei "unsymmetrisch".
Das bringt mich zur Kernfrage: Welches Problem wird mit symmetrischen Kopfhörern überhaupt gelöst? Was ist an
symmetrischen Anschlüssen besser als an den bekannten
Klinkensteckern?
Die Befürworter verweisen oft auf die bessere Kanaltrennung, bzw. das geringere Übersprechen. Das ist in zweierlei Hinsicht irreführend, obwohl das Argument einen wahren Kern hat.
Der wahre Kern besteht in einem Übersprechmechanismus, der "Kopplung durch eine gemeinsame Impedanz" heißt. Wenn zwei Stromkreise eine gemeinsame Impedanz haben, also eine Strecke gemeinsamen Weges für die Ströme in beiden Stromkreisen, dann führt das dazu, daß die Signale beider Stromkreise sich gegenseitig stören. Wie groß die Störung ist, hängt von den Einzelheiten ab, vor allem von der Größe der gemeinsamen Impedanz im Vergleich zur Impedanz des ganzen Stromkreises.
Ich rede von Impedanz anstelle von Widerstand, weil wir es hier mit Wechselströmen zu tun haben, und da ist der korrekte Begriff eben "Impedanz". Für den Hausgebrauch kann man es aber der Einfachheit halber auch mit dem Widerstand gleichsetzen. Für beide gilt jedenfalls das Ohmsche Gesetz aus der Schule.
Wenn man beim Kopfhörer einen der beiden Anschlüsse jeder Seite im Kabel auf einen gemeinsamen Draht legt, der zum Stecker führt, dann ist die Impedanz dieses gemeinsamen Drahtes die gemeinsame Impedanz, über die das Signal von einer Seite auf die andere koppelt. Das ist unser wahrer Kern.
Die eine Hinsicht, in der das irreführend ist, hat mit der Psychoakustik zu tun. Über einen Kopfhörer hört man Stereo, und da ist in der Praxis nicht viel Kanaltrennung nötig. Wenn ein kleines bißchen Signal von links nach rechts überspricht, oder umgekehrt, dann geht das wahrnehmungsmäßig unter, es sei denn das Übersprechen ist ausgesprochen stark. Wir reden hier von Übersprechen, das selbst in ungünstigen Situationen wohl kaum 1% erreicht, und das müßte nach allem was man weiß psychoakustisch unbedenklich sein.
Die andere Hinsicht, in der es irreführend ist, liegt in der Größe der gemeinsamen Impedanz, bzw. wie man sie minimieren kann. Es ist Euch vielleicht aufgefallen, daß ich oben von einer Strecke geschrieben habe, durch die die Impedanz zustande kommt. Nun, diese Strecke kann man auch dadurch minimieren, daß man die Leitungen bis in den Stecker hinein getrennt hält, und erst dort zusammen führt. Die gemeinsame Strecke beschränkt sich dann auf einen oder zwei Zentimeter im Stecker bzw. in der Buchse. Die gemeinsame Impedanz wird dann auch ohne völlige Trennung ziemlich klein. Viele Kopfhörer machen das ohnehin schon lange, weil man zum linken und rechten Schallwandler getrennte Leitungen legt, die nur mechanisch aneinander haften, aber keinen elektrischen Kontakt bewirken. Verbunden werden die beiden Seiten nur im Stecker.
Durch eine völlige Trennung der beiden Seiten mittels eines 4-pol Steckers eliminiert man also nur noch einen sehr kleinen Rest an gemeinsamer Impedanz, wie sie durch den Stecker und die Buchse zustande kommen. Genauer gesagt durch den "Massekontakt" in diesem Stecker/Buchse-System.
Aber gut, man kann das Ganze auch von der anderen Seite her sehen, und sagen, der symmetrische Anschluß sei der "natürliche" Weg, einen Kopfhörer anzuschließen, denn er ist nun einmal für sich gesehen vierpolig, zwei pro Seite. Egal ob das nun einen merklichen Unterschied macht oder nicht. Man muß so auch nicht eine technische Kompromißentscheidung über eine quantitative Betrachtung rechtfertigen - man hat die Verbindung auf technisch optimale Weise vollzogen.
Das heißt man hätte beim Würfelstecker bleiben können, denn der war in dieser Hinsicht schon optimal. Daß solche DIN-Stecker nicht gar so billig und beschissen sein müssen als sie aus Kostengründen oft waren, kann man an der Verwendung robusterer Varianten in der Industrie noch heute sehen. Ein dem XLR-Stecker vergleichbares Qualitätsniveau ist jedenfalls damit kein Problem.
Daß man beim Würfelstecker nicht geblieben ist, und stattdessen in den 80-er Jahren auf den Klinkenstecker ungestiegen ist, muß aber seine Gründe gehabt haben, die seither bestimmt nicht einfach verschwunden sind. Es muß einen Grund geben, warum der Klinkenstecker besser ist, obwohl er "einen Kontakt zu wenig" hat. Und der ist leicht zu sehen: Einen Klinkenstecker kann man "blind" stecken, während man Würfelstecker oder XLR-Stecker in die richtige Position drehen muß. Für Verbindungen, die oft gesteckt werden, ist damit der Klinkenstecker die bessere weil bequemere Wahl.
Beim Würfelstecker wollte man wohl zu clever sein, denn damals fand man es nützlich, wenn man den Stecker in 2 unterschiedlichen Orientierungen in die Buchse stecken konnte, denn durch einen in der Buchse eingebauten Schalter konnte das Gerät die Orientierung "erfühlen", und das dazu verwenden, wahlweise den Lautsprecher ein- oder auszuschalten wenn ein Kopfhörer eingesteckt war. Im Grunde hat man damit nur einen getrennten Schalter eingespart, den man unabhängig betätigen kann. In meinen Augen eine gut gemeinte Schnapsidee, denn eigentlich will man den Lautsprecher ein- oder ausschalten können, ohne den Kopfhörer umstecken zu müssen.
Die beiden Orientierungen führten auch dazu, daß die Phase der beiden Schallwandler gedreht wurde, was man (mit einigem Recht) für gleichgültig hielt. Aber man hätte eine der beiden Orientierungen auch blockieren können, wenn man das gewollt hätte. Dann hätte es auch kein Problem mit der Phase gegeben. Es gab sogar einen fünften Kontakt, den in der Mitte, der auf Masse lag, so daß man daran einen Schirm fürs Kabel hätte anschließen können. Was aber im Grunde unnötig ist.
Sennheiser hatte sogar mal eine Zeit lang einen stapelbaren Würfelstecker gebaut. Der hatte eine Buchse, in die man einen weiteren Kopfhörer einstecken konnte, so daß mehrere Leute das gleiche Signal hören konnten. Bei Klinkensteckern braucht so etwas einen Y-Adapter. Aber da man die Lautstärke nicht getrennt regeln kann, ist das auch nicht besonders nützlich. Wann will man schon mal zu zweit oder mehreren das gleiche Stück gleich laut mit Kopfhörer hören?
Ich bin daher nicht so überzeugt daß der 4-pol XLR für Kopfhörer der Bringer ist, leidet er doch unter ganz ähnlichen Nachteilen wie weiland der Würfelstecker. Vielleicht ist da dem Pentaconn mehr Erfolg beschert, denn es ist ein Klinkenstecker. Weil er außerdem wesentlich kleiner ist, passt er auch besser zu tragbaren Geräten.
Die Motivation für einen symmetrischen Kopfhörerstecker bei tragbaren Geräten hat mit dem Übersprechen übrigens recht wenig zu tun, egal was einem das Marketing auch weiszumachen versucht. Sony verbreitet zwar gerne audiophilen Bullshit, aber hinter dem Pentaconn steckt der Trend zu immer kleineren Betriebsspannungen in tragbaren Geräten. Wenn man da auf dem Kopfhörer noch einen anständigen Pegel erreichen will, dann kommt man darauf, daß man gerne "gebrückte" Verstärker einsetzen würde, denn damit kann man bei gleicher Betriebsspannung und gleicher Kopfhörerimpedanz die vierfache Leistung an den Kopfhörer abgeben. Für den gleichen Effekt müßte man einen normalen Verstärker mit der doppelten Betriebsspannung versorgen.
Gebrückte Verstärker gibt es bei Lautsprechern schon sehr lange, besonders im Auto sind sie sehr verbreitet. Dabei nimmt man zwei Verstärker für einen Lautsprecher, die in Gegenphase arbeiten, und jeder einen Anschluß des Lautsprechers antreibt. Das ist also ebenfalls "symmetrisch", wobei man das nicht wegen der Störunempfindlichkeit macht, sondern wegen der größeren Leistung bei gegebener Betriebsspannung. Lohnen tut sich das immer dann, wenn man für das Bereitstellen einer höheren Betriebsspannung mehr Aufwand treiben müßte, als es der zusätzliche Verstärker darstellt. Bei batterieversorgten Geräten kann das leicht vorkommen.
Die "unsymmetrischen" Kopfhöreranschlüsse mit klassischem Klinkenstecker stehen dieser gebrückten Betriebsart aber im Weg, denn dafür braucht man getrennte Anschlüsse für beide Schallwandler. Die Motivation für den Pentaconn ist also recht pragmatisch, wenngleich sich das Marketing vermutlich gedacht hat, daß man mit dem audiophilen Märchen wohl weiter kommt.
Für den Pentaconn als Kopfhörerstecker kann ich mich folglich durchaus erwärmen, vielleicht verschwindet der 4-pol XLR dadurch allmählich wieder in der Versenkung, was nicht das Schlechteste wäre. Daß er in seiner Größe zwischen dem 3,5 mm Klinkenstecker und dem 6,35 mm Klinkenstecker liegt finde ich durchaus nicht schlecht, denn das macht ihn meiner Ansicht nach robust genug auch für "ernsthafte" Anwendungen.
Wenn nur die unsinnigen audiophilen Begründungen nicht wären...
Noch ein Nachtrag:
Um den Punkt mit der gebrückten Verstärkertechnik noch etwas zu vertiefen, und meine Präferenz für den Pentacomm noch zu unterstreichen, rate ich dazu, sich mal zu überlegen wie wohl Adapter aussehen müssen, die zwischen der symmetrischen und der unsymmetrischen Anschlußtechnik vermitteln. Da gibt es zwei Fälle:
1. Ein symmetrischer Kopfhörer soll an einem Gerät betrieben werden, das konventionelle Kopfhörerausgänge hat. Das ist der einfache Fall. Man verbindet einfach beide Rückleitungen (oft auch mit L- und R- bezeichnet) des Kopfhörers mit dem Masseanschluß des TRS-Klinkensteckers.
2. Ein unsymmetrischer Kopfhörer mit TRS-Klinkenstecker soll an einem symmetrischen Ausgang des Gerätes betrieben werden. Das ist der spannende Fall. Wenn man es genauso verdrahtet wie im obigen Fall, dann verbindet man zwei Ausgangssignale miteinander. Wenn das Gerät einen gebrückten Ausgang hat, was wie oben erklärt der einzige wirklich relevante Grund für die symmetrische Anschlußtechnik ist, dann werden durch so eine Adapterverdrahtung zwei Ausgänge gegeneinander arbeiten. Auch wenn sie davon nicht kaputt gehen, ist das doch nicht gut, und kann z.B. schnell die Batterie leersaugen.
Solche Adapter für den zweiten Fall gibt es schon, und das ist schon nahe an der Irreführung von Käufern, denn die funktionieren nur zufriedenstellend, wenn die gebrückte Verstärkertechnik eben nicht benutzt wird. In diesem Fall braucht man aber die ganze symmetrische Anschlußtechnik nicht.
Der Pentaconn ist für diese Situation gerüstet, denn der zusätzliche Massekontakt macht es überflüssig, die L- und R- Anschlüsse zu benutzen, wenn man auf unsymmetrische Anschlußtechnik umsteigen will. Man verliert dabei zwar die halbe Ausgangsspannung, kann also nicht ganz so laut hören wie bei symmetrisch angeschlossenen Hörern, aber es passiert ansonsten nichts Problematisches.
Das ist eines des typischen Probleme in der Audiotechnik: Gerade kleinere Firmen machen sich bei der Einführung ihrer neuesten "guten Idee" selten genug Gedanken, wie das zusammen passt mit dem was schon auf dem Markt ist. Besonders gut sichtbar ist das bei den Firmen, die für den symmetrischen Anschluß einfach den 4-pol 3,5 mm Klinkenstecker benutzen, ohne sich darum zu kümmern wie man dem Kunden erklärt was nun zusammen passt und was nicht. Oder auch der "Pionier" HeadRoom Audio, der einfach den weiblichen 3-pol XLR als Ausgang betreibt, wo doch bei XLR allgemein üblich ist, den männlichen als Ausgang und den weiblichen als Eingang zu benutzen. So etwas kann nur Verwirrung stiften. Ich finde das verantwortungslos.
Da der Pentaconn recht spät auf der Bildfläche erschienen ist, gibt es Leute die sich fragen, ob es wirklich noch einen weiteren Stecker für symmetrische Kopfhörer gebraucht hat. Ich denke ja. Der Pentaconn ist die beste Lösung für diese Anwendung. Die Vorgänger haben nicht weit genug gedacht.
Aber wie es bei Audiophilen so ist, würde mich nicht wundern wenn der Stecker gerade deswegen durchfällt. Wer will da schon eine gut durchdachte Lösung?
Posts für Suchanfrage kopfhörer werden nach Relevanz sortiert angezeigt. Nach Datum sortieren Alle Posts anzeigen
Posts für Suchanfrage kopfhörer werden nach Relevanz sortiert angezeigt. Nach Datum sortieren Alle Posts anzeigen
Donnerstag, 5. Dezember 2019
Sonntag, 22. März 2009
Kopfhörer und technische Daten - ein Elend
Oft frage ich mich warum ein Hersteller für sein Produkt technische Daten angibt, wenn man damit sowieso nichts anfangen kann. Der Laie kann damit nichts anfangen weil er eben ein Laie ist, und der Fachmann kann nichts damit anfangen weil die Angaben zu undetailliert, oder zu vage sind.
Gerade ärgere ich mich zum Beispiel mal wieder über die Situation bei Kopfhörern und den zugehörigen Kopfhörerverstärkern. Im Speziellen geht's mir hier mal um die Situation bei den Impedanzen.
Zuerst einmal zum Problem, warum die Impedanzen überhaupt interessieren.
Die Impedanz des Kopfhörers bildet mit der Quellimpedanz des Verstärkers einen Spannungsteiler. Wäre das Teilerverhältnis über die Frequenz immer gleich, dann würde das keine Rolle spielen, denn es hätte keine Auswirkungen auf den Frequenzgang des Kopfhörers. Davon kann man aber leider nicht ausgehen, denn die Impedanz eines Kopfhörers ist über die Frequenz meist nicht konstant. Die Quellimpedanz des Verstärkers dagegen ist das weitgehend schon. Das Ergebnis ist ein Frequenzgang des Kopfhörers, der je nach Quellimpedanz des Verstärkers variiert. Der Klang des Kopfhörers ist also in gewissen Grenzen davon abhängig welchen Verstärker man benutzt. Kopfhörerverstärker haben unterschiedliche Quellimpedanzen, und Die richtige Quellimpedanz existiert nicht.
Nun gut, die Audiophilen wußten das schon lange, bloß wissen viele davon nicht daß das an einem Bauteil im Ausgang des Verstärkers liegen kann, das wenige Cent wert ist. Stattdessen vermutet man lieber Silberdrähte, Kondensatoren, resonanzarme Gehäuse oder hölzerne Volume-Knöpfe als Ursache.
Aber Audiophilie beiseite, was aus dieser Situation folgt ist mehrerlei:
Immerhin, es wird eine Norm-Quellimpedanz von 120 Ω angegeben, und das ist ja schon etwas woran man sich halten kann. Falls man nichts Näheres liest, müßte man also davon ausgehen daß das die Quellimpedanz ist bei der die Hersteller ihre Messungen gemacht haben. Und bei eben dieser Quellimpedanz müßten in Ermangelung expliziter Angaben auch die Messungen anderer Leute, wie z.B. der Produkt-Tester von Zeitschriften, gemacht werden.
Auf der Webseite von HeadRoom kann man zum Beispiel etliche Frequenzgänge und Impedanzkurven ansehen, und sie beschreiben auch wie sie messen. Bloß was erfährt man nicht? Genau: Die Quellimpedanz. Lediglich angegeben wird das Verstärkermodell das sie verwenden, wenn man aber nachforscht was der wohl für eine Impedanz hat, dann findet man eine alte Bedienungsanleitung in der gar keine technischen Daten stehen. Vielleicht kann hier ja ein Leser aushelfen. Man müßte in dieser Situation eigentlich annehmen, daß es sich bei der Quellimpedanz um 120 Ω handelt, aber ich habe den leisen Verdacht daß es sich um einen sehr niederohmigen Verstärker handeln könnte, wie es unter "High-End"-Verstärkern öfter der Fall ist.
Wir können ja mal an einem Beispiel durchspielen was das für Auswirkungen hat. Die erwähnte Webseite zeigt für den AKG K240 diesen Impedanzschrieb, aus dem hervorgeht daß über weite Strecken die Impedanz um die 55 Ω beträgt, bei 100 Hz ist aber eine Resonanzstelle bei der sie auf 150 Ω ansteigt. Wenn nun hypothetischerweise der Frequenzgang bei 0 Ω Quellimpedanz schnurgerade wäre, dann hätte man bei 120 Ω Quellimpedanz einen Buckel bei 100 Hz von ca. 5 dB. Der Kopfhörer hätte also bei größerer Quellimpedanz deutlich mehr Tiefbass.
Natürlich macht eine höhere Quellimpedanz den Kopfhörer auch leiser, aber das kann man mit dem Lautstärkeknopf leicht ausgleichen. Angesichts der geringen benötigten Leistungen ist auch der Verlust im 120 Ω Widerstand im Verstärker unbedeutend.
Wenn eine Quellimpedanz solche Einflusse hat, warum macht man dann nicht alle Kopfhörer-Verstärker und die Normen gleich so daß man bei 0 Ω Quellimpedanz arbeitet, wie bei Lautsprechern auch? Immerhin fällt so eine Variable weg. Abgesehen von den "historischen Gründen", die man hier immer wieder anführen kann, ist mein Verdacht daß man dabei vor allem denjenigen Herstellern entgegen kommt, die den Kopfhörerausgang an einem Verstärker einfach durch Vorwiderstand vom normalen Verstärkerausgang abzweigen, statt für den Kopfhörer eine eigene Verstärkerstufe zu spendieren.
Eigentlich ist das aber Quark, und in Zeiten wie heute wo viele Kopfhörer eher niedrige Impedanzen haben, damit sie auch von niedrigen Spannungen noch laut genug getrieben werden können, wie man es bei MP3-Spielern und anderem tragbaren Zeug findet, ist eine Quellimpedanz von 120 Ω eigentlich ein Anachronismus. Wenn man einen niederohmigen Kopfhörer bei einer so hohen Quellimpedanz mißt, dann sind die elektrischen Verhältnisse bei der Messung drastisch anders als im normalen Betrieb, und die Meßergebnisse werden eine sehr fragliche Relevanz haben. Speziell die aufgenommene Frequenzgangkurve wird also unter Umständen ganz anders aussehen als im Normalbetrieb.
Für die Beteiligten am Markt entsteht dadurch eine eigentlich unmögliche Situation. Wenn der Hersteller des Kopfhörers den Frequenzgang so auslegt daß er bei 120 Ohm Quellimpedanz am ehesten "paßt", dann wird es an "Kleingeräten" oder vielen Kopfhörerverstärkern tendenziell falsch klingen, wo die Impedanzen viel kleiner sind. Dem könnte er entgegen wirken indem er versucht die Impedanzkurve möglichst linear zu machen, aber das erfordert entweder Zusatzaufwand in Form eines Zusatznetzwerks (wo bringt man die Bauteile unter?), oder es schränkt einen bei der Konstruktion des Systems zu stark ein.
Orientiert sich der Hersteller eher an niedrigen Quellimpedanzen, dann wird ein unter Normbedingungen aufgenommener Frequenzschrieb einen falschen Eindruck erzeugen. Außerdem klingt's dann am Kopfhörerausgang eines normalen Verstärkers womöglich falsch.
Und wie soll man dann Kopfhörer testen? Welche Quellimpedanz legt man zugrunde? Und egal welche man zugrunde legt, das Ergebnis wird nicht für alle Leser und Kunden nachvollziehbar sein, denn nicht alle werden die gleiche Quellimpedanz in ihrem Gerät haben.
Bisher kommt es mir so vor als ob das Problem von allen Beteiligten ignoriert wird. Nachvollziehbare und aussagekräftige Informationen will man offenbar gar nicht verbreiten, lieber produziert man sinnloses und inhaltsleeres Klanggeschwafel, mit dem niemand etwas anfangen kann.
Nachtrag: Ich bin noch auf eine Untersuchung aufmerksam geworden, die bei Sennheiser gemacht wurde, einschließlich damit verbundener Hörtests. Auf der Tonmeistertagung 1990 haben zwei Mitarbeiter darüber berichtet. Der Beitrag ist im Tagungsband enthalten (Dellbrügge, Sander-Röttcher: "Einfluß des Verstärker-Innenwiderstandes auf die Klangeigenschaften von Kopfhörern"). Hier ihre Zusammenfassung:
Gerade ärgere ich mich zum Beispiel mal wieder über die Situation bei Kopfhörern und den zugehörigen Kopfhörerverstärkern. Im Speziellen geht's mir hier mal um die Situation bei den Impedanzen.
Zuerst einmal zum Problem, warum die Impedanzen überhaupt interessieren.
Die Impedanz des Kopfhörers bildet mit der Quellimpedanz des Verstärkers einen Spannungsteiler. Wäre das Teilerverhältnis über die Frequenz immer gleich, dann würde das keine Rolle spielen, denn es hätte keine Auswirkungen auf den Frequenzgang des Kopfhörers. Davon kann man aber leider nicht ausgehen, denn die Impedanz eines Kopfhörers ist über die Frequenz meist nicht konstant. Die Quellimpedanz des Verstärkers dagegen ist das weitgehend schon. Das Ergebnis ist ein Frequenzgang des Kopfhörers, der je nach Quellimpedanz des Verstärkers variiert. Der Klang des Kopfhörers ist also in gewissen Grenzen davon abhängig welchen Verstärker man benutzt. Kopfhörerverstärker haben unterschiedliche Quellimpedanzen, und Die richtige Quellimpedanz existiert nicht.
Nun gut, die Audiophilen wußten das schon lange, bloß wissen viele davon nicht daß das an einem Bauteil im Ausgang des Verstärkers liegen kann, das wenige Cent wert ist. Stattdessen vermutet man lieber Silberdrähte, Kondensatoren, resonanzarme Gehäuse oder hölzerne Volume-Knöpfe als Ursache.
Aber Audiophilie beiseite, was aus dieser Situation folgt ist mehrerlei:
- Durch einen einzelnen Zahlenwert wie die "Nennimpedanz" ist der Kopfhörer nicht ausreichend beschrieben. Man bräuchte die Impedanzkurve über die Frequenz. Leider ist es nicht allgemein üblich die in den technischen Daten anzugeben, obwohl sie für die Hersteller einfach zu messen wäre.
- Die Quellimpedanz eines Kopfhörerverstärkers ist eine wichtige Information und sollte in den technischen Daten stehen.
- Klangbeschreibungen eines Kopfhörers sagen nicht viel aus wenn man nicht weiß bei welcher Quellimpedanz sie zustande kamen. Na gut, Klangbeschreibungen sagen oft sowieso sehr wenig aus, dann kommt's darauf vielleicht auch nicht mehr an...
- Der Hersteller eines Kopfhörers müßte eigentlich dazu schreiben welche Quellimpedanz er empfiehlt, und insbesondere bei welcher Quellimpedanz er seine Messungen gemacht hat.
"The performance of most types of headphones depends very little on the source impedance. However, in order to allow headphones of widely different impedances to be reasonably well-matched, in terms of the sound pressure level produced, to a single headphone output on other equipment, IEC 60268-15 at present specifies a source impedance of 120 Ω, intermediate between the lowest and highest likely impedances of available headphones. It is thus important for the manufacturer to specify the rated source impedance, particularly if, for some reason, it is not 120 Ω."Womit sie recht haben ist daß man die Quellimpedanz angeben sollte, zumindest wenn sie nicht 120 Ω beträgt. Wie man aber auf die Idee kommen kann das spiele kaum eine Rolle, das ist mir schleierhaft. Es gibt auf dem Markt viele Kopfhörer, deren Impedanz über die Frequenz so stark schwankt daß unterschiedliche Quellimpedanzen etliche dB an Einfluß auf den Frequenzgang hat, und der Effekt kann deutlich hörbar sein.
Immerhin, es wird eine Norm-Quellimpedanz von 120 Ω angegeben, und das ist ja schon etwas woran man sich halten kann. Falls man nichts Näheres liest, müßte man also davon ausgehen daß das die Quellimpedanz ist bei der die Hersteller ihre Messungen gemacht haben. Und bei eben dieser Quellimpedanz müßten in Ermangelung expliziter Angaben auch die Messungen anderer Leute, wie z.B. der Produkt-Tester von Zeitschriften, gemacht werden.
Auf der Webseite von HeadRoom kann man zum Beispiel etliche Frequenzgänge und Impedanzkurven ansehen, und sie beschreiben auch wie sie messen. Bloß was erfährt man nicht? Genau: Die Quellimpedanz. Lediglich angegeben wird das Verstärkermodell das sie verwenden, wenn man aber nachforscht was der wohl für eine Impedanz hat, dann findet man eine alte Bedienungsanleitung in der gar keine technischen Daten stehen. Vielleicht kann hier ja ein Leser aushelfen. Man müßte in dieser Situation eigentlich annehmen, daß es sich bei der Quellimpedanz um 120 Ω handelt, aber ich habe den leisen Verdacht daß es sich um einen sehr niederohmigen Verstärker handeln könnte, wie es unter "High-End"-Verstärkern öfter der Fall ist.
Wir können ja mal an einem Beispiel durchspielen was das für Auswirkungen hat. Die erwähnte Webseite zeigt für den AKG K240 diesen Impedanzschrieb, aus dem hervorgeht daß über weite Strecken die Impedanz um die 55 Ω beträgt, bei 100 Hz ist aber eine Resonanzstelle bei der sie auf 150 Ω ansteigt. Wenn nun hypothetischerweise der Frequenzgang bei 0 Ω Quellimpedanz schnurgerade wäre, dann hätte man bei 120 Ω Quellimpedanz einen Buckel bei 100 Hz von ca. 5 dB. Der Kopfhörer hätte also bei größerer Quellimpedanz deutlich mehr Tiefbass.
Natürlich macht eine höhere Quellimpedanz den Kopfhörer auch leiser, aber das kann man mit dem Lautstärkeknopf leicht ausgleichen. Angesichts der geringen benötigten Leistungen ist auch der Verlust im 120 Ω Widerstand im Verstärker unbedeutend.
Wenn eine Quellimpedanz solche Einflusse hat, warum macht man dann nicht alle Kopfhörer-Verstärker und die Normen gleich so daß man bei 0 Ω Quellimpedanz arbeitet, wie bei Lautsprechern auch? Immerhin fällt so eine Variable weg. Abgesehen von den "historischen Gründen", die man hier immer wieder anführen kann, ist mein Verdacht daß man dabei vor allem denjenigen Herstellern entgegen kommt, die den Kopfhörerausgang an einem Verstärker einfach durch Vorwiderstand vom normalen Verstärkerausgang abzweigen, statt für den Kopfhörer eine eigene Verstärkerstufe zu spendieren.
Eigentlich ist das aber Quark, und in Zeiten wie heute wo viele Kopfhörer eher niedrige Impedanzen haben, damit sie auch von niedrigen Spannungen noch laut genug getrieben werden können, wie man es bei MP3-Spielern und anderem tragbaren Zeug findet, ist eine Quellimpedanz von 120 Ω eigentlich ein Anachronismus. Wenn man einen niederohmigen Kopfhörer bei einer so hohen Quellimpedanz mißt, dann sind die elektrischen Verhältnisse bei der Messung drastisch anders als im normalen Betrieb, und die Meßergebnisse werden eine sehr fragliche Relevanz haben. Speziell die aufgenommene Frequenzgangkurve wird also unter Umständen ganz anders aussehen als im Normalbetrieb.
Für die Beteiligten am Markt entsteht dadurch eine eigentlich unmögliche Situation. Wenn der Hersteller des Kopfhörers den Frequenzgang so auslegt daß er bei 120 Ohm Quellimpedanz am ehesten "paßt", dann wird es an "Kleingeräten" oder vielen Kopfhörerverstärkern tendenziell falsch klingen, wo die Impedanzen viel kleiner sind. Dem könnte er entgegen wirken indem er versucht die Impedanzkurve möglichst linear zu machen, aber das erfordert entweder Zusatzaufwand in Form eines Zusatznetzwerks (wo bringt man die Bauteile unter?), oder es schränkt einen bei der Konstruktion des Systems zu stark ein.
Orientiert sich der Hersteller eher an niedrigen Quellimpedanzen, dann wird ein unter Normbedingungen aufgenommener Frequenzschrieb einen falschen Eindruck erzeugen. Außerdem klingt's dann am Kopfhörerausgang eines normalen Verstärkers womöglich falsch.
Und wie soll man dann Kopfhörer testen? Welche Quellimpedanz legt man zugrunde? Und egal welche man zugrunde legt, das Ergebnis wird nicht für alle Leser und Kunden nachvollziehbar sein, denn nicht alle werden die gleiche Quellimpedanz in ihrem Gerät haben.
Bisher kommt es mir so vor als ob das Problem von allen Beteiligten ignoriert wird. Nachvollziehbare und aussagekräftige Informationen will man offenbar gar nicht verbreiten, lieber produziert man sinnloses und inhaltsleeres Klanggeschwafel, mit dem niemand etwas anfangen kann.
Nachtrag: Ich bin noch auf eine Untersuchung aufmerksam geworden, die bei Sennheiser gemacht wurde, einschließlich damit verbundener Hörtests. Auf der Tonmeistertagung 1990 haben zwei Mitarbeiter darüber berichtet. Der Beitrag ist im Tagungsband enthalten (Dellbrügge, Sander-Röttcher: "Einfluß des Verstärker-Innenwiderstandes auf die Klangeigenschaften von Kopfhörern"). Hier ihre Zusammenfassung:
"Die vorliegende Untersuchung zeigt, daß der Innenwiderstand des Kopfhörerverstärkers bei Audioverstärkern einen nicht vernachlässigbaren Einfluß auf die klanglichen Eigenschaften eines Kopfhörers hat. Entscheidend dafür ist der Impedanzverlauf des Hörers.Bei Kopfhörern mit glattem Impedanzverlauf war auch bei großem Innenwiderstand keine Klangveränderung hörbar, bei Hörern, deren Impedanzverläufe deutliche Überhöhungen aufwiesen, machte sich dies durch Höhen- oder Tiefenanhebung bei Veränderungen des Innenwiderstandes bemerkbar. Die Ergebnisse der Hörversuche werden durch die gemessenen Frequenzgänge bestätigt, bleiben die Pegeldifferenzen unterhalb von 0,5 dB, so ist dieses mit dem Ohr nicht mehr wahrnehmbar. Bei der Messung der Impulsantworten stellte sich heraus, daß die Unterschiede in Frequenzbereich wesentlich deutlicher zu erkennen waren als in den Zeitsignalen."Also ein alter Hut. Ich bin 20 Jahre zu spät dran. Bloß geändert hat sich absolut nichts, das Problem ist heute das Gleiche wie damals.
Montag, 28. März 2016
Passiver Monitorcontroller für den Betrieb von Studiomonitoren am PC
Heute gibt's ausnahmsweise mal was zum Basteln.
Viele Leute kommen auf die sowohl naheliegende wie auch sinnvolle Idee, sich als Abhöre für den PC ordentliche Studiomonitore statt billiger Brüllwürfel zu gönnen. Besonders ein Pärchen guter aktiver Nahfeldmonitore bietet sich da an. Die gute Idee wird einem aber oftmals durch Brummen, Rauschen oder sonstige Störgeräusche versauert. Zudem würde man sich einen echten mechanischen Lautstärkeregler wünschen, anstatt mit der Maus oder dem Touchpad herumfummeln zu müssen. Und wenn man schon beim Wünschen ist, dann kann auch ein Stummschalter nicht schaden, z.B. wenn mal das Telefon dazwischen klingelt. Man könnte zwar auch die Lautstärke runterdrehen, aber dann verliert man die vorige Einstellung.
Normalerweise ist so etwas der Job von einem Monitorcontroller. So etwas gibts in diversen Ausführungen, aber eben eher in der Profiliga und zu entsprechenden Preisen, und das obwohl es auf den ersten Blick eigentlich kaum etwas zu tun gibt. Dazu kommt, daß solche Geräte eine eigene Stromversorgung brauchen, was nicht bloß eine extra Steckdose braucht, sondern auch eigens ein- und ausgeschaltet werden will.
Man kann es daher auch anders herum angehen, und sich überlegen wie weit man mit einer passiven Schaltung kommen kann, die einfach genug zum Selberbauen ist, und die trotzdem die wichtigsten "Features" hat, die in einem solchen Fall gefordert sind. So etwas stelle ich hier vor, und zwar bloß als Schaltung. Ich überlasse es Eurer Kreativität und Bastelkunst, daraus etwas zu machen was nicht bloß funktioniert, sondern auch ansehbar ist.
Das Fehlen einer Stromversorgung (weder Netz noch Batterie) bedeutet, daß kein Verstärker drin sein kann. Das zwingt einem einige Kompromisse auf, und macht das Ergebnis bis zu einem gewissen Grad von den Eigenschaften der angeschlossenen Geräte abhängig. Es kann daher keine Garantie geben, daß es unter allen Umständen gut funktioniert, und es hat auch keinen Sinn, Messwerte anzugeben, denn die hängen haupsächlich von den Geräten ab. Wie die Amis sagen: YMMV (Your Mileage May Vary).
Die Schaltung bietet folgendes:
Hier die Schaltung:
R1 ist ein handelsübliches Tandem-Poti, bei dem zwei Widerstandsbahnen über die gleiche Achse bedient werden. Heißt oft auch Stereo-Poti. Logarithmisch muß es sein, und wenn Ihr welche findet mit weniger als 10 kOhm ist das von Vorteil, weil dann die Eingangsimpedanz der Lautsprecher weniger Einfluß auf die Einstellcharakteristik des Potis hat. Insofern ist es auch besser, wenn die Eingangsimpedanz der Lautsprecher nicht zu niedrig ist. Die meisten Monitore dürften irgendwo bei 10 kOhm bis 100 kOhm angesiedelt sein, das steht hoffentlich in den technischen Daten. Wenn Ihr findet, daß die Einstellcharakteristik nicht passt, dann müsst Ihr ggf. mit zusätzlichen Widerständen experimentieren, wie z.B. in der Schaltung als R3 und R4 angedeutet. Die sollten allerdings auch nicht viel höher als 10 kOhm werden, sonst könnte eine kapazitive Eingangsimpedanz der Monitore zu einem Höhenabfall führen.
Ein kombinierter Line-Kopfhörer-Ausgang am PC hat üblicherweise keine besonderen Probleme mit Potiwiderständen von 1 kOhm, aber logarithmische Potis sind mit solch niedrigen Werten nicht leicht zu finden. Wer auf Luxus steht kann allerdings Drehschalter mit vielen Stellungen benutzen, dann kann er sich die Widerstandswerte raussuchen.
Der Umschalter kann, wie schon erwähnt, auch die Funktion der Stummschaltung erfüllen, besonders wenn es ein Kippschalter mit Mittelstellung ist. Ansonsten passt so gut wie alles, was zweipolig umschaltet, ob Kipp-, Dreh-, Wipp-, Druck- oder Schiebeschalter.
Die Störunterdrückung der Schaltung hängt in erster Linie an der intelligenten Masseverdrahtung und an der Qualität des symmetrischen Eingangs der verwendeten Monitore. Die Idee dabei ist, die Signalmasse auf der PC-Seite eben nicht mit der Masse der Monitore zu verbinden, denn das gibt oftmals eine Brummschleife. Speziell wenn die Monitore über das Netzkabel geerdet sind, was eher die Regel als die Ausnahme sein dürfte.
Der invertierende Signaleingang der symmetrischen Monitoreingänge (Pin 3) wird dabei quasi als Fühlerleitung benutzt, mit dem die Signalmasse auf der PC-Seite erfühlt wird, ohne daß dabei eine Verbindung mit der Masse der Monitore nötig wird. Eventuelle Störungen zwischen den Massen des PCs und der Monitore werden dann durch die Differenzbildung im Monitoreingang "herausgerechnet". Wenn der symmetrische Eingang auch nur halbwegs was taugt, dann sollte er die Störungen um mindestens 40 dB unterdrücken. Das reicht oft, aber nicht immer.
Damit das funktioniert, muß man acht geben, daß die Masseverbindung der Miniklinke vom PC von der Masse auf der Monitorseite getrennt bleibt. Das hat Einfluß auf die Wahl der Klinkenbuchsen, denn die müssen vom Gehäuse isoliert sein (auch die Kopfhörerbuchse). Die dadurch bewirkte Massetrennung bedeutet eine Auftrennung einer Masseschleife (bzw. Brummschleife), allerdings ohne eine galvanische Trennung. Nur wenn die Monitore mit Eingangsübertragern ausgestattet sind, ergibt sich eine galvanische Trennung. Das wäre zwar toll, ist aber aus Kostengründen eher selten.
Wenn die Störunterdrückung auf diese Weise noch nicht reicht, dann kann man eventuell mit weiteren Massnahmen zum Ziel kommen. Der erste Versuch sollte sein, eine separate Masseverbindung zwischen dem Gehäuse der Schaltung und einer passenden Stelle am Gehäuse des PC zu schaffen. Dafür ist die Masseklemme X5 gedacht. Ihr müßt selbst entscheiden, wie die ausgeführt sein soll. Es könnte z.B. eine 4 mm Buchse sein, die nicht vom Gehäuse isoliert ist. Dann kann man die Masseleitung zum PC mit einem Bananenstecker ausrüsten. Es gibt auch Masseklemmen mit Rändelschraube. Die passen eher zu Masseleitungen mit Kabelschuh.
Am PC muss man sich eine passende Stelle suchen. Es könnte z.B. eine Gehäuseschraube sein, unter die man einen Kabelschuh klemmt. Eine Schraube an einer unbenutzten Steckverbindung kann auch funktionieren, muß aber nicht. Es kommt darauf an wie der PC-Hersteller seine internen Masseverbindungen organisiert hat. Es wird also Experimentieren gefragt sein.
Statt einer solchen separaten Masseleitung kann auch eine Kombination aus R2 und C1 helfen, aber auch da sollten die angegebenen Werte eher als Startwert für das Experimentieren verstanden werden, nicht als endgültige Dimensionierung. Wenn man die Klinkenbuchse für den PC und die Masseklemme X5 nebeneinander an der Rückseite des Metallgehäuses platziert, dann kann man R2 und C1 ganz einfach fliegend dazwischen verlöten.
Überhaupt ist ein Metallgehäuse die richtige Wahl, sowohl zur Schirmung als auch der korrekten Masseführung wegen. Wie das aussehen soll bleibt Eure Wahl. Der Eine will eher eine Pultform, der Andere ein stapelbares Schächtelchen.
Wenn Ihr bei den XLR-Buchsen die Wahl habt, nehmt welche mit Gehäusekontakt. Manschmal ist sogar der Pin 1 schon in der Buchse mit dem Gehäuse verbunden, dann braucht Ihr diese Verbindung schon selber nicht zu machen. Da es Signalausgänge sind, sind die Buchsen männlich. Für die Verbindung mit den Monitoren taugen dann gewöhnliche XLR-Kabel.
Wenn Ihr das Ding gebaut habt, dann werdet Ihr selber schnell merken wie es am besten benutzt wird. Da man die Kopfhörerlautstärke nicht einstellen kann, wird man sich zuerst die Kopfhörerlaustärke am PC angenehm einstellen. Dabei ist man natürlich durch die Möglichkeiten des PC begrenzt, der nicht an allen Kopfhörern eine ausreichende Lautstärke zustande bringt. Das liegt an den Kopfhörerverstärkern der PCs, die eher für kleinere Kopfhörerimpedanzen ausgelegt sind. Eine passive Schaltung kann daran nichts ändern, Ihr müßt also einen Kopfhörer benutzen, der am PC direkt angesteckt vernünftig funktioniert.
Dann schaltet man auf Monitor um, und regelt an den Monitoren mit deren eigenen Reglern die Lautstärke so, daß sich bei maximal aufgedrehtem Regler an Eurem Eigenbau etwas mehr als die maximale Lautstärke ergibt, die Ihr braucht. Dann hat der Regler an der Eigenbau-Schaltung den besten Gebrauchsbereich und die beste "Feinfühligkeit".
Ich hoffe das Kistchen hilft dem Einen oder Anderen von Euch weiter, wäre nett wenn Ihr Feedback geben würdet, welche Erfahrungen Ihr damit macht, falls Ihr Euch entschließen solltet, es auszuprobieren.
Update:
Mein treuer Leser Wolfram Wagner hat mich auf die Möglichkeit aufmerksam gemacht, aus einem linearen Poti mit Hilfe zusätzlicher Festwiderstände eine Poti-Kennlinie zu erreichen, die annähernd logarithmisch werden kann, wenn man die Werte entsprechend wählt. Damit hat man zusätzliche Freiheitsgrade, und die Beschaffung geeigneter Potis wird weniger kritisch. Eine detaillierte Beschreibung dieser Möglichkeit findet man in einem Artikel auf der auch sonst sehr empfehlenswerten Webseite des Australiers Rod Elliott.
Viele Leute kommen auf die sowohl naheliegende wie auch sinnvolle Idee, sich als Abhöre für den PC ordentliche Studiomonitore statt billiger Brüllwürfel zu gönnen. Besonders ein Pärchen guter aktiver Nahfeldmonitore bietet sich da an. Die gute Idee wird einem aber oftmals durch Brummen, Rauschen oder sonstige Störgeräusche versauert. Zudem würde man sich einen echten mechanischen Lautstärkeregler wünschen, anstatt mit der Maus oder dem Touchpad herumfummeln zu müssen. Und wenn man schon beim Wünschen ist, dann kann auch ein Stummschalter nicht schaden, z.B. wenn mal das Telefon dazwischen klingelt. Man könnte zwar auch die Lautstärke runterdrehen, aber dann verliert man die vorige Einstellung.
Normalerweise ist so etwas der Job von einem Monitorcontroller. So etwas gibts in diversen Ausführungen, aber eben eher in der Profiliga und zu entsprechenden Preisen, und das obwohl es auf den ersten Blick eigentlich kaum etwas zu tun gibt. Dazu kommt, daß solche Geräte eine eigene Stromversorgung brauchen, was nicht bloß eine extra Steckdose braucht, sondern auch eigens ein- und ausgeschaltet werden will.
Man kann es daher auch anders herum angehen, und sich überlegen wie weit man mit einer passiven Schaltung kommen kann, die einfach genug zum Selberbauen ist, und die trotzdem die wichtigsten "Features" hat, die in einem solchen Fall gefordert sind. So etwas stelle ich hier vor, und zwar bloß als Schaltung. Ich überlasse es Eurer Kreativität und Bastelkunst, daraus etwas zu machen was nicht bloß funktioniert, sondern auch ansehbar ist.
Das Fehlen einer Stromversorgung (weder Netz noch Batterie) bedeutet, daß kein Verstärker drin sein kann. Das zwingt einem einige Kompromisse auf, und macht das Ergebnis bis zu einem gewissen Grad von den Eigenschaften der angeschlossenen Geräte abhängig. Es kann daher keine Garantie geben, daß es unter allen Umständen gut funktioniert, und es hat auch keinen Sinn, Messwerte anzugeben, denn die hängen haupsächlich von den Geräten ab. Wie die Amis sagen: YMMV (Your Mileage May Vary).
Die Schaltung bietet folgendes:
- Anschluß an den Line/Kopfhörer-Ausgang des PC über Miniklinke (3,5 mm).
- XLR-Ausgänge für zwei Studiomonitore mit symmetrischem Eingang.
- Klinkenbuchse für einen Kopfhörer (normale Klinke oder Miniklinke).
- Stereo-Lautstärkeregler für die Lautsprecher (nicht für den Kopfhörer).
- Umschalter zwischen Lautsprecher und Kopfhörer (beides zugleich geht nicht).
- Wenn der Umschalter eine Mitten-Aus-Stellung hat, hat man eine Stummschaltung.
- Störungsunterdrückung durch Ausnutzen des symmetrischen Eingangs der Monitore.
- Kopfhörer und Lautsprecher gehen nicht gleichzeitig, sondern nur abwechselnd.
- Für den Kopfhörer gelten die Eigenschaften des PC-Ausgangs bzgl. Impedanz.
- Die Lautstärke des Kopfhörers kann nur im PC eingestellt werden.
- Die Monitore brauchen einen vernünftigen symmetrischen Eingang.
- Die Charakteristik des Lautstärkereglers hängt von deren Eingangsimpedanzen ab.
- Die Monitore sollten auch eigene Lautstärkeeinsteller haben (z.B. auf der Rückseite).
- Die Lösung ist nicht für lange Kabelwege. Es geht um "Schreibtischverdrahtung".
Hier die Schaltung:
R1 ist ein handelsübliches Tandem-Poti, bei dem zwei Widerstandsbahnen über die gleiche Achse bedient werden. Heißt oft auch Stereo-Poti. Logarithmisch muß es sein, und wenn Ihr welche findet mit weniger als 10 kOhm ist das von Vorteil, weil dann die Eingangsimpedanz der Lautsprecher weniger Einfluß auf die Einstellcharakteristik des Potis hat. Insofern ist es auch besser, wenn die Eingangsimpedanz der Lautsprecher nicht zu niedrig ist. Die meisten Monitore dürften irgendwo bei 10 kOhm bis 100 kOhm angesiedelt sein, das steht hoffentlich in den technischen Daten. Wenn Ihr findet, daß die Einstellcharakteristik nicht passt, dann müsst Ihr ggf. mit zusätzlichen Widerständen experimentieren, wie z.B. in der Schaltung als R3 und R4 angedeutet. Die sollten allerdings auch nicht viel höher als 10 kOhm werden, sonst könnte eine kapazitive Eingangsimpedanz der Monitore zu einem Höhenabfall führen.
Ein kombinierter Line-Kopfhörer-Ausgang am PC hat üblicherweise keine besonderen Probleme mit Potiwiderständen von 1 kOhm, aber logarithmische Potis sind mit solch niedrigen Werten nicht leicht zu finden. Wer auf Luxus steht kann allerdings Drehschalter mit vielen Stellungen benutzen, dann kann er sich die Widerstandswerte raussuchen.
Der Umschalter kann, wie schon erwähnt, auch die Funktion der Stummschaltung erfüllen, besonders wenn es ein Kippschalter mit Mittelstellung ist. Ansonsten passt so gut wie alles, was zweipolig umschaltet, ob Kipp-, Dreh-, Wipp-, Druck- oder Schiebeschalter.
Die Störunterdrückung der Schaltung hängt in erster Linie an der intelligenten Masseverdrahtung und an der Qualität des symmetrischen Eingangs der verwendeten Monitore. Die Idee dabei ist, die Signalmasse auf der PC-Seite eben nicht mit der Masse der Monitore zu verbinden, denn das gibt oftmals eine Brummschleife. Speziell wenn die Monitore über das Netzkabel geerdet sind, was eher die Regel als die Ausnahme sein dürfte.
Der invertierende Signaleingang der symmetrischen Monitoreingänge (Pin 3) wird dabei quasi als Fühlerleitung benutzt, mit dem die Signalmasse auf der PC-Seite erfühlt wird, ohne daß dabei eine Verbindung mit der Masse der Monitore nötig wird. Eventuelle Störungen zwischen den Massen des PCs und der Monitore werden dann durch die Differenzbildung im Monitoreingang "herausgerechnet". Wenn der symmetrische Eingang auch nur halbwegs was taugt, dann sollte er die Störungen um mindestens 40 dB unterdrücken. Das reicht oft, aber nicht immer.
Damit das funktioniert, muß man acht geben, daß die Masseverbindung der Miniklinke vom PC von der Masse auf der Monitorseite getrennt bleibt. Das hat Einfluß auf die Wahl der Klinkenbuchsen, denn die müssen vom Gehäuse isoliert sein (auch die Kopfhörerbuchse). Die dadurch bewirkte Massetrennung bedeutet eine Auftrennung einer Masseschleife (bzw. Brummschleife), allerdings ohne eine galvanische Trennung. Nur wenn die Monitore mit Eingangsübertragern ausgestattet sind, ergibt sich eine galvanische Trennung. Das wäre zwar toll, ist aber aus Kostengründen eher selten.
Wenn die Störunterdrückung auf diese Weise noch nicht reicht, dann kann man eventuell mit weiteren Massnahmen zum Ziel kommen. Der erste Versuch sollte sein, eine separate Masseverbindung zwischen dem Gehäuse der Schaltung und einer passenden Stelle am Gehäuse des PC zu schaffen. Dafür ist die Masseklemme X5 gedacht. Ihr müßt selbst entscheiden, wie die ausgeführt sein soll. Es könnte z.B. eine 4 mm Buchse sein, die nicht vom Gehäuse isoliert ist. Dann kann man die Masseleitung zum PC mit einem Bananenstecker ausrüsten. Es gibt auch Masseklemmen mit Rändelschraube. Die passen eher zu Masseleitungen mit Kabelschuh.
Am PC muss man sich eine passende Stelle suchen. Es könnte z.B. eine Gehäuseschraube sein, unter die man einen Kabelschuh klemmt. Eine Schraube an einer unbenutzten Steckverbindung kann auch funktionieren, muß aber nicht. Es kommt darauf an wie der PC-Hersteller seine internen Masseverbindungen organisiert hat. Es wird also Experimentieren gefragt sein.
Statt einer solchen separaten Masseleitung kann auch eine Kombination aus R2 und C1 helfen, aber auch da sollten die angegebenen Werte eher als Startwert für das Experimentieren verstanden werden, nicht als endgültige Dimensionierung. Wenn man die Klinkenbuchse für den PC und die Masseklemme X5 nebeneinander an der Rückseite des Metallgehäuses platziert, dann kann man R2 und C1 ganz einfach fliegend dazwischen verlöten.
Überhaupt ist ein Metallgehäuse die richtige Wahl, sowohl zur Schirmung als auch der korrekten Masseführung wegen. Wie das aussehen soll bleibt Eure Wahl. Der Eine will eher eine Pultform, der Andere ein stapelbares Schächtelchen.
Wenn Ihr bei den XLR-Buchsen die Wahl habt, nehmt welche mit Gehäusekontakt. Manschmal ist sogar der Pin 1 schon in der Buchse mit dem Gehäuse verbunden, dann braucht Ihr diese Verbindung schon selber nicht zu machen. Da es Signalausgänge sind, sind die Buchsen männlich. Für die Verbindung mit den Monitoren taugen dann gewöhnliche XLR-Kabel.
Wenn Ihr das Ding gebaut habt, dann werdet Ihr selber schnell merken wie es am besten benutzt wird. Da man die Kopfhörerlautstärke nicht einstellen kann, wird man sich zuerst die Kopfhörerlaustärke am PC angenehm einstellen. Dabei ist man natürlich durch die Möglichkeiten des PC begrenzt, der nicht an allen Kopfhörern eine ausreichende Lautstärke zustande bringt. Das liegt an den Kopfhörerverstärkern der PCs, die eher für kleinere Kopfhörerimpedanzen ausgelegt sind. Eine passive Schaltung kann daran nichts ändern, Ihr müßt also einen Kopfhörer benutzen, der am PC direkt angesteckt vernünftig funktioniert.
Dann schaltet man auf Monitor um, und regelt an den Monitoren mit deren eigenen Reglern die Lautstärke so, daß sich bei maximal aufgedrehtem Regler an Eurem Eigenbau etwas mehr als die maximale Lautstärke ergibt, die Ihr braucht. Dann hat der Regler an der Eigenbau-Schaltung den besten Gebrauchsbereich und die beste "Feinfühligkeit".
Ich hoffe das Kistchen hilft dem Einen oder Anderen von Euch weiter, wäre nett wenn Ihr Feedback geben würdet, welche Erfahrungen Ihr damit macht, falls Ihr Euch entschließen solltet, es auszuprobieren.
Update:
Mein treuer Leser Wolfram Wagner hat mich auf die Möglichkeit aufmerksam gemacht, aus einem linearen Poti mit Hilfe zusätzlicher Festwiderstände eine Poti-Kennlinie zu erreichen, die annähernd logarithmisch werden kann, wenn man die Werte entsprechend wählt. Damit hat man zusätzliche Freiheitsgrade, und die Beschaffung geeigneter Potis wird weniger kritisch. Eine detaillierte Beschreibung dieser Möglichkeit findet man in einem Artikel auf der auch sonst sehr empfehlenswerten Webseite des Australiers Rod Elliott.
Freitag, 6. März 2015
Den Ohren trauen
Ich traue normalerweise meinen Ohren, aber ich würde niemandem trauen, der mir empfiehlt, ich solle nur meinen Ohren trauen.
"Den eigenen Ohren trauen", das ist quasi zum Schlachtruf der Audiophilen geworden. Wie oft haben wir das nicht schon lesen oder hören müssen, wenn wir mit Audiophilen debattieren! Der Audiophile, der wahre Musikliebhaber, traut selbstverständlich seinen Ohren, während der Techniker die Wahrheit auf dem Oszilloskopschirm sucht. Der Audiophile kann auch seinen Ohren trauen, denn er ist ja geübt und weiß aus Livekonzerten, wie sich die Musik anhören muß, während der Techniker sich an Zahlen und Diagrammen festhält, die die Musik und die Empfindung natürlich nicht repräsentieren können.
Schönes Märchen, leider gelogen.
Wie wenig ein Audiophiler seinen Ohren traut, das merkt man spätestens beim Thema Blindtest. Müßte jemand, der sich nur auf seine Ohren verläßt, nicht begeistert über eine Testmethode sein, die versucht, alle anderen Einflüsse auszuschließen, die mit den Ohren bzw. dem Gehör nichts zu tun haben? So etwas müßte für jemanden, der sich seines Gehörs sicher ist, doch geradezu ideal sein!
Das Gegenteil ist der Fall: Von audiophiler Seite werden Blindtests bekämpft als wären sie eine Erfindung des Teufels. Gehörfremde Einflüsse auszuschließen wird als unnatürlich empfunden, und man unterstellt negative Einflüsse auf das Hörvermögen.
Nun ist es sicherlich unnatürlich, wenn man den Einfluß anderer Sinnesreize ausschließt, weil der Mensch nun einmal im natürlichen Zustand mit allen verfügbaren Sinnesorganen zugleich kommuniziert. Aber das bedeutet, daß sich dieser Mensch eben nicht auf einen Sinn verläßt, sondern auf eine Kombination aller Sinne. Die menschliche Wahrnehmung ist sogar sehr geübt darin, die Sinne miteinander zu kombinieren, und Defizite bei einem Sinn mit Hilfe anderer Sinne auszugleichen. Das passiert ganz unwillkürlich und unbewußt. Logisch, daß man das Gefühl hat es fehle etwas, wenn man das durch eine bestimmte Versuchsgestaltung unterbindet.
Ein Beispiel dafür ist die Richtungswahrnehmung, die unter anderem auch davon profitiert, daß sich die Wahrnehmung ändert wenn sich die Kopfposition ändert. Den Kopf völlig ruhig und ortsfest zu halten wäre unnatürlich und unbequem. Man bewegt den Kopf eigentlich immer unwillkürlich, mindestens ein bißchen. Da sich das Schallfeld um einen herum nicht mitbewegt, ändert sich die Wahrnehmung, und das geht in die vom Gehirn verarbeitete Information mit ein. Das ist eigentlich eine Kombination des Gehörs mit der Motorik und dem Gleichgewichtsorgan. Hat man dagegen einen Kopfhörer auf, oder Ohrhörer drin, dann ist der Schall unabhängig von Kopfbewegungen, und die ganze Szene scheint sich mit dem Kopf zu drehen. Das ist einer der Gründe, warum das Hören mit Kopfhörer unnatürlich wirken kann. Um das zu kompensieren, hat man versucht, mit Head-Trackern die Kopfbewegung festzustellen, und das Schallfeld entsprechend zu modifizieren, was ein ganz ordentlicher Aufwand ist, und nicht unbedingt völlig überzeugende Ergebnisse liefert.
Mit anderen Worten, der Mensch traut nicht nur seinen eigenen Ohren, wenn es um die Richtungswahrnehmung geht. Da spielen noch ganz andere Faktoren hinein, und erst dadurch wird die menschliche Wahrnehmung so gut wie sie ist. Das obige Beispiel ist beileibe nicht das einzige. Wer glaubt, das sei alles eine Leistung des Gehörs, macht sich was vor. Das ist einer der grundlegenden Fehler der Audiophilen: Es werden Leistungen mit dem Gehör in Verbindung gebracht, die ihren Grund ganz woanders haben.
Im Blindtest versucht man ganz bewußt, diese anderen Einflüsse auszuschalten, um den Beitrag des Gehörs zu isolieren und eigenständig bewerten zu können. Es ist keine Frage, daß das sinnvoll, ja geradezu unverzichtbar, ist, wenn man sich für das Gehör selbst interessiert. Es ist gerade diese menschliche Eigenschaft, nach Möglichkeit alle Informationsquellen miteinander zu kombinieren, was man auch nicht bewußt unterlassen kann, die einem den Blindtest quasi aufzwingt. Anders könnte man keine zuverlässigen Aussagen über das Gehör als solches gewinnen, sondern höchstens über die Wahrnehmung im Ganzen, in der Kombination aller Sinne.
Genau das macht es aber unnatürlich, und selbstverständlich wird dadurch die Wahrnehmungsfähigkeit eingeschränkt. Die Wahrnehmungsfähigkeit wohlgemerkt, nicht die Hörfähigkeit. Das ist kein bedauerlicher Nachteil, sondern Sinn und Zweck des Blindtests. Wer dem Irrglauben anhängt, alles was er meint zu hören habe er tatsächlich nur durch sein Gehör aufgenommen, der wird sich wundern wieviel davon unter Blindtestbedingungen verschwindet. Das ist kein Problem, sondern eine Folge der Art und Weise wie menschliche Wahrnehmung funktioniert, und ein Indiz daß der Blindtest funktioniert, weil er gehörfremde Einflüsse einschränkt.
Wer also meint er könne seinen Ohren trauen, und das womöglich sogar als Mantra vor sich her trägt, und dabei zugleich Blindtests ablehnt, der müßte eigentlich bei nüchternem Nachdenken finden, daß das ein Widerspruch ist. So groß kann das Vertrauen ins eigene Gehör dann wohl kaum sein. Was in Wahrheit ein Fehler in der eigenen Vorstellung ist, wird auf den Blindtest projiziert, und als dessen Fehler gesehen.
Nun sind Blindtests sicher nicht perfekt, aber doch wesentlich besser als ihr Ruf in der audiophilen Szene. Wenn jemand behauptet, sie würden aus diesem oder jenem Grund nicht funktionieren, dann meint er meist, daß sie nicht das Ergebnis liefern, was er erwartet hätte. Wer dem oben erwähnten Irrglauben anhängt, der wird aber unrealistische Erwartungen haben. Das Problem liegt dann bei ihm und nicht beim Blindtest.
Die audiophile Haltung wird manchmal untermauert mit einem Argument aus der Evolution. Man behauptet, das Gehör des Menschen sei so gut und empfindlich geworden, weil das ein überlebenswichtiger Faktor war zu einer Zeit, als der Mensch noch in Gefahr stand, von wilden Tieren attackiert und womöglich gefressen zu werden. Dieses im Kern wohl richtige Argument kommt etwas krude daher und führt zu noch viel kruderen Schlussfolgerungen. Wenn es so eindimensional gewesen wäre wie es in der Argumentation oft erscheint, dann wäre kaum zu erklären, wieso im Tierreich gelegentlich wesentlich bessere Hörleistungen zu beobachten sind als beim Menschen. Der Mensch ist hier keineswegs die "Krone der Schöpfung"*. Es müssen also andere Faktoren eine bedeutende Rolle gespielt haben, die man nicht unter den Tisch fallen lassen kann.
Viel näher an der Wahrheit ist man wohl, wenn man sich klar macht daß nicht das Gehör im Speziellen, sondern der gesamte Wahrnehmungsapparat des Menschen im Ganzen, mit allen Sinnen und deren Verarbeitung im Gehirn, Gegenstand der evolutionsgetriebenen Optimierung war, oder noch eher der gesamte Mensch in der Kombination aller seiner Fähigkeiten. Wenn die Kombination aller Sinne, und eine überragende Verarbeitungsleistung, viel bessere lebensrettende Effekte hat als die Verbesserung eines einzelnen Sinns, dann wird klar daß eine Optimierung des Gehörs für sich gesehen vielleicht gar nicht so wichtig war. Falsch ist dann nicht das Argument per se, sondern seine Fokussierung auf das Gehör.
Ein weiterer, vielleicht noch offensichtlicherer Fehler bzw. Widerspruch zeigt sich beim Thema Streß, welches ja ebenfalls häufig im Zusammenhang mit Blindtests diskutiert wird. Man argumentiert auf audiophiler Seite gern, daß die unnatürliche Situation beim Blindtest Streß erzeuge, und daß sich dadurch die Hörfähigkeit vermindere. Abgesehen davon, daß das als Selbstverständlichkeit dargestellt wird, für das man es gar nicht für nötig hält, irgendwelche Nachweise zu erbringen, beißt sich das auch mit dem Argument aus der Evolution. Der Widerspruch scheint den Audiophilen gar nicht aufzufallen:
Wenn unsere Hörfähigkeiten darauf zurückgehen sollten, daß sie im Falle von Angriffen durch Raubtiere über Leben und Tod entscheiden können, dann müßten sie eigentlich unter Streß am allerbesten sein. Mehr Streß als akute Todesgefahr ist wohl kaum denkbar, und genau dann müßten eigentlich alle Sinne in Höchstform sein. Wer behauptet, es sei umgekehrt, und unter Streß höre man schlechter, der untergräbt damit gleichzeitig sein Argument aus der Evolution.
Nun sind audiophile Argumentationslinien nicht unbedingt charakterisiert durch innere Konsistenz und inhaltliche Belastbarkeit, besonders nicht in der Hitze des Gefechts, aber man sollte doch hoffen, daß ihnen solche Widersprüche und Ungereimtheiten in weniger konfrontativen Situationen dämmern. Bei etlichen von Ihnen scheint aber das Gegenteil zu passieren: Die Argumente werden immer kruder und unplausibler, mit denen die Fehler überkleistert werden sollen.
Statt zu realisieren, daß man seinen Ohren de facto selber nicht so uneingeschränkt vertraut, wie man vorgibt, und daraufhin seine Ansichten und Haltungen zu überdenken, erklärt man das Vertrauen in sein Gehör quasi zur Ehrenpflicht der audiophilen Zunft, und zum definitiven Charakteristikum für die Unterscheidung zwischen Musikliebhaber und seinem Gegenspieler, dem gefühlsarmen Techniker. Die Frage "Wem traust Du, Deinem Gehör oder Deinen Meßgeräten?", wird quasi zur Gretchenfrage des Hobbies HiFi erklärt, zur Wasserscheide zwischen Glauben und Unglauben.
Dabei ist das eine unsinnige Gegenüberstellung zweier künstlicher Positionen, die sich in Wahrheit gar nicht widersprechen. Ich traue natürlich beidem - bis zu einem gewissen Grad. Und ich gehe davon aus daß das Andere in der Praxis genauso halten, oftmals ohne darüber nachzudenken. Der entscheidende Punkt ist, ob man das, was einem die Sinne vermitteln, ob direkt oder durch unterstützende Instrumente, für plausibel hält. Paßt es zusammen oder sehe ich da Ungereimtheiten? Wenn alles zusammenpaßt, dann habe ich auch Vertrauen. Paßt es nicht, ist das ein Anlaß für Mißtrauen und Zweifel. Meist ergibt sich das ganz intuitiv, und wird auch nicht zwangsläufig bewußt, schon gar nicht sofort. Das kommt davon, daß die menschliche Wahrnehmung ein ständiger Mustererkennungsprozeß ist, bei dem die aktuelle Wahrnehmung mit gespeicherten Mustern verglichen wird. Interessant sind vor allem die Unterschiede, also ob etwas "normal" ist, also im Rahmen des Bekannten und Erwarteten, oder nicht.
Auch hier ist es also eher die gesamte Wahrnehmung, und das darauf basierende Urteil, dem man vertraut, und nicht ein Sinn in Isolation. Zudem ist es eine fundamentale Erfahrung, daß man seiner Wahrnehmung eben nicht immer vertrauen kann. Deswegen haben wir nicht bloß die Fähigkeit zur Wahrnehmung, sondern auch zum Nachdenken (was Zweifel und Lernen mit einschließt). Die besten und vertrauenswürdigsten Ergebnisse erzielt man, wenn man bestmöglichen Gebrauch von beiden Fähigkeiten macht.
Vor diesem Hintergrund erscheint der audiophile Schlachtruf "Vertraue Deinen Ohren!" wie eine Aufforderung, auf das Nachdenken zu verzichten. Und ich glaube wirklich daß das auch oft so gemeint ist. Die Audiophilen verzichten ja selber darauf, weil sie sonst realisieren müßten daß sie ihrem eigenen Anspruch auch nicht genügen, und sie wollen natürlich ebensowenig von anderer Seite darauf aufmerksam gemacht werden, folglich sollen auch die Anderen nicht nachdenken. Nur so bleibt der Irrtum (oder der Selbstbetrug) unbewußt, und der innere Frieden erhalten.
Wenn dann noch wirtschaftliche Interessen dazu kommen, dann sollte eigentlich die Aufforderung, seinen Ohren zu vertrauen, unmittelbarer Anlaß für das Gegenteil sein. Wer es für nötig findet, mir zu sagen wem oder was ich vertrauen soll, der hat meist einen Hintergedanken, und zwar einen nicht ganz uneigennützigen. Es kommt zwar auf der Oberfläche uneigennützig daher, weil ich ja meinen eigenen Ohren vertrauen soll, und nicht etwa ihm oder den seinen. Aber wenn dahinter steht daß ich auf das Nachdenken verzichten soll, dann wird das leicht zum trojanischen Pferd. Ich habe kein Interesse, darauf hereinzufallen.
Das wäre daher meine Antwort auf den audiophilen Schlachtruf: Schärfe Dein Urteilsvermögen, und dann traue Deinem Urteil. Dabei profitierst Du von allen Deinen Sinnen und Fähigkeiten, und nicht bloß von einem.
*) Die "Krone der Schöpfung", so weithin verwendet wie diese Formel sein mag, kräuselt mir die Nackenhaare. Nicht bloß weil es objektiv nicht stimmt, wie man an wesentlich mehr Einzelheiten sehen kann als bloß dem Gehör. Sie bringt so viele falsche Voraussetzungen zusammen wie es bei drei Worten nur geht. Weder haben wir es mit einer Schöpfung zu tun, also etwas das planmäßig und willentlich geschaffen wurde, noch geht es um eine Hierarchie von oben oder unten, besser oder schlechter, Herrscher oder Beherrschter, was durch die Krone symbolisiert würde. Zudem steckt da eine tiefe Egozentrik drin, die Einbildung man sei selbst im Zentrum, der Zweck und das Ziel. Wie viel Schaden wohl aus der Haltung entstanden sein mag, die diese drei Worte auf einen Punkt bringen? Wie überfällig es doch ist, sich davon zu lösen! Ich verwende diese Formulierung nicht zuletzt auch wegen des Schauderns, das sie bei mir auslöst, in der Hoffnung daß ein bißchen davon auch bei meinen Lesern ankommen möge.
"Den eigenen Ohren trauen", das ist quasi zum Schlachtruf der Audiophilen geworden. Wie oft haben wir das nicht schon lesen oder hören müssen, wenn wir mit Audiophilen debattieren! Der Audiophile, der wahre Musikliebhaber, traut selbstverständlich seinen Ohren, während der Techniker die Wahrheit auf dem Oszilloskopschirm sucht. Der Audiophile kann auch seinen Ohren trauen, denn er ist ja geübt und weiß aus Livekonzerten, wie sich die Musik anhören muß, während der Techniker sich an Zahlen und Diagrammen festhält, die die Musik und die Empfindung natürlich nicht repräsentieren können.
Schönes Märchen, leider gelogen.
Wie wenig ein Audiophiler seinen Ohren traut, das merkt man spätestens beim Thema Blindtest. Müßte jemand, der sich nur auf seine Ohren verläßt, nicht begeistert über eine Testmethode sein, die versucht, alle anderen Einflüsse auszuschließen, die mit den Ohren bzw. dem Gehör nichts zu tun haben? So etwas müßte für jemanden, der sich seines Gehörs sicher ist, doch geradezu ideal sein!
Das Gegenteil ist der Fall: Von audiophiler Seite werden Blindtests bekämpft als wären sie eine Erfindung des Teufels. Gehörfremde Einflüsse auszuschließen wird als unnatürlich empfunden, und man unterstellt negative Einflüsse auf das Hörvermögen.
Nun ist es sicherlich unnatürlich, wenn man den Einfluß anderer Sinnesreize ausschließt, weil der Mensch nun einmal im natürlichen Zustand mit allen verfügbaren Sinnesorganen zugleich kommuniziert. Aber das bedeutet, daß sich dieser Mensch eben nicht auf einen Sinn verläßt, sondern auf eine Kombination aller Sinne. Die menschliche Wahrnehmung ist sogar sehr geübt darin, die Sinne miteinander zu kombinieren, und Defizite bei einem Sinn mit Hilfe anderer Sinne auszugleichen. Das passiert ganz unwillkürlich und unbewußt. Logisch, daß man das Gefühl hat es fehle etwas, wenn man das durch eine bestimmte Versuchsgestaltung unterbindet.
Ein Beispiel dafür ist die Richtungswahrnehmung, die unter anderem auch davon profitiert, daß sich die Wahrnehmung ändert wenn sich die Kopfposition ändert. Den Kopf völlig ruhig und ortsfest zu halten wäre unnatürlich und unbequem. Man bewegt den Kopf eigentlich immer unwillkürlich, mindestens ein bißchen. Da sich das Schallfeld um einen herum nicht mitbewegt, ändert sich die Wahrnehmung, und das geht in die vom Gehirn verarbeitete Information mit ein. Das ist eigentlich eine Kombination des Gehörs mit der Motorik und dem Gleichgewichtsorgan. Hat man dagegen einen Kopfhörer auf, oder Ohrhörer drin, dann ist der Schall unabhängig von Kopfbewegungen, und die ganze Szene scheint sich mit dem Kopf zu drehen. Das ist einer der Gründe, warum das Hören mit Kopfhörer unnatürlich wirken kann. Um das zu kompensieren, hat man versucht, mit Head-Trackern die Kopfbewegung festzustellen, und das Schallfeld entsprechend zu modifizieren, was ein ganz ordentlicher Aufwand ist, und nicht unbedingt völlig überzeugende Ergebnisse liefert.
Mit anderen Worten, der Mensch traut nicht nur seinen eigenen Ohren, wenn es um die Richtungswahrnehmung geht. Da spielen noch ganz andere Faktoren hinein, und erst dadurch wird die menschliche Wahrnehmung so gut wie sie ist. Das obige Beispiel ist beileibe nicht das einzige. Wer glaubt, das sei alles eine Leistung des Gehörs, macht sich was vor. Das ist einer der grundlegenden Fehler der Audiophilen: Es werden Leistungen mit dem Gehör in Verbindung gebracht, die ihren Grund ganz woanders haben.
Im Blindtest versucht man ganz bewußt, diese anderen Einflüsse auszuschalten, um den Beitrag des Gehörs zu isolieren und eigenständig bewerten zu können. Es ist keine Frage, daß das sinnvoll, ja geradezu unverzichtbar, ist, wenn man sich für das Gehör selbst interessiert. Es ist gerade diese menschliche Eigenschaft, nach Möglichkeit alle Informationsquellen miteinander zu kombinieren, was man auch nicht bewußt unterlassen kann, die einem den Blindtest quasi aufzwingt. Anders könnte man keine zuverlässigen Aussagen über das Gehör als solches gewinnen, sondern höchstens über die Wahrnehmung im Ganzen, in der Kombination aller Sinne.
Genau das macht es aber unnatürlich, und selbstverständlich wird dadurch die Wahrnehmungsfähigkeit eingeschränkt. Die Wahrnehmungsfähigkeit wohlgemerkt, nicht die Hörfähigkeit. Das ist kein bedauerlicher Nachteil, sondern Sinn und Zweck des Blindtests. Wer dem Irrglauben anhängt, alles was er meint zu hören habe er tatsächlich nur durch sein Gehör aufgenommen, der wird sich wundern wieviel davon unter Blindtestbedingungen verschwindet. Das ist kein Problem, sondern eine Folge der Art und Weise wie menschliche Wahrnehmung funktioniert, und ein Indiz daß der Blindtest funktioniert, weil er gehörfremde Einflüsse einschränkt.
Wer also meint er könne seinen Ohren trauen, und das womöglich sogar als Mantra vor sich her trägt, und dabei zugleich Blindtests ablehnt, der müßte eigentlich bei nüchternem Nachdenken finden, daß das ein Widerspruch ist. So groß kann das Vertrauen ins eigene Gehör dann wohl kaum sein. Was in Wahrheit ein Fehler in der eigenen Vorstellung ist, wird auf den Blindtest projiziert, und als dessen Fehler gesehen.
Nun sind Blindtests sicher nicht perfekt, aber doch wesentlich besser als ihr Ruf in der audiophilen Szene. Wenn jemand behauptet, sie würden aus diesem oder jenem Grund nicht funktionieren, dann meint er meist, daß sie nicht das Ergebnis liefern, was er erwartet hätte. Wer dem oben erwähnten Irrglauben anhängt, der wird aber unrealistische Erwartungen haben. Das Problem liegt dann bei ihm und nicht beim Blindtest.
Die audiophile Haltung wird manchmal untermauert mit einem Argument aus der Evolution. Man behauptet, das Gehör des Menschen sei so gut und empfindlich geworden, weil das ein überlebenswichtiger Faktor war zu einer Zeit, als der Mensch noch in Gefahr stand, von wilden Tieren attackiert und womöglich gefressen zu werden. Dieses im Kern wohl richtige Argument kommt etwas krude daher und führt zu noch viel kruderen Schlussfolgerungen. Wenn es so eindimensional gewesen wäre wie es in der Argumentation oft erscheint, dann wäre kaum zu erklären, wieso im Tierreich gelegentlich wesentlich bessere Hörleistungen zu beobachten sind als beim Menschen. Der Mensch ist hier keineswegs die "Krone der Schöpfung"*. Es müssen also andere Faktoren eine bedeutende Rolle gespielt haben, die man nicht unter den Tisch fallen lassen kann.
Viel näher an der Wahrheit ist man wohl, wenn man sich klar macht daß nicht das Gehör im Speziellen, sondern der gesamte Wahrnehmungsapparat des Menschen im Ganzen, mit allen Sinnen und deren Verarbeitung im Gehirn, Gegenstand der evolutionsgetriebenen Optimierung war, oder noch eher der gesamte Mensch in der Kombination aller seiner Fähigkeiten. Wenn die Kombination aller Sinne, und eine überragende Verarbeitungsleistung, viel bessere lebensrettende Effekte hat als die Verbesserung eines einzelnen Sinns, dann wird klar daß eine Optimierung des Gehörs für sich gesehen vielleicht gar nicht so wichtig war. Falsch ist dann nicht das Argument per se, sondern seine Fokussierung auf das Gehör.
Ein weiterer, vielleicht noch offensichtlicherer Fehler bzw. Widerspruch zeigt sich beim Thema Streß, welches ja ebenfalls häufig im Zusammenhang mit Blindtests diskutiert wird. Man argumentiert auf audiophiler Seite gern, daß die unnatürliche Situation beim Blindtest Streß erzeuge, und daß sich dadurch die Hörfähigkeit vermindere. Abgesehen davon, daß das als Selbstverständlichkeit dargestellt wird, für das man es gar nicht für nötig hält, irgendwelche Nachweise zu erbringen, beißt sich das auch mit dem Argument aus der Evolution. Der Widerspruch scheint den Audiophilen gar nicht aufzufallen:
Wenn unsere Hörfähigkeiten darauf zurückgehen sollten, daß sie im Falle von Angriffen durch Raubtiere über Leben und Tod entscheiden können, dann müßten sie eigentlich unter Streß am allerbesten sein. Mehr Streß als akute Todesgefahr ist wohl kaum denkbar, und genau dann müßten eigentlich alle Sinne in Höchstform sein. Wer behauptet, es sei umgekehrt, und unter Streß höre man schlechter, der untergräbt damit gleichzeitig sein Argument aus der Evolution.
Nun sind audiophile Argumentationslinien nicht unbedingt charakterisiert durch innere Konsistenz und inhaltliche Belastbarkeit, besonders nicht in der Hitze des Gefechts, aber man sollte doch hoffen, daß ihnen solche Widersprüche und Ungereimtheiten in weniger konfrontativen Situationen dämmern. Bei etlichen von Ihnen scheint aber das Gegenteil zu passieren: Die Argumente werden immer kruder und unplausibler, mit denen die Fehler überkleistert werden sollen.
Statt zu realisieren, daß man seinen Ohren de facto selber nicht so uneingeschränkt vertraut, wie man vorgibt, und daraufhin seine Ansichten und Haltungen zu überdenken, erklärt man das Vertrauen in sein Gehör quasi zur Ehrenpflicht der audiophilen Zunft, und zum definitiven Charakteristikum für die Unterscheidung zwischen Musikliebhaber und seinem Gegenspieler, dem gefühlsarmen Techniker. Die Frage "Wem traust Du, Deinem Gehör oder Deinen Meßgeräten?", wird quasi zur Gretchenfrage des Hobbies HiFi erklärt, zur Wasserscheide zwischen Glauben und Unglauben.
Dabei ist das eine unsinnige Gegenüberstellung zweier künstlicher Positionen, die sich in Wahrheit gar nicht widersprechen. Ich traue natürlich beidem - bis zu einem gewissen Grad. Und ich gehe davon aus daß das Andere in der Praxis genauso halten, oftmals ohne darüber nachzudenken. Der entscheidende Punkt ist, ob man das, was einem die Sinne vermitteln, ob direkt oder durch unterstützende Instrumente, für plausibel hält. Paßt es zusammen oder sehe ich da Ungereimtheiten? Wenn alles zusammenpaßt, dann habe ich auch Vertrauen. Paßt es nicht, ist das ein Anlaß für Mißtrauen und Zweifel. Meist ergibt sich das ganz intuitiv, und wird auch nicht zwangsläufig bewußt, schon gar nicht sofort. Das kommt davon, daß die menschliche Wahrnehmung ein ständiger Mustererkennungsprozeß ist, bei dem die aktuelle Wahrnehmung mit gespeicherten Mustern verglichen wird. Interessant sind vor allem die Unterschiede, also ob etwas "normal" ist, also im Rahmen des Bekannten und Erwarteten, oder nicht.
Auch hier ist es also eher die gesamte Wahrnehmung, und das darauf basierende Urteil, dem man vertraut, und nicht ein Sinn in Isolation. Zudem ist es eine fundamentale Erfahrung, daß man seiner Wahrnehmung eben nicht immer vertrauen kann. Deswegen haben wir nicht bloß die Fähigkeit zur Wahrnehmung, sondern auch zum Nachdenken (was Zweifel und Lernen mit einschließt). Die besten und vertrauenswürdigsten Ergebnisse erzielt man, wenn man bestmöglichen Gebrauch von beiden Fähigkeiten macht.
Vor diesem Hintergrund erscheint der audiophile Schlachtruf "Vertraue Deinen Ohren!" wie eine Aufforderung, auf das Nachdenken zu verzichten. Und ich glaube wirklich daß das auch oft so gemeint ist. Die Audiophilen verzichten ja selber darauf, weil sie sonst realisieren müßten daß sie ihrem eigenen Anspruch auch nicht genügen, und sie wollen natürlich ebensowenig von anderer Seite darauf aufmerksam gemacht werden, folglich sollen auch die Anderen nicht nachdenken. Nur so bleibt der Irrtum (oder der Selbstbetrug) unbewußt, und der innere Frieden erhalten.
Wenn dann noch wirtschaftliche Interessen dazu kommen, dann sollte eigentlich die Aufforderung, seinen Ohren zu vertrauen, unmittelbarer Anlaß für das Gegenteil sein. Wer es für nötig findet, mir zu sagen wem oder was ich vertrauen soll, der hat meist einen Hintergedanken, und zwar einen nicht ganz uneigennützigen. Es kommt zwar auf der Oberfläche uneigennützig daher, weil ich ja meinen eigenen Ohren vertrauen soll, und nicht etwa ihm oder den seinen. Aber wenn dahinter steht daß ich auf das Nachdenken verzichten soll, dann wird das leicht zum trojanischen Pferd. Ich habe kein Interesse, darauf hereinzufallen.
Das wäre daher meine Antwort auf den audiophilen Schlachtruf: Schärfe Dein Urteilsvermögen, und dann traue Deinem Urteil. Dabei profitierst Du von allen Deinen Sinnen und Fähigkeiten, und nicht bloß von einem.
*) Die "Krone der Schöpfung", so weithin verwendet wie diese Formel sein mag, kräuselt mir die Nackenhaare. Nicht bloß weil es objektiv nicht stimmt, wie man an wesentlich mehr Einzelheiten sehen kann als bloß dem Gehör. Sie bringt so viele falsche Voraussetzungen zusammen wie es bei drei Worten nur geht. Weder haben wir es mit einer Schöpfung zu tun, also etwas das planmäßig und willentlich geschaffen wurde, noch geht es um eine Hierarchie von oben oder unten, besser oder schlechter, Herrscher oder Beherrschter, was durch die Krone symbolisiert würde. Zudem steckt da eine tiefe Egozentrik drin, die Einbildung man sei selbst im Zentrum, der Zweck und das Ziel. Wie viel Schaden wohl aus der Haltung entstanden sein mag, die diese drei Worte auf einen Punkt bringen? Wie überfällig es doch ist, sich davon zu lösen! Ich verwende diese Formulierung nicht zuletzt auch wegen des Schauderns, das sie bei mir auslöst, in der Hoffnung daß ein bißchen davon auch bei meinen Lesern ankommen möge.
Donnerstag, 29. Oktober 2015
Irreführung gut gemeint
Es ist schon erstaunlich wie die Grundlagen von Digital-Audio noch Jahrzehnte nach der technischen Einführung falsch dargestellt werden. Es ist anscheinend so, daß sich die falschen Darstellungen durch stetige Weiterverbreitung immer wieder selbst bestätigen und in Umlauf halten. Und sie werden so sogar von gutmeinenden Leuten weiterverbreitet, die meinen damit Anderen einen Dienst zu tun, dabei aber eher zur Verwirrung beitragen.
Kürzlich machte mich ein Blogleser auf dieses aktuelle Beispiel aufmerksam. Es ist ein Video auf Englisch, aber die meisten von Euch werden's wohl verstehen. Der "Präsentator" David Domminney Fowler gibt von sich an, er sei "Programmer, Producer and Professional Musician". Was Digital-Audio angeht scheint er jedenfalls nicht über die Basics hinaus gekommen zu sein.
Was macht er falsch? Ich handle das mal in Listenform ab:
Es gibt immer wieder Leute, die behaupten sie könnten noch weit darüber was hören, aber es ist die Frage woher sie das haben. Man kann auch auf Verzerrungen und andere "Falschmeldungen" hereinfallen, wenn man nicht aufpaßt. Wen's interessiert: Hört Euch einmal einen aufsteigenden "Sweep" an, mit Kopfhörer oder per Lautsprecher. So etwas kann man als Datei entweder mit geeigneter Software selbst erzeugen, oder man findet es im Netz. Es sollte nicht zu schnell gehen damit man auch was mitkriegt. Wenn der Pfeifton extrem hoch wird, wird er auch leiser und verschwindet irgendwann. Sollte er in der Tonhöhe zwischendurch wieder niedriger werden, oder springen, dann stimmt was nicht, und man hört "Störungs-Artefakte", aber nicht die höhere Frequenz. Ich würde wetten daß von Euch Lesern so gut wie niemand über 20 kHz hinaus kommen wird. Die allermeisten vermutlich nicht mal über 16 kHz. Das ist normal.
Der Tonhöhenumfang eines üblichen Konzertflügels reicht in etwa von 27 Hz bis knapp unter 9000 Hz. Manche Instrumente haben ein paar Tasten mehr und kommen damit etwas weiter. Für die Musik spielt das aber so gut wie keine Rolle. Andere Instrumente haben tendenziell weniger Tonumfang, allenfalls üppig ausgestattete Kirchenorgeln kommen noch darüber hinaus. Auch der Hinweis auf Obertöne ("Harmonische") zieht nicht wirklich, denn die Töne, für die die Obertöne klangrelevant sind, sind nicht die ganz hohen Töne. Die Obertöne der höchsten Flügelsaite hört so gut wie niemand. Folglich kann man sagen daß sich die Musik, selbst anspruchsvolle Musik, im Frequenzbereich zwischen etwa 30 und 8000 Hz abspielt. Darunter und darüber spielt nur noch eine geringe Rolle, besonders mit steigendem Alter des Hörers.
Ich finde man sollte das als professioneller Musiker und Tonschaffender wissen.
Der üblicherweise angegebene Hörbereich von 20 Hz bis 20 kHz ist damit schon eine großzügige Festlegung, die nur noch von sehr wenigen Personen und Situationen übertroffen werden dürfte, und sie hat darüber hinaus den Vorteil der Einfachheit. Deswegen wurde sie zugrunde gelegt, als man die CD und die weiteren Digital-Audio-Systeme eingeführt hat. Und wie es zu den 44,1 kHz kam ist auch recht einfach erklärbar: Es hat mit dem Mastering zu tun, das in der Anfangsphase der CD nicht auf dem Computer geschah, sondern mit Hilfe von PCM-Adaptern, die das digitale Audiosignal in ein analoges Videosignal umgewandelt haben, damit man es auf Videobändern aufnehmen konnte. Die Abtasftrequenz mußte deswegen zu der Videofrequenz passen, und 44,1 kHz war eine der möglichen Frequenzen. Da hat Fowler einfach ahnungslos vor sich hin spekuliert.
Nochmal zur Bestätigung: Mit ein klein wenig Rauschen wird die Digital-Audio-Technik zur Analog-Audio-Technik äquivalent, und in beiden Fällen passiert das Gleiche: Man hat einen Rauschteppich, und Signale gehen im Rauschteppich unter, wenn sie leiser werden. Bei 24 Bit ist einfach der Rauschteppich leiser als bei 16 Bit, aber in beiden Fällen ist, wie jeder leicht nachprüfen kann, der Rauschteppich sowieso schon niedriger als der von analogen Medien.
Wenn Fowler Probleme hat mit kleinen Signalen, die rauh und "grainy" werden wenn sie leiser werden, dann hat er einen Fehler, den er dingfest machen sollte. Entweder es fehlt Dither, oder er hat irgendwelche Verzerrungen im Kleinsignalbereich, möglicherweise gar nicht im digitalen Teil seiner Anlage sondern im analogen. Mit den Grundlagen der Digital-Audio-Technik hat es nichts zu tun.
Das bedeutet auch, daß es nicht viel bringt, die Anzahl der möglichen Stufen der Codierungen miteinander zu vergleichen. Klar sind mehr als 16 Millionen viel eindrücklicher als nur gut 65000, aber was heißt das für das Audiosignal? Nicht viel. Da wir gesehen haben daß der Unterschied im Pegel des Rauschteppichs liegt, ist es viel sinnvoller, diesen Unterschied zu benennen. Dabei kommt die viel nützlichere Zahl heraus. Nämlich daß durch die zusätzlichen 8 bit der Rauschteppich um etwa 48 dB niedriger ist. Das ist ein Maß, das im Audiokontext einen Sinn ergibt, im Gegensatz zu irgendwelchen freischwebenden Zahlen.
Das ist richtig und falsch zugleich. Richtig ist natürlich, daß man beide Halbwellen codieren können muß. Der von ihm vernachlässigte Punkt ist aber, daß es diese Mittellinie nicht wirklich gibt. Es ist ein darstellerisches Artefakt ohne Entsprechung im physikalischen Signal. Man hört keine Gleichspannung, also keine Frequenz Null. Eventuell vorhandene Gleichspannungen werden sogar von Audiosystemen weggefiltert, denn sie können die Technik stören. Das bedeutet man könnte die Nullinie beliebig hoch oder runter schieben, ohne daß sich etwas ändert. Speziell kann man genauso gut so tun als wäre die Nullinie ganz unten, und alle Zahlen positiv. Der für Audio relevante Signalanteil würde sich dadurch nicht ändern; es gäbe nur einen irrelevanten Gleichspannungs-Offset.
Ergo: Man hat 16 Bit für die Codierung zur Verfügung, das ist alles was man wissen muß.
Immerhin, Fowler hat auch ein paar gute Hinweise in seinem Vortrag, nämlich z.B. was Headroom angeht, und Clipping, besonders wenn man Signale zusammen mischt. Könnte also schlimmer sein. Trotzdem, mir wäre es lieber, wenn die falschen Vorstellungen korrigiert würden, anstatt als Tutorial weiter unter den Leuten verbreitet zu werden.
Kürzlich machte mich ein Blogleser auf dieses aktuelle Beispiel aufmerksam. Es ist ein Video auf Englisch, aber die meisten von Euch werden's wohl verstehen. Der "Präsentator" David Domminney Fowler gibt von sich an, er sei "Programmer, Producer and Professional Musician". Was Digital-Audio angeht scheint er jedenfalls nicht über die Basics hinaus gekommen zu sein.
Was macht er falsch? Ich handle das mal in Listenform ab:
Fowler kennt offenbar die menschlichen Hörfähigkeiten schlecht.
Es gibt immer wieder Leute, die behaupten sie könnten noch weit darüber was hören, aber es ist die Frage woher sie das haben. Man kann auch auf Verzerrungen und andere "Falschmeldungen" hereinfallen, wenn man nicht aufpaßt. Wen's interessiert: Hört Euch einmal einen aufsteigenden "Sweep" an, mit Kopfhörer oder per Lautsprecher. So etwas kann man als Datei entweder mit geeigneter Software selbst erzeugen, oder man findet es im Netz. Es sollte nicht zu schnell gehen damit man auch was mitkriegt. Wenn der Pfeifton extrem hoch wird, wird er auch leiser und verschwindet irgendwann. Sollte er in der Tonhöhe zwischendurch wieder niedriger werden, oder springen, dann stimmt was nicht, und man hört "Störungs-Artefakte", aber nicht die höhere Frequenz. Ich würde wetten daß von Euch Lesern so gut wie niemand über 20 kHz hinaus kommen wird. Die allermeisten vermutlich nicht mal über 16 kHz. Das ist normal.
Der Tonhöhenumfang eines üblichen Konzertflügels reicht in etwa von 27 Hz bis knapp unter 9000 Hz. Manche Instrumente haben ein paar Tasten mehr und kommen damit etwas weiter. Für die Musik spielt das aber so gut wie keine Rolle. Andere Instrumente haben tendenziell weniger Tonumfang, allenfalls üppig ausgestattete Kirchenorgeln kommen noch darüber hinaus. Auch der Hinweis auf Obertöne ("Harmonische") zieht nicht wirklich, denn die Töne, für die die Obertöne klangrelevant sind, sind nicht die ganz hohen Töne. Die Obertöne der höchsten Flügelsaite hört so gut wie niemand. Folglich kann man sagen daß sich die Musik, selbst anspruchsvolle Musik, im Frequenzbereich zwischen etwa 30 und 8000 Hz abspielt. Darunter und darüber spielt nur noch eine geringe Rolle, besonders mit steigendem Alter des Hörers.
Ich finde man sollte das als professioneller Musiker und Tonschaffender wissen.
Der üblicherweise angegebene Hörbereich von 20 Hz bis 20 kHz ist damit schon eine großzügige Festlegung, die nur noch von sehr wenigen Personen und Situationen übertroffen werden dürfte, und sie hat darüber hinaus den Vorteil der Einfachheit. Deswegen wurde sie zugrunde gelegt, als man die CD und die weiteren Digital-Audio-Systeme eingeführt hat. Und wie es zu den 44,1 kHz kam ist auch recht einfach erklärbar: Es hat mit dem Mastering zu tun, das in der Anfangsphase der CD nicht auf dem Computer geschah, sondern mit Hilfe von PCM-Adaptern, die das digitale Audiosignal in ein analoges Videosignal umgewandelt haben, damit man es auf Videobändern aufnehmen konnte. Die Abtasftrequenz mußte deswegen zu der Videofrequenz passen, und 44,1 kHz war eine der möglichen Frequenzen. Da hat Fowler einfach ahnungslos vor sich hin spekuliert.
Fowler scheint nichts von Dither gehört zu haben.
Nochmal zur Bestätigung: Mit ein klein wenig Rauschen wird die Digital-Audio-Technik zur Analog-Audio-Technik äquivalent, und in beiden Fällen passiert das Gleiche: Man hat einen Rauschteppich, und Signale gehen im Rauschteppich unter, wenn sie leiser werden. Bei 24 Bit ist einfach der Rauschteppich leiser als bei 16 Bit, aber in beiden Fällen ist, wie jeder leicht nachprüfen kann, der Rauschteppich sowieso schon niedriger als der von analogen Medien.
Wenn Fowler Probleme hat mit kleinen Signalen, die rauh und "grainy" werden wenn sie leiser werden, dann hat er einen Fehler, den er dingfest machen sollte. Entweder es fehlt Dither, oder er hat irgendwelche Verzerrungen im Kleinsignalbereich, möglicherweise gar nicht im digitalen Teil seiner Anlage sondern im analogen. Mit den Grundlagen der Digital-Audio-Technik hat es nichts zu tun.
Das bedeutet auch, daß es nicht viel bringt, die Anzahl der möglichen Stufen der Codierungen miteinander zu vergleichen. Klar sind mehr als 16 Millionen viel eindrücklicher als nur gut 65000, aber was heißt das für das Audiosignal? Nicht viel. Da wir gesehen haben daß der Unterschied im Pegel des Rauschteppichs liegt, ist es viel sinnvoller, diesen Unterschied zu benennen. Dabei kommt die viel nützlichere Zahl heraus. Nämlich daß durch die zusätzlichen 8 bit der Rauschteppich um etwa 48 dB niedriger ist. Das ist ein Maß, das im Audiokontext einen Sinn ergibt, im Gegensatz zu irgendwelchen freischwebenden Zahlen.
Es gibt keine "Centerline", durch die sich die Bit-Tiefe halbiert.
Das ist richtig und falsch zugleich. Richtig ist natürlich, daß man beide Halbwellen codieren können muß. Der von ihm vernachlässigte Punkt ist aber, daß es diese Mittellinie nicht wirklich gibt. Es ist ein darstellerisches Artefakt ohne Entsprechung im physikalischen Signal. Man hört keine Gleichspannung, also keine Frequenz Null. Eventuell vorhandene Gleichspannungen werden sogar von Audiosystemen weggefiltert, denn sie können die Technik stören. Das bedeutet man könnte die Nullinie beliebig hoch oder runter schieben, ohne daß sich etwas ändert. Speziell kann man genauso gut so tun als wäre die Nullinie ganz unten, und alle Zahlen positiv. Der für Audio relevante Signalanteil würde sich dadurch nicht ändern; es gäbe nur einen irrelevanten Gleichspannungs-Offset.
Ergo: Man hat 16 Bit für die Codierung zur Verfügung, das ist alles was man wissen muß.
Immerhin, Fowler hat auch ein paar gute Hinweise in seinem Vortrag, nämlich z.B. was Headroom angeht, und Clipping, besonders wenn man Signale zusammen mischt. Könnte also schlimmer sein. Trotzdem, mir wäre es lieber, wenn die falschen Vorstellungen korrigiert würden, anstatt als Tutorial weiter unter den Leuten verbreitet zu werden.
Freitag, 9. März 2012
Über Abtastraten und zeitliche Auflösung
Zu den hartnäckigsten Mißverständnissen bei Digital-Audio gehört der Mythos, daß die "zeitliche Auflösung" durch die Abtastfrequenz begrenzt ist. Daß also z.B. die CD mit ihren 44,1 kHz nur bis zu etwa 22 µs auflösen kann.
In der einfachsten Form (und viele Audiophile kommen nur so weit) geht das Argument so, daß das menschliche Ohr angeblich 10µs (oder gar noch weniger) noch auflösen könne, was schon seit langem bekannt sei, und daß deswegen die Abtastrate entsprechend hoch sein müsse, als z.B. 96 kHz oder gar 192 kHz.
Ich hatte darüber 2008 im Hifi-Forum schon mal eine Auseinandersetzung mit Ralf Koschnicke von Acousence, in der er - ausgehend von seinem Artikel im Studio Magazin - die Trommel rührte für höhere Abtastraten, und damit letztlich für die Produkte seiner Firma. Ich hatte damals wenigstens einen Teilerfolg, da er einen besonders klar sichtbaren Denkfehler zugab, was ihn aber in der Folge nicht davon abgehalten hat, mit entsprechend nebulöserer Argumentation weiterhin dasselbe zu behaupten. Nicht daß mich das wirklich überrascht hätte.
Den Anlaß zu diesem Blog-Artikel gab aber letztlich, daß ich über Jakob auf die Artikel eines Dr. Kunchur aufmerksam wurde, der vor ein paar Jahren zwei wissenschaftliche Fachartikel über von ihm durchgeführte Untersuchungen veröffentlichte, in denen er aus einem von ihm gefundenen Auflösungsvermögen des menschlichen Ohres von etwa 5 µs ebenfalls auf die Forderung nach höheren Abtastraten als bei der CD kam. Ich weiß nicht wie mir diese Artikel bisher entgehen konnten (einen Artikel hatte ich auf der Festplatte, aber anscheinend vergessen), denn wie ich inzwischen gefunden habe, haben sie insbesondere im englischsprachigen Hifi-Forums-Zirkus beträchtlichen Wirbel gemacht. Besonders im Stereophile-Forum ging's voll zur Sache, als ein paar Leute, allen voran James Johnston, es doch tatsächlich gewagt hatten, des Doktors Untersuchungen zu kritisieren, und die Fehlschlüsse ans Licht zu zerren. Das macht die Sache nicht bloß auf der trocken-technischen Ebene interessant, sondern zeigt auch eindrucksvoll, wie sich die feingeistige Audiophilen-Elite gegen das grobe Techniker-Gesocks zur Wehr setzt. Oder war's doch andersrum?
Aber zunächst soll es um den Inhalt dieser Untersuchungen gehen. Im ersten Artikel von 2007 benutzt Kunchur eine Versuchsanordnung, bestehend aus zwei Hochton-Lautsprechern, die übereinander gestellt werden, und mit dem gleichen Signal angesteuert werden. Der obere Lautsprecher kann gegenüber dem unteren einige Millimeter vor- und zurück geschoben werden, so daß sein Signal geringfügig früher oder später am Ohr des genau horizontal 4,3m entfernten Hörers ankommt. Eine Verschiebung von einem Millimeter entspricht wegen der Schallgeschwindigkeit einer Laufzeit von etwa 3 µs. Die Verschiebung des Lautsprechers geschieht automatisch im Verlauf des Blindtests, und zwar ohne Unterbrechung des Schalls, um eine möglichst nahtlose Vergleichsmöglichkeit zu schaffen. Als Testsignal wird ein Rechtecksignal von 7 kHz verwendet, das über breitbandige analoge Elektronik erzeugt und verstärkt wird. Im Signalweg befindet sich also keine Digitaltechnik. Mit dieser Anordnung wurden mit 5 Personen Blindtestreihen durchgeführt, bei denen für 6 verschiedene Verschiebungen des oberen Lautsprechers je 10 Versuche gemacht wurden, um die kleinste Verschiebung zu finden, die mit statistsicher Signifikanz noch unterschieden werden kann. Im Ergebnis wurde die Verschiebung bis herunter zu 2,3 mm sicher detektiert, eine Verschiebung von 2,0 mm wurde immerhin noch von einem Subjekt detektiert. Kunchur folgert daraus eine Hörbarkeitsschwelle für "Zeitfehler" von ca. 6 µs.
Im zweiten Artikel von 2008 benutzt Kunchur eine andere Versuchsanordnung, und ersetzt die Lautsprecher durch ein einfaches RC-Glied als Tiefpaßfilter, das er im Rahmen der Blindtests ein- und ausschalten kann. Abgehört wird diesmal über Kopfhörer. Wieder benutzt er breitbandige Analogelektronik, und arbeitet mit dem 7 kHz Rechtecksignal. Durch Variation des Widerstandswertes im RC-Filter kann die Zeitkonstante des Filters gewählt werden, und Kunchur versucht wiederum durch Blindtestreihen herauszufinden, welches die kleinste Zeitkonstante ist, die mit statistischer Sicherheit noch unterscheidbar ist. Das Ergebnis zeigt daß 4,7 µs in etwa die Grenze darstellt. Weitere Blindtests sollten sicherstellen, daß es nicht Artefakte aufgrund des Umschaltens waren, die zur Hörbarkeit führten.
Beide Artikel sind in wissenschaftlichen Fachzeitschriften erschienen, in denen die Artikel vor der Veröffentlichung begutachtet werden ("peer-review"), um die Einhaltung wissenschaftlicher Standards zu gewährleisten. Trotzdem gibt's an beiden Arbeiten einiges auszusetzen, wie ich noch zeigen werde. Kunchur hat noch einen Vortrag auf einem Treffen der "Acoustical Society of America" gehalten, und dafür einen Konferenzbeitrag geschrieben (dort dürfte es kein "peer-review" gegeben haben). Die Diskussionen in amerikanischen Foren haben außerdem zu einer Antwort in Form eines FAQ-Papiers geführt. Einige Zeit danach schließlich trat Kunchur noch auf der AES Convention in London auf, wo er im Rahmen eines Workshops eine kurze Einführung gab.
Welche Fehler sehe ich?
Zum ersten Problem:
Beide Versuchsanordnungen verursachen nicht nur eine Zeitverschiebung, sondern auch eine Amplitudenänderung. Es ist also nötig, zu klären welcher der beiden Effekte tatsächlich gehört wurde. Bei beiden Versuchen ergibt sich ein Amplitudenunterschied an der Detektionsgrenze der Blindtests, der bei ca. 0,25 dB liegt. Das ist besser als der aus älteren Untersuchungen für 7 kHz bekannte Wert von 0,7 dB, den Kunchur anführt. Für ihn ist das der Anlaß, den Amplitudenunterschied als Ursache auszuschließen, aber das ist eine fadenscheinige Begründung, denn der Wert der Zeitauflösung, den er als detektierbar findet, ist ja auch besser als die bisher bekannten Schwellen. Warum soll es also ausgerechnet die Zeitdifferenz sein, und nicht die Amplitudendifferenz, wenn doch bei beiden das gleiche Argument angewendet werden könnte? Kunchur's Wahl ist willkürlich. Er hätte zusätzliche Versuche machen sollen, die die Entscheidung zwischen den beiden Alternativen erlauben. Im Falle des RC-Glieds wäre das sogar sehr einfach gewesen.
Zum zweiten Problem:
Das ist eigentlich die kniffligere Sache und für viele Leute geht es gegen ihre Intuition. Die Probleme fangen schon damit an was mit dem Begriff "Auflösung" genau gemeint ist.
Manchmal wird damit die Frage verbunden, wie dicht nacheinander zwei scharfe Impulse kommen dürfen, damit man sie noch als zwei Impulse voneinander unterscheiden kann, anstatt sie als einen einzelnen verschmolzenen Impuls wahrzunehmen. Das ist für's Gehör aber eine ziemlich irrelevante Betrachtungsweise in unserem Fall, denn bevor das Gehör Impulse voneinander getrennt wahrnimmt, müssen sie sehr viel weiter voneinander entfernt sein, als 22 µs. Deshalb zeigt man da auch eher Oszilloskopbilder oder Bilder vom Computerbildschirm aus der Audio-Software. Da sieht man dann ab wann zwei Impulse optisch miteinander verschmelzen, wenn man sie immer näher zusammenrückt. Man sollte sich aber hüten, aus der optischen Erscheinung auf die akustische zu schließen.
Kunchur tut das auch nicht, aber wenn es nicht darum geht zwei Impulse voneinander zu trennen, sondern nur darum daß der Zeitabstand in das Gesamtergebnis eingeht, auch wenn er kleiner als 22 µs ist, dann ist die Abtastung der Digitaltechnik kein Hindernis. Der Abtastvorgang verursacht keine weiteren Einschränkungen als es die Bandbreitenbegrenzung ohnehin tut, die man vor der Wandlung machen muß. Die zeitliche "Verschmierung" von der er redet, ist eine direkte Folge der Bandbreitenbegrenzung, und damit kein Digital-Effekt. Die Effekte einer Tiefpaßfilterung wie mit dem RC-Glied, oder die Überlagerung zweier Wellenfronten wie im Versuch mit den zwei Lautsprechern, sind bandbreiten-neutral. Man kann mit solchen Versuchen daher nicht zeigen, daß man eine bestimmte Mindest-Bandbreite braucht, und folglich auch nicht daß man eine bestimmte Mindest-Abtastrate braucht.
Beispiel Lautsprecher-Versuch von Kunchur. Die beiden Lautsprecher führen zu einer Überlagerung der Wellen vor den beiden Lautsprechern, und der Effekt ist eine Richtwirkung in der Vertikalen. Es ist das Prinzip hinter den sog. "Line-Arrays", einem Stapel senkrecht übereinander angeordneter Lautsprecher. Wenn man einen Lautsprecher etwas vor oder zurück verschiebt, dann hat das Auswirkungen auf die Richtwirkung. Die Richtung wandert nach oben oder unten, das heißt daß in der horizontalen Hörposition der Pegel kleiner wird. Die Richtwirkung ist frequenzabhängig, genauer gesagt abhängig vom Verhältnis der Wellenlänge des Audiosignals zum Abstand der Lautsprecher.
Wegen der Verwendung von Rechtecksignalen könnte man argumentieren, daß die Verschiebung des Lautsprechers zur Folge hat, daß nun anstelle einer Wellenfront zwei kurz hintereinander folgende Wellenfronten am Ohr ankommen, und daß es das ist was das Ohr unterscheiden kann. Das wurde aber weder nachgeprüft, noch ist es auf eine Distanz von über 4 Meter zu erwarten.
Das Sonstige:
Kunchur hat nicht wirklich schlüssig erklärt wieso er Rechtecksignale benötigt. Er scheint Wert auf eine schnelle Anstiegszeit zu legen, aber man erfährt nicht warum das wichtig sein soll, bzw. welche Anstiegszeit man braucht um einen negativen Einfluß auf den Ausgang des Versuchs zu vermeiden. Man hat den Eindruck, es läuft nach dem Motto: Je schneller je besser. Das muß noch kein Problem sein, aber die Erklärungen, die man von ihm im Konferenzbeitrag zum Thema analoge vs. digitale Rechteckgeneratoren liest, läßt sein Verständnis von digitaler Signalverarbeitung in einem ziemlich schlechten Licht dastehen, und zeigt daß er einigen der Irrtümer und Denkmuster unterliegt, die man auch bei Audiophilen findet.
So behauptet er beispielsweise, man könne nur unter großen Schwierigkeiten eine exakt periodische Signalform auf digitalem Weg erzeugen und Jitter sei dabei ein sehr ernstes Problem. Um das plausibler zu machen, führt er als Beispiel den Rechteck-Generator in SoundForge an, einem Audio-Editor für den PC, der in dieser Hinsicht mit Audacity vergleichbar ist, wie ihn vielleicht mehr Leute kennen werden. Der da vorgestellte Generator ist so naïv implementiert, daß er unter ernsten Aliasing-Effekten leidet. Das ist kein Beispiel mit dem man die Digitaltechnik im Ganzen diskreditieren könnte. Mit SoundForge könnte man sowieso kein Rechtecksignal erzeugen, das seinen Vorstellungen von Flankensteilheit auch nur annähernd entsprechen würde, denn dafür ist die Bandbreite viel zu niedrig. Das heißt aber nicht daß es so etwas nicht geben würde. Kommerzielle Arbiträrgeneratoren können so etwas ohne große Probleme. Eine Abtastrate von 40 MHz wäre dem von ihm verwendeten Analoggenerator ebenbürtig bei der Flankensteilheit, und würde beim Jitter erheblich besser abschneiden, als Kunchur's Analoggenerator. Der ist nämlich beileibe nicht besonders jitterarm, wenn man seine eigenen Angaben zugrunde legt. Das sind solche Analoggeneratoren eher selten. Beispiel für einen geeigneten Digitalgenerator: Der Agilent 33120A, ein sehr verbreitetes Gerät.
Mein Fazit:
Die Artikel von Kunchur geben das nicht her, was er selbst als Schlußfolgerungen zieht, insbesondere nicht die Notwendigkeit einer höheren Abtastrate als die bei der CD verwendete. Er unterliegt ein paar ziemlich fundamentalen Mißverständnissen im Zusammenhang mit digitaler Signalverarbeitung. Ich wundere mich wie er das an den anonymen Reviewern bei den Fachzeitschriften vorbei gekriegt hat, ein Ruhmesblatt für sie ist das nicht gerade.
Die Forums-Rezeption:
Das Highlight ist definitiv das Stereoplay-Forum*. Da produzieren sich ein paar ausgesprochene Arschlöcher, unter ihnen Steven Sammet von SAS Audio Labs, ein Teilnehmer unter dem Pseudonym "michiganjfrog", von dem vermutet wird es handle sich um Stereophile's Mitarbeiter Michael Fremer, oder auch "ncdrawl", der sich selber offenbar eher als neutraler Moderator versteht, aber auf einem Auge eindeutig blind ist.
Die Debatte hat aber schnell metastasiert, und fand in unterschiedlicher Giftigkeit in mindestens mal folgenden Foren statt: Gearslutz, Hydrogenaudio, Audio Asylum Propellerhead Plaza, und ich weiß nicht wo sonst.
Wer des Englischen mächtig ist, und sich das geben will, der wird sicher seine ohnehin bestehenden Vorurteile über Diskussionen mit Audiophilen in allen Punkten bestätigen können. Ich war ganz begeistert.
Ihr auch?
P.S.: Monty hat eine sehr ausführliche Seite über 24/192 geschrieben. Paßt gut hierher, braucht aber Geduld und gute Englischkenntnisse.
* Nachträgliche Korrektur: Es muß natürlich heißen "das Stereophile-Forum". Ich schätze das war ein "Freud'scher Verschreiber". :-)
In der einfachsten Form (und viele Audiophile kommen nur so weit) geht das Argument so, daß das menschliche Ohr angeblich 10µs (oder gar noch weniger) noch auflösen könne, was schon seit langem bekannt sei, und daß deswegen die Abtastrate entsprechend hoch sein müsse, als z.B. 96 kHz oder gar 192 kHz.
Ich hatte darüber 2008 im Hifi-Forum schon mal eine Auseinandersetzung mit Ralf Koschnicke von Acousence, in der er - ausgehend von seinem Artikel im Studio Magazin - die Trommel rührte für höhere Abtastraten, und damit letztlich für die Produkte seiner Firma. Ich hatte damals wenigstens einen Teilerfolg, da er einen besonders klar sichtbaren Denkfehler zugab, was ihn aber in der Folge nicht davon abgehalten hat, mit entsprechend nebulöserer Argumentation weiterhin dasselbe zu behaupten. Nicht daß mich das wirklich überrascht hätte.
Den Anlaß zu diesem Blog-Artikel gab aber letztlich, daß ich über Jakob auf die Artikel eines Dr. Kunchur aufmerksam wurde, der vor ein paar Jahren zwei wissenschaftliche Fachartikel über von ihm durchgeführte Untersuchungen veröffentlichte, in denen er aus einem von ihm gefundenen Auflösungsvermögen des menschlichen Ohres von etwa 5 µs ebenfalls auf die Forderung nach höheren Abtastraten als bei der CD kam. Ich weiß nicht wie mir diese Artikel bisher entgehen konnten (einen Artikel hatte ich auf der Festplatte, aber anscheinend vergessen), denn wie ich inzwischen gefunden habe, haben sie insbesondere im englischsprachigen Hifi-Forums-Zirkus beträchtlichen Wirbel gemacht. Besonders im Stereophile-Forum ging's voll zur Sache, als ein paar Leute, allen voran James Johnston, es doch tatsächlich gewagt hatten, des Doktors Untersuchungen zu kritisieren, und die Fehlschlüsse ans Licht zu zerren. Das macht die Sache nicht bloß auf der trocken-technischen Ebene interessant, sondern zeigt auch eindrucksvoll, wie sich die feingeistige Audiophilen-Elite gegen das grobe Techniker-Gesocks zur Wehr setzt. Oder war's doch andersrum?
Aber zunächst soll es um den Inhalt dieser Untersuchungen gehen. Im ersten Artikel von 2007 benutzt Kunchur eine Versuchsanordnung, bestehend aus zwei Hochton-Lautsprechern, die übereinander gestellt werden, und mit dem gleichen Signal angesteuert werden. Der obere Lautsprecher kann gegenüber dem unteren einige Millimeter vor- und zurück geschoben werden, so daß sein Signal geringfügig früher oder später am Ohr des genau horizontal 4,3m entfernten Hörers ankommt. Eine Verschiebung von einem Millimeter entspricht wegen der Schallgeschwindigkeit einer Laufzeit von etwa 3 µs. Die Verschiebung des Lautsprechers geschieht automatisch im Verlauf des Blindtests, und zwar ohne Unterbrechung des Schalls, um eine möglichst nahtlose Vergleichsmöglichkeit zu schaffen. Als Testsignal wird ein Rechtecksignal von 7 kHz verwendet, das über breitbandige analoge Elektronik erzeugt und verstärkt wird. Im Signalweg befindet sich also keine Digitaltechnik. Mit dieser Anordnung wurden mit 5 Personen Blindtestreihen durchgeführt, bei denen für 6 verschiedene Verschiebungen des oberen Lautsprechers je 10 Versuche gemacht wurden, um die kleinste Verschiebung zu finden, die mit statistsicher Signifikanz noch unterschieden werden kann. Im Ergebnis wurde die Verschiebung bis herunter zu 2,3 mm sicher detektiert, eine Verschiebung von 2,0 mm wurde immerhin noch von einem Subjekt detektiert. Kunchur folgert daraus eine Hörbarkeitsschwelle für "Zeitfehler" von ca. 6 µs.
Im zweiten Artikel von 2008 benutzt Kunchur eine andere Versuchsanordnung, und ersetzt die Lautsprecher durch ein einfaches RC-Glied als Tiefpaßfilter, das er im Rahmen der Blindtests ein- und ausschalten kann. Abgehört wird diesmal über Kopfhörer. Wieder benutzt er breitbandige Analogelektronik, und arbeitet mit dem 7 kHz Rechtecksignal. Durch Variation des Widerstandswertes im RC-Filter kann die Zeitkonstante des Filters gewählt werden, und Kunchur versucht wiederum durch Blindtestreihen herauszufinden, welches die kleinste Zeitkonstante ist, die mit statistischer Sicherheit noch unterscheidbar ist. Das Ergebnis zeigt daß 4,7 µs in etwa die Grenze darstellt. Weitere Blindtests sollten sicherstellen, daß es nicht Artefakte aufgrund des Umschaltens waren, die zur Hörbarkeit führten.
Beide Artikel sind in wissenschaftlichen Fachzeitschriften erschienen, in denen die Artikel vor der Veröffentlichung begutachtet werden ("peer-review"), um die Einhaltung wissenschaftlicher Standards zu gewährleisten. Trotzdem gibt's an beiden Arbeiten einiges auszusetzen, wie ich noch zeigen werde. Kunchur hat noch einen Vortrag auf einem Treffen der "Acoustical Society of America" gehalten, und dafür einen Konferenzbeitrag geschrieben (dort dürfte es kein "peer-review" gegeben haben). Die Diskussionen in amerikanischen Foren haben außerdem zu einer Antwort in Form eines FAQ-Papiers geführt. Einige Zeit danach schließlich trat Kunchur noch auf der AES Convention in London auf, wo er im Rahmen eines Workshops eine kurze Einführung gab.
Welche Fehler sehe ich?
- Es ist nicht klar, ob die in den Blindtests gehörten Unterschiede überhaupt auf das Konto der Zeitverschiebung gehen, oder ob sie nicht stattdessen z.B. aufgrund von Amplitudenunterschieden zustande kommen.
- Die Annahme, daß die Zeitabstände der Abtastungen in einem digitalen Audiosystem eine Grenze für die Auflösung von Zeit- oder Phasenverschiebungen darstellen, ist falsch. Das Mißverständnis mag weit verbreitet sein, und auch den einen oder anderen Fachmann betreffen, aber das macht es nicht richtiger.
Zum ersten Problem:
Beide Versuchsanordnungen verursachen nicht nur eine Zeitverschiebung, sondern auch eine Amplitudenänderung. Es ist also nötig, zu klären welcher der beiden Effekte tatsächlich gehört wurde. Bei beiden Versuchen ergibt sich ein Amplitudenunterschied an der Detektionsgrenze der Blindtests, der bei ca. 0,25 dB liegt. Das ist besser als der aus älteren Untersuchungen für 7 kHz bekannte Wert von 0,7 dB, den Kunchur anführt. Für ihn ist das der Anlaß, den Amplitudenunterschied als Ursache auszuschließen, aber das ist eine fadenscheinige Begründung, denn der Wert der Zeitauflösung, den er als detektierbar findet, ist ja auch besser als die bisher bekannten Schwellen. Warum soll es also ausgerechnet die Zeitdifferenz sein, und nicht die Amplitudendifferenz, wenn doch bei beiden das gleiche Argument angewendet werden könnte? Kunchur's Wahl ist willkürlich. Er hätte zusätzliche Versuche machen sollen, die die Entscheidung zwischen den beiden Alternativen erlauben. Im Falle des RC-Glieds wäre das sogar sehr einfach gewesen.
Zum zweiten Problem:
Das ist eigentlich die kniffligere Sache und für viele Leute geht es gegen ihre Intuition. Die Probleme fangen schon damit an was mit dem Begriff "Auflösung" genau gemeint ist.
Manchmal wird damit die Frage verbunden, wie dicht nacheinander zwei scharfe Impulse kommen dürfen, damit man sie noch als zwei Impulse voneinander unterscheiden kann, anstatt sie als einen einzelnen verschmolzenen Impuls wahrzunehmen. Das ist für's Gehör aber eine ziemlich irrelevante Betrachtungsweise in unserem Fall, denn bevor das Gehör Impulse voneinander getrennt wahrnimmt, müssen sie sehr viel weiter voneinander entfernt sein, als 22 µs. Deshalb zeigt man da auch eher Oszilloskopbilder oder Bilder vom Computerbildschirm aus der Audio-Software. Da sieht man dann ab wann zwei Impulse optisch miteinander verschmelzen, wenn man sie immer näher zusammenrückt. Man sollte sich aber hüten, aus der optischen Erscheinung auf die akustische zu schließen.
Kunchur tut das auch nicht, aber wenn es nicht darum geht zwei Impulse voneinander zu trennen, sondern nur darum daß der Zeitabstand in das Gesamtergebnis eingeht, auch wenn er kleiner als 22 µs ist, dann ist die Abtastung der Digitaltechnik kein Hindernis. Der Abtastvorgang verursacht keine weiteren Einschränkungen als es die Bandbreitenbegrenzung ohnehin tut, die man vor der Wandlung machen muß. Die zeitliche "Verschmierung" von der er redet, ist eine direkte Folge der Bandbreitenbegrenzung, und damit kein Digital-Effekt. Die Effekte einer Tiefpaßfilterung wie mit dem RC-Glied, oder die Überlagerung zweier Wellenfronten wie im Versuch mit den zwei Lautsprechern, sind bandbreiten-neutral. Man kann mit solchen Versuchen daher nicht zeigen, daß man eine bestimmte Mindest-Bandbreite braucht, und folglich auch nicht daß man eine bestimmte Mindest-Abtastrate braucht.
Beispiel Lautsprecher-Versuch von Kunchur. Die beiden Lautsprecher führen zu einer Überlagerung der Wellen vor den beiden Lautsprechern, und der Effekt ist eine Richtwirkung in der Vertikalen. Es ist das Prinzip hinter den sog. "Line-Arrays", einem Stapel senkrecht übereinander angeordneter Lautsprecher. Wenn man einen Lautsprecher etwas vor oder zurück verschiebt, dann hat das Auswirkungen auf die Richtwirkung. Die Richtung wandert nach oben oder unten, das heißt daß in der horizontalen Hörposition der Pegel kleiner wird. Die Richtwirkung ist frequenzabhängig, genauer gesagt abhängig vom Verhältnis der Wellenlänge des Audiosignals zum Abstand der Lautsprecher.
Wegen der Verwendung von Rechtecksignalen könnte man argumentieren, daß die Verschiebung des Lautsprechers zur Folge hat, daß nun anstelle einer Wellenfront zwei kurz hintereinander folgende Wellenfronten am Ohr ankommen, und daß es das ist was das Ohr unterscheiden kann. Das wurde aber weder nachgeprüft, noch ist es auf eine Distanz von über 4 Meter zu erwarten.
Das Sonstige:
Kunchur hat nicht wirklich schlüssig erklärt wieso er Rechtecksignale benötigt. Er scheint Wert auf eine schnelle Anstiegszeit zu legen, aber man erfährt nicht warum das wichtig sein soll, bzw. welche Anstiegszeit man braucht um einen negativen Einfluß auf den Ausgang des Versuchs zu vermeiden. Man hat den Eindruck, es läuft nach dem Motto: Je schneller je besser. Das muß noch kein Problem sein, aber die Erklärungen, die man von ihm im Konferenzbeitrag zum Thema analoge vs. digitale Rechteckgeneratoren liest, läßt sein Verständnis von digitaler Signalverarbeitung in einem ziemlich schlechten Licht dastehen, und zeigt daß er einigen der Irrtümer und Denkmuster unterliegt, die man auch bei Audiophilen findet.
So behauptet er beispielsweise, man könne nur unter großen Schwierigkeiten eine exakt periodische Signalform auf digitalem Weg erzeugen und Jitter sei dabei ein sehr ernstes Problem. Um das plausibler zu machen, führt er als Beispiel den Rechteck-Generator in SoundForge an, einem Audio-Editor für den PC, der in dieser Hinsicht mit Audacity vergleichbar ist, wie ihn vielleicht mehr Leute kennen werden. Der da vorgestellte Generator ist so naïv implementiert, daß er unter ernsten Aliasing-Effekten leidet. Das ist kein Beispiel mit dem man die Digitaltechnik im Ganzen diskreditieren könnte. Mit SoundForge könnte man sowieso kein Rechtecksignal erzeugen, das seinen Vorstellungen von Flankensteilheit auch nur annähernd entsprechen würde, denn dafür ist die Bandbreite viel zu niedrig. Das heißt aber nicht daß es so etwas nicht geben würde. Kommerzielle Arbiträrgeneratoren können so etwas ohne große Probleme. Eine Abtastrate von 40 MHz wäre dem von ihm verwendeten Analoggenerator ebenbürtig bei der Flankensteilheit, und würde beim Jitter erheblich besser abschneiden, als Kunchur's Analoggenerator. Der ist nämlich beileibe nicht besonders jitterarm, wenn man seine eigenen Angaben zugrunde legt. Das sind solche Analoggeneratoren eher selten. Beispiel für einen geeigneten Digitalgenerator: Der Agilent 33120A, ein sehr verbreitetes Gerät.
Mein Fazit:
Die Artikel von Kunchur geben das nicht her, was er selbst als Schlußfolgerungen zieht, insbesondere nicht die Notwendigkeit einer höheren Abtastrate als die bei der CD verwendete. Er unterliegt ein paar ziemlich fundamentalen Mißverständnissen im Zusammenhang mit digitaler Signalverarbeitung. Ich wundere mich wie er das an den anonymen Reviewern bei den Fachzeitschriften vorbei gekriegt hat, ein Ruhmesblatt für sie ist das nicht gerade.
Die Forums-Rezeption:
Das Highlight ist definitiv das Stereoplay-Forum*. Da produzieren sich ein paar ausgesprochene Arschlöcher, unter ihnen Steven Sammet von SAS Audio Labs, ein Teilnehmer unter dem Pseudonym "michiganjfrog", von dem vermutet wird es handle sich um Stereophile's Mitarbeiter Michael Fremer, oder auch "ncdrawl", der sich selber offenbar eher als neutraler Moderator versteht, aber auf einem Auge eindeutig blind ist.
Die Debatte hat aber schnell metastasiert, und fand in unterschiedlicher Giftigkeit in mindestens mal folgenden Foren statt: Gearslutz, Hydrogenaudio, Audio Asylum Propellerhead Plaza, und ich weiß nicht wo sonst.
Wer des Englischen mächtig ist, und sich das geben will, der wird sicher seine ohnehin bestehenden Vorurteile über Diskussionen mit Audiophilen in allen Punkten bestätigen können. Ich war ganz begeistert.
Ihr auch?
P.S.: Monty hat eine sehr ausführliche Seite über 24/192 geschrieben. Paßt gut hierher, braucht aber Geduld und gute Englischkenntnisse.
* Nachträgliche Korrektur: Es muß natürlich heißen "das Stereophile-Forum". Ich schätze das war ein "Freud'scher Verschreiber". :-)
Abonnieren
Posts
(
Atom
)
