Wellenfeldsynthese und Holofonie
von Helmut Oellers
Die Animation zeigt die Ausbreitung einer ( schwarz dargestellten ) direkten Wellenfront und ihrer ersten schallstarken Reflexionen im ( außen skizzierten ) Aufnahmeraum. Sie gehen scheinbar von ( mehrfarbig eingezeichneten ) Spiegelschallquellen hinter seinen Reflexionsflächen aus. Deren räumliche Verteilung ist die Grundlage für unsere räumliche Wahrnehmung eines Schallereignisses. Konventionelle Audioverfahren können diese komplexe Verteilung jedoch nicht annähernd korrekt reproduzieren, die Reduktion auf wenige Übertragungskanäle ist immer mit einem signifikanten Verlust an räumlicher Information verbunden.
Diese Seite beschreibt einen Weg, die Quellpositionen auf der Wiedergabeseite aus dem reinen Audiosignal und Informationen zu den Aufnahmeraumeigenschaften zu rekonstruieren. Dieser „Holofonie" - Ansatz beruht auf dem Prinzip der Wellenfeldsynthese , das schon Ende der achtziger Jahre an der TU Delft entwickelt wurde. Das räumliche Schallfeld wird dabei nicht übertragen, sondern aus den relevanten Informationen auf der Wiedergabeseite synthetisiert. So wird es vom Ansatz her möglich, eine vollständige virtuelle Kopie des Originalschallfeldes zu erzeugen.
Prinzipiell ist das auch das Ziel der Wellenfeldsynthese, jedoch stehen dem bisher praktische Einschränkungen bei der Umsetzung entgegen. An mehreren Forschungsinstituten werden WFS- Anlagen seit Jahren mit Erfolg praktisch aufgebaut, sie sind aber auf eine horizontale Lautsprecherreihe reduziert. Dann bleibt das Verfahren zweidimensional, eine korrekte Raumabbildung ist nicht möglich.
Der hier beschriebene Lösungsvorschlag arbeitet mit einem, in der Animation Magenta dargestellten, großen WFS- Lautsprecherfeld vor dem Zuhörer. Damit kann das Schallfeld in allen drei Raumdimensionen rekonstruiert werden. Zudem spielt die Wiedergaberaumakustik im Nahfeld der großen resultierenden Membranfläche nur noch eine untergeordnete Rolle. Sie muss deshalb nicht mehr, wie bei den Lautsprecherreihen, unterdrückt werden, sondern sie wird gezielt in die Synthese einbezogen. Die steuerbare, hohe Richtwirkung des WFS- Lautsprecherfeldes erlaubt es, die einzelnen Wellenfronten in einem gemeinsamen System aus Aufnahme- und ( innen dargestellten ) Wiedergaberaum so zu erzeugen, dass die Reflexionen des Wiedergaberaumes in Zeit, Amplitude und Richtung in guter Näherung die Reflexionen des Aufnahmeraumes vortäuschen.
Damit unterscheidet sich die Lösung grundsätzlich von dem WFS Ansatz der Forschungsinstitute, deren Übertragungskette an den Lautsprechern endet. In dem hier beschriebenen Holofonie- Ansatz wird eine dedizierte Position für einen "virtuellen Zuhörer" im Konzertsaal festgelegt. Das Verfahren zielt dann darauf ab, an dem ( gelb eingezeichneten ) Default- Zuhörerplatz in der Mitte des Wiedergabereiches die gleiche räumliche und zeitliche Struktur der Wellenfronten zu synthetisieren wie an einem festgelegten Bezugspunkt im Aufnahmeraum.
1. Konventionelles Audio
Viele Stereofans sind überzeugt, wenn alle Komponenten im Signalweg hochwertig genug sind, wäre die Audiowiedergabe kaum vom Original zu unterscheiden. Tatsächlich können wir selbst mit zwei Lautsprechern in unserem Wohnzimmer eine subjektiv sehr befriedigende Wiedergabe erreichen, doch sie wird sich in ihrer räumlichen Struktur immer deutlich vom Originalereignis unterscheiden.
Das ist nicht immer störend, gerade moderne Studioproduktionen haben sich längst von Alan Blumleins Ziel des „being there“ für die Heimwidergabe verabschiedet, Studioproduktionen sind heute Kunstprodukt mit dem Ziel, trotz aller verfahrensbedingten Einschränkungen eine subjektiv überzeugende und emotional ansprechende Wiedergabe zu erzeugen.
Und dennoch, auch mit der immer weiter steigenden Zahl der Übertragungskanäle sind wir bis heute nicht in der Lage, das akustische Erlebnis in einem guten Konzertsaal auch nur annähernd autentisch zu reproduzieren. Alles was wir bis heute erreichen können, ist tonale Ausgewogenheit, die korrekte räumliche Reproduktion eines Originalschallfeldes ist bis heute unerreichbar.
An unseren Trommelfellen unterscheiden sich die von den Lautsprechern abgestrahlten Signale sogar völlig von den Wellenfronten im Aufnahmeraum. Sie werden mehr von der Wiedergaberaumakustik bestimmt, als vom Aufnahmeraum, enthalten teilweise widersprüchliche Informationen und die Phantomschallquellen verhalten sich völlig anders als reale Schallquellen. Eine genauere Beschreibung dieser disaströsen Verhältnisse würde hier zu weit führen und ist deshalb hier > verlinkt.
2. Das räumliche Schallfeld
2.1 Zwei verschiedene Ziele
Kaum ein anderes Thema ist so ausführlich beschrieben und in allen Facetten diskutiert, wie die Audio- Wiedergabe. Endlose Dispute drehen sich um sich die Frage, ob nun die Lautsprecherkabel oder doch die Spikes unter den Boxen wichtiger sind für den korrekten räumlichen Eindruck. Außerdem gibt es eine tiefe Uneinigkeit über das Ziel der Audio-Wiedergabe. Eine Gruppe meint, die Reproduktion sei allein ein Kunstprodukt, ausgerichtet auf die perfekte Wahrnehmung. Andere Enthusiasten, vornehmlich Liebhaber klassischer Musik, möchten eine Reproduktion so nahe wie möglich am Originalereignis.
Studio-Produktionen sind heute in der Lage eine subjektiv sehr angenehme Wiedergabe zu erzeugen, bei der jede einzelne Stimme oder jedes Instrument oft viel deutlicher hörbar ist als beim Live-Event. Auf der anderen Seite sind wir bis heute nicht in der Lage, auch nur das Summen einer Biene direkt vor unserer Nase, oder die Klarheit einer Stimme in guter Akustik, geschweige denn die die Gänsehaut, die uns im Brahms-Konzert überkommt wenn die Hörner einsetzen, mit Lautsprechern zu erzeugen.
Endziel aller Entwicklungen muss deshalb beides sein, sowohl die Möglichkeit jeden einzelnen Klangkörper unter künstlerischen Aspekten nachzubearbeiten, als auch die korrekte Reproduktion des räumlichen Eindrucks einer beliebigen Schallquelle in beliebiger akustischer Umgebung.
Während das erste Ziel mit den konventionellen Verfahren erreicht wird, sind wir bis heute weit entfernt von der korrekten räumlichen Wiedergabe des Originalschallfeldes. Wenn wir aber beides erreichen könnten, kongruente räumliche Staffelung der Wellenfronten an einem Zuhörerpunkt im Aufnahmeraum und vor den Lautsprechern im Heimkino, dabei aber jede Einzelne Schallquelle unter künstlerischen Gesichtspunkten veränderbar, dann hätte der Produzent die freie Entscheidung zwischen dem "echten Raumklang" oder dem "viel besser als echter Raumklang".
2.2 Das Ray- Tracing- Modell
Ursache für die endlosen Diskussionen ist vielleicht auch, dass wir kaum eine konkrete Vorstellung vom räumlichen Schallfeld haben. Das anschaulichste Bild ist das Spur- Verfolgungs-Modell. [3] Danach können wir uns das räumliche Schallfeld einer Konzerthalle als räumliche Verteilung einer riesigen Menge fest positionierter Einzelschallquellen vorstellen, die das Signal der primären Quelle abstrahlen. Jeder Musiker im Orchester ist eine solche primäre Schallquelle.
Betrachten wir nur einen einzelnen Musiker, so wird zuerst die direkte Welle von seinem Instrument wird beim Zuhörer eintreffen. Der Pegel wird vom Abstand zum Zuhörer bestimmt, zusätzlich ergeben sich entsprechend der räumlichen Abstrahlcharakteristik des Instrumentes frequenzabhängige Pegeländerungen, je nach Ausrichtung des Instrumentes im Raum. Der Ankunft der direkten Welle folgt eine kurze Zeit ohne Tont, die Anfangszeitlücke ITDG. Sie ist wichtig für die Wahrnehmung der Entfernung zur Schallquelle.
Die erste starke Reflexion trifft den Hörer in Konzertsaal möglicherweise aus Richtung der Bühnenrückwand, gefolgt von zwei starken Seitenwandreflexionen, dann Decke oder Boden und zuletzt die Rückwandreflexion als deutlichste Spitzen in der Impulsantwort. Das ist in dieser kleinen Animation dargestellt:
Wie zu sehen ist, liegen die Ausgangspunkte der Spiegelschallquellen, von denen die ersten schallstarken Reflexionen scheinbar ausgehen, außerhalb der Mauern des Konzertsaales. Ihre Winkel und Distanzen zum Zuhörer ändern sich merklich, sobald sich entweder die primäre Quelle oder der Zuhörer im Aufnahmeraum bewegt. Schon kleine Änderungen können wir dabei deutlich wahrnehmen, die Abstände und Winkel zu den Ausgangspunkten dieser ersten Reflexionen sind die wichtigsten Zeichen für unsere räumliche Wahrnehmung des Schallereignisses. Die wahrgenommene Größe des Aufnahmeraumes und auch die empfundene Entfernung zur Schallquelle werden vor allem davon bestimmt.
Jede dieser ersten Reflexionen ist eine neue Schallquelle, die wiederum ihre Reflexionen im Aufnahmeraum hat, und so weiter. Die Abstände und Winkel dieser späteren Reflexionen zum Zuhörer hängen auch von der Zuhörer- und Quellposition im Aufnahmeraum ab, aber für die Wahrnehmung bleibt nur ihr Abstand zum Zuhörer und ihr Pegel wichtig. Wir haben nicht die Möglichkeit, diesen Schallwellen nach mehrfacher Reflexion noch einen Ausgangspunkt zuzuordnen.
Im Prinzip entsteht eine unendliche Zahl solcher Reflexionen in immer weiter vom Zuhörer entfernten Ausgangspunkten. Doch in, sagen wir für unseren Konzertsaal 1000 Meter Entfernung vom Hörer, von 20 oder 30 Reflexionsverlusten, Luft-Dämpfung über die große Distanz und dem Pegelabfall entsprechend der 1 / r – Funktion geschwächt, nach mehr als zwei Sekunden Laufzeit auf dem Weg zum Zuhörer, ist ihre Energie unter die -60 dB-Schwelle, die die Nachhallzeit kennzeichnet, gesunken.
Wir können uns so das räumliche Schallfeld des Konzertsaales als sehr große Zahl von kleinen Lautsprechern oder virtuellen Schallquellen an den Ausgangspunkten aller Reflexionen vorstellen. Jedes Signal wäre das trockene Audiosignal der primären Schallquelle, im Frequenzgang verändert entsprechend der räumlichen Abstrahlcharakteristik und Ausrichtung des Instrumentes und zusätzlich korrigiert entsprechend den Reflexionsfaktoren aller Oberflächen, die im Signalweg der Reflexion lagen.
Im Prinzip könnten wir die Akustik eines jeden der berühmten Konzertsäle der Welt in einer Umgebung ohne eigenen Reflexionen, zum Beispiel auf einer verschneiten Winterwiese, mit vielen kleinen Einzellautsprechern absolut korrekt simulieren. Innerhalb der Dimensionen des Konzertsaales wären dann auch die die Veränderungen in der Wahrnehmung absolut gleich, ob wir nun durch den Schnee stapfen oder den Platz im Konzertsaal wechseln. Neben den korrekten Doppler-Effekten markiert das die physische Kopie. Psycho-akustische, also auf Phantomschallquellen basierende Verfahren werden niemals in der Lage sein, eine solche kongruente Wahrnehmung zu erzeugen. Bleibt also nur die Frage, wie wir die vielen Lautsprecher auf der Winterwiese in unserem Wohnzimmer simulieren können.
2.3 Die virtuellen Ausgangspunkte
Millionen von kleinen Lautsprechern sind keine praktikable Lösung für den Aufbau einer virtuellen Kopie des Ausgangsschallfeldes. Zudem hätten wir für jede primäre Schallquelle ein komplettes Lautsprecherset an anderen Positionen zu installieren. Die müssten zu alledem beweglich sein, denn wenn der Tenor über die Bühne geht, verändern sich der Ausgangspunkt der direkten Welle und damit all ihrer Reflexionen.
2.4 Virtuelle Schallquellen
Die korrekte räumliche Reproduktion eines Schallfeldes kann nicht auf der Bildung von Phantomschallquellen beruhen. Die Ausgangspunkte dieser Schallwellen entstehen erst durch psychoakustische Verknüffung der Ohrsignale und sind deshalb nicht stabil, wir können nicht unser Ohr an eine Phantomschallquelle halten, wie an eine reale Schallquelle.
Eine virtuelle Schallquelle dagegen ist in ihrer räumlichen Position so stabil, dass sogar Doppler- Effekte entstehen wenn wir auf sie zu bewegen. Solch eine virtuelle Schallquelle entsteht zum Beispiel im Zentrum einer Kugel aus Lautsprechern, wie das in dieser kleinen Animation dargestellt ist:
Es ist leicht einzusehen, dass wir den virtuellen Ausgangspunkt der Wellenfront immer in der Mitte dieser Kugel wahrnehmen, egal aus welcher Richtung oder Entfernung wir sie hören. Darin unterscheidet sich eine solche virtuelle Schallquelle grundsätzlich von der Phantomschallquelle, weil ihre Position wie bei einer realen Schallquelle von der Zuhörerposition unabhängig ist. Wären wir in unserem Heimkino in der Lage solche virtuellen Schallquellen relativ zum Zuhörer überall dort zu positionieren wo Schallwellen und Reflexionen im Aufnahmeraum ihren Ausgangspunkt haben, so wäre die Wiedergabe vom Originalschallereignis nicht zu unterscheiden.
3. Wellenfeldsynthese
Vor mehr als zwanzig Jahren wurde von Berkhout an der TU Delft in den Niederlanden ein Verfahren entwickelt, das mit einem linearen Array aus einzeln ansteuerbaren Lautsprechern solche gekrümmten Wellenfronten erzeugen kann [1]. Diese „ Wellenfeldsynthese“ erzeugt virtuelle Schallquellen. Grundlage ist das Huygenssche Prinzip, nach dem jeder Punkt einer Wellenfront als Ausgangspunkt einer Elementarwelle betrachtet werden kann. Anschaulich lässt sich das erklären, wenn wir Löcher in einer Trennwand als Ausgangspunkt solcher Elementarwellen betrachten. Sind die Abmessungen dieser Durchbrüche kleiner als die Wellenlänge, so wird sich der Schalldruck an beiden Seiten der Öffnung nicht unterscheiden. Die Summe der einzelnen „Elementarwellen“ wird wieder die ursprüngliche Wellenfront sein.
Es ist ersichtlich dass wir die primäre Wellenfront aus den Zeitverzögerungen und Pegeln, die sich aus der Entfernung der virtuellen Schallquelle zum jeweiligen Lautsprecher ergeben, vollständig synthetisieren können. Im Bereich der Lautsprecherreihe ist die virtuelle Schallquelle für den Zuhörer dann nicht von einer realen Schallquelle zu unterscheiden.
Unglücklicherweise besteht aber das Schallfeld im Aufnahmeraum, das wir reproduzieren wollen, nur zum geringsten Teil aus dieser direkten Wellenfront. Die Wände reflektieren das Signal der Schallquelle. Aus Richtung und Pegel der ersten Reflexionen können wir Rückschlüsse auf die Entfernung zur Schallquelle und zu den Wänden des Aufnahmeraumes, also auf die Raumgröße, ziehen. Der Nachhall liefert uns dann mit seinen vielen Einzelreflexionen wichtige Informationen zu Eigenschaften und Feinstruktur der Oberflächen im Aufnahmeraum.
Vorteil des differenziert angesteuerten Lautsprecherarrays gegenüber der Lautsprecherkugel ist es, dass mehrere räumlich getrennte virtuelle Schallquellen erzeugt werden können. Ihr Signalinhalt kann unterschiedlich sein, sie können aber auch Reflexionen des Quellsignals vortäuschen wenn sie mit dem seinem Signalinhalt angesteuert werden. Das reale Schallfeld im Aufnahmeraum hat eine riesige Menge solcher Ausgangspositionen mit gleichem Signalinhalt. Wenn alle diese Ausgangspositionen rekonstruiert werden könnten, ließe sich aus dem trocken aufgenommenen Quellsignal das komplette räumliche Schallfeld des Aufnahmeraumes wiederherstellen. Dazu braucht man dann nur ein Mono- Audiosignal für jede primäre Quelle. Schließlich erzeugt auch der Aufnahmeraum das gesamte räumliche Schallfeld mit all seinen Reflexionen aus diesem Quellsignal. Die Schwierigkeit ist nur, alle Quellpositionen der Vielzahl von Reflexionen im Aufnahmeraum zu bestimmen. Dazu gibt es zwei prinzipielle Möglichkeiten. Die einfachere Methode ist der modellbasierte Ansatz. Dabei werden die Ausgangspunkte der Reflexionen einfach nach der Spiegelschallquellenmethode aus der Geometrie des Aufnahmeraumes berechnet. Aus ihrer Entfernung zum jeweiligen Lautsprecher ergibt sich dann, welche Laufzeit der Schall von der jeweiligen virtuellen Quelle aus hätte. Entfernung und Reflexionsfaktoren gehen in die Kalkulation der Pegel ein. Das trocken aufgezeichnete Digitalsignal wird verzögert an diesen Lautsprecher ausgegeben. Die Signale aller virtuellen Quellen werden dabei zum Gesamtsignal für den betreffenden Lautsprecher addiert. Dieses Verfahren wäre für die direkte Welle und ihre ersten Reflexionen im Aufnahmeraum praktikabel, der Nachhall besteht aber aus einer solchen Vielzahl von Einzelreflexionen das seine korrekte räumliche Synthese nach diesem modellbasierten Ansatz praktisch unmöglich wäre.
Aus diesem Grund hat sich an den Forschungsinstituten, die Berkhouts Verfahren praktisch umgesetzt und weiterentwickelt haben, die impulsantwortbasierte Methode allgemein durchgesetzt. Dafür wird in Vorbereitung der Übertragung die räumliche Impulsantwort des Aufnahmeraumes gemessen. Im Aufnahmeraum wird dazu eine Reihe von Mikrofonen so angeordnet wie die einzelnen Lautsprecher bei der Wiedergabe. Dann wird an dort, wo die primäre Schallquelle ist ein Impuls erzeugt. Er wird das Mikrofon zuerst erreichen, das den geringsten Abstand zur Quelle hat. Wird dann auf der Wiedergabeseite das Audiosignal in die Imulsantwort gefaltet, so wird der zugeordnete Lautsprecher das Signal zuerst abstrahlen. Die anderen Lautsprecher werden dann in der Reihenfolge angesteuet, in der ihre zugeordneten Mikrofone vom Impuls getroffen wurden. So erzeugt die Faltung in die räumliche Impulsantwort eine Kopie der Wellenfront. Weil aber die Reflexionen im Aufnahmeraum von anderen Ausgangspunkten ausgehen, treffen sie die Mikrofonanordnung in anderer Reihenfolge. Deshalb werden auch sie bei der Wiedergabe zum korrekten Zeitpunkt und mit der richtigen Amplitude wiederhergestellt. So rekonstruiert die Wellenfeldsynthese mit der Faltung in die räumliche Impulsantwort vollständig die Akustik des Aufnahmeraumes.
Doch ist es in der Praxis unmöglich, die Impulsantwort für jede mögliche Position der primären Quelle an jeder möglichen Lautsprecherposition aufzuzeichnen. Deshalb müssen die Messergebnisse bei der Wiedergabe auf die tatsächlichen Positionen extrapoliert werden. In diese Berechnung sind auch alle Spiegelschallquellen einzubeziehen, weil sie ihren Ausgangspunkt mit der Bewegung der Quelle verändern. Das ist selbst mit modernen Computern für den dreidimensionalen Ansatz eine kaum lösbare Aufgabe, insbesondere wenn sich die primäre Quelle im Aufnahmeraum bewegt. Doch im Prinzip könnte die Wellenfeldsynthese auch eine dreidimensionale Kopie des gesamten Schallfeldes erzeugen.
Mit den horizontalen Lautsprecherreihen ist das aber nur in ihrer horizontalen Ebene möglich. Aber schon das ist ein bemerkenswerter Fortschritt für die Audioreproduktion, weil der Zuhörer in der Volumenlösung nicht an einen engen sweet- spot gebunden ist. Die Synthese aus dem Quellsignal ist bisher die einzige Möglichkeit, die komplexe Struktur des Ausgangsschallfeldes nicht nur an einem Punkt, sondern in einem Raum wiederherzustellen.
Die virtuellen Schallquellen können dabei auch als „fokussierte Quellen“ vor der Lautsprecherreihe entstehen. Das ist mit dem „ Time Mirror Approach“ genannten Ansatz zu realisieren. In der Animation würde es für die Laufzeiten zu den Einzellautsprechern keinen Unterschied machen, ob die Schallquelle vor oder hinter der Lochwand ist, der Zuhörer würde sie immer hinter dieser Wand wahrnehmen. Invertiert man aber den zeitlichen Ablauf der Lautsprechansteuerung, so erzeugen die Elementarwellen eine konkave Wellenfront mit einem Focuspunkt vor der Lautsprecheranordnung, also eine virtuelle Quelle innerhalb des Wiedergaberaumes. Um diese focussierte Schallquelle kann man - mit gewissen Einschränkungen- in den WFS- Versuchsanordnungen sogar herumlaufen.
Bisher sind die praktisch realisierten Anlagen aber noch deutlich vom Ziel der perfekten Reproduktion entfernt. Vor allem die Reduktion des Verfahrens auf die horizontale Ebene des Zuhörers unterscheidet die Wiedergabe noch deutlich vom Originalschallfeld und die unzureichende Zahl von Elementarwellen führt zu tonalen fehlern. Dazu kommt der „ Truncation- Effekt “, eine Schattenwelle die sich durch den Druckwechsel ausbildet, wenn am Ende der Lautsprecheranordnung keine Elementarwellen mehr zum Gesamtschalldruck beitragen. Das kann durch Pegelabsenkung der äusseren Lautsprecher gemildert werden und auch die anderen Probleme scheinen lösbar. Erste zweidimensionale WFS- Lautsprecherfelder sind schon praktisch realisiert worden. Solche Lautsprecheranordnungen wären auch geeignet, einen vom Autor schon 2005 patentierten „ Holofonie“ - Ansatz zu realisieren. Das Verfahren wird im nächsten Kapitel erläutert.
4. WFS- Holofonie
Wenn solche Lautsprecherfelder die gesamte Oberfläche des Wiedergaberaumes bedecken würden, wäre Schalldruck und Schallschnelle an jedem Punkt innerhalb dieses Volumens rekonstruierbar. Das ist mit dem Kirchhoff- Helmholtz- Integral , der mathematischen Grundlage der Wellenfeldsynthese, zu beweisen. Jedoch würde der Akzeptanzfaktor im Heimbereich den Erfolg eines solchen Konzeptes mit Sicherheit verhindern. Dieses Kapitel beschreibt einen patentierten Vorschlag des Autors, der die Reduktion auf die horizontale Ebene überwindet und zudem eine kaum störende Anordnung der Lautsprecher im Wiedergaberaum ermöglicht. Sie werden in einer Ebene hinter der Bildwand aufgebaut. Im Prinzip ist das vergleichbar mit den bekannten Sound- Projektoren, die mit ihrer gerichteten Abstrahlung virtuelle Lautsprecher im Wiedergaberaum erzeugen. Das WFS- Lautsprecherfeld simuliert aber die Reflexionen des Aufnahmeraumes mit Hilfe der Reflexionen des Wiedergaberaumes, so wie es in der Animation am Anfang der Seite dargestellt ist.
4.1. Die Kopie des räumlichen Schallfeldes
Seit der Erfindung der Stereofonie versuchen wir, die akustischen Verhältnisse im Aufnahmeraum mit immer mehr Übertragungskanälen immer perfekter zu reproduzieren. Dabei ist doch die Schallquelle selbst, zumindest aus einiger Entfernung betrachtet, gewöhnlich eine MONO- Schallquelle. Sie hat zwar eine räumliche Abstrahlcharakteristik, aber kein räumliches Schallfeld, das zu übertragen wäre. Das Räumliche Schallfeld entsteht allein aus den Reflexionen im Aufnahmeraum. Ihre komplexe räumliche Verteilung könnten wir in allen Raumdimensionen rekonstruieren, wenn wir von folgender Überlegung ausgehen:
Wenn rings um einen Sitz im Konzertsaal eine geschlossenen Hütte gebaut würde, so groß wie ein Wohnzimmer, aber völlig durchlöchert, so wäre zwar die Sicht leicht behindert, aber die akustische Wahrnehmung bliebe ungestört. Nun könnte man auch jedes dieser Löcher mit einem Lautsprecher zustopfen, der von seinem Mikrofon an der Außenseite der Öffnung angesteuert würde. Akustisch wäre dann nichts verändert, es wäre als ob die Löcher offen wären. In die Wohnzimmerwände eingebaut könnten diese Lautsprecher dann eine perfekte Kopie des Original- Schallereignisses erzeugen! Doch es wäre ein Problem zu lösen: So viele Kanäle sind kaum übertragbar, jeder Lautsprecher hat schließlich ein etwas anderes Signal. Genauer betrachtet unterscheidet sich aber nicht die Signalform, sondern nur die Zeit, zu der das Signal am jeweiligen Loch eintrifft. Deshalb kann man alle Lautsprechersignale aus dem Monosignal synthetisieren, wenn man die Position der Schallquelle im Aufnahmeraum kennt, um die Laufzeit zum jeweiligen Loch zu berechnen. Für eine räumliche Wiedergabe darf man aber nicht nur das Signal der Schallquelle selbst übertragen, auch die Reflexionen des Aufnahmeraumes müssen wiederhergestellt werden. Die singen aber kein anderes Lied als der Tenor selbst, auch sie können deshalb aus dem Signal der Quelle synthetisiert werden, wenn ihre Ausgangspositionen bekannt sind.
Praktisch lässt sich das umsetzen, wenn die Schallquellen dicht mikrofoniert in Einzelspuren aufgezeichnet werden. Zusätzlich wird die Position der zugehörigen Schallquelle im Aufnahmeraum und Daten zu seinen Reflexionseigenschaften übertragen. So lässt sich auf der Wiedergabeseite das räumliche Schallfeld in der gleichen Weise aus den Mono- Signalen synthetisieren, wie es im Aufnahmeraum aus diesen Signalen entstanden ist. Bleibt das Problem mit den Lautsprechern ringsum. Doch wenn man den Wiedergaberaum geschickt in die Synthese einbezieht und seine Wände als Reflexionsflächen nutzt, ähnlich wie die Soundprojektoren mit ihrer gerichteten Abstrahlung, dann reicht eine große Lautsprecherwand hinter der Bildwand aus.
Anders als bei den Soundprojektoren werden bei einem solchen "Holofonie" - Ansatz aber keine virtuellen Lautsprecher erzeugt, sondern die Wellenfeldsynthese simuliert die Schallquelle selbst und all ihre Reflexionen, virtuell im virtuellen Aufnahmeraum. Im Nahfeld der großen Strahlerfläche schwindet der störende Einfluss der Wiedergaberaumakustik, auch in einem akustisch nicht besonders behandelten Wohnzimmer kann die Aufnahmeraumakustik simuliert werden.
Es nicht das Ziel jeder Aufzeichnung, das Schallfeld des Aufnahmeraumes einfach zu kopieren. Heute sind die Aufnahmen immer mehr ein gestaltetes Kunstprodukt, bei denen es oft gar keinen Bezug zu einem Originalschallereignis gibt. Der „ Holofonie“- Ansatz bietet dafür aber völlig neue Perspektiven, weil viele unlösbare Probleme der konventionellen Verfahren vermieden werden und die Prozedur den am meisten fehlerbehafteten Teil in der Übertragungskette, die Wiedergaberaumakustik, einfach bei der Schallfeldsynthese subtrahiert.
4.2 Probleme der horizontalen Lautsprecherreihen
Wellenfeldsynthese wird heute allgemein mit horizontalen Lautsprecherreihen rings um den Zuhörer erzeugt. Der Aufbau solcher Lösungen ist heute schon mit mehreren hundert diskret angesteuerten Einzellautsprechern ohne unlösbare Probleme möglich, jedoch scheint ein breiter Marktdurchbruch zumindest im Heimbereich nicht absehbar zu sein. Neben dem Akzeptanzfaktor für die ringsum montierten Lautsprecher in einem speziell bedämpften Wiedergaberaum sind einige zusätzliche Probleme bis heute ungelöst.
Die am deutlichsten hörbare Einschränkung ist die Reduktion auf die horizontale Ebene des Zuhörers. Andere Verfahren, wie Ambisonics oder Vector Base Amplitude Panning (VBAP) haben gezeigt dass die Elevationsebene für die perfekte Wiedergabe unerlässlich ist. Diese Verfahren haben aber nicht den Vorteil der Volumenlösung, ihr Wiedergabebereich ist im Vvergleich zur Wellenfeldsynthese deutlich enger.
Zudem haben auch sie das Problem, das der Wiedergaberaum der Reproduktion seine eigene Akustik aufprägt. Auch die horizontalen WFS- Reihen können das nicht überwinden. Wenn die Akustik eines anderen Raumes simuliert werden soll, muss die Akustik des Wiedergaberaumes durch starke Bedämpfung möglichst völlig unterdrückt werden. In normalen Wohnräumen ist das kaum möglich, solche Systeme können in experimentellen Setups oder Kinos und Diskotheken aufgebaut werden, aber ohne Aussicht auf Marktakzeptanz im Heimbereich.
Die horizontalen Lautsprecherreihen erzeugen keine parallelen Wellenfronten, die in allen Ebenen gesteuert werden können, sondern Zylinderwellen, die 3 dB Pegel verlieren wenn der Abstand verdoppelt wird. Wenn der Zuhörer nahe an den Lautsprechern ist wird diese Lautstärkedifferenz störend. Schlimmer aber ist, dass sich der Energieverlust nicht in sich selbst auflöst sondern der Aufnahme, die in einem Raum mit völlig anderen Eigenschaften aufgezeichnet wurde, das akustische Verhalten des Wiedergaberaumes aufprägt.
4.3 Die Nahfeldlösung mit dem „akustischen Vorhang“
Neben dem tragen von Kopfhörern oder dem schalltoten Raum ist die einzige Möglichkeit, den störenden Einfluss der Wiedergaberaumakustik zu vermeiden die Nahfeldwiedergabe. Zwei Möglichkeiten gibt es dafür: Entweder die Lautsprecher werden sehr nah am Zuhörer aufgestellt oder die Membran wird sehr groß. In normalen Wohnzimmern ist der Zuhörer etwa drei bis vier Meter von den Lautsprechern entfernt. Aber der Diffusschallpegel überschreitet den von den Lautsprechern abgestrahlten Direktschallanteil, abhängig von Nachhallzeit und Bündelungsmass der Lautsprecher, in akustisch unbehandelten Räumen gewöhnlich schon in weniger als einem Meter Entfernung von den Boxen. Bleibt nur der schalltote Raum oder ein Membrandurchmesser über ca.1, 5 Meter. Das ist nicht möglich mit herkömmlichen Lautsprechern, aber bei der Wellenfeldsynthese arbeiten alle Einzelstrahler zusammen. Eine so große Fläche würde das Prinzip des „akustischen Vorhanges“ realisieren. Schon vor mehr als einem halben Jahrhundert träumten die Wissenschaftler von so einer Lösung, hielten ihre Realisierung aber für niemals möglich:
Die Membranauslenkungen der Einzelstrahler sind aus dem Abstand zur virtuellen Schallquelle einfach zu berechnen. Die Verformung der resultierenden Gesamtmembran ist dann abhängig von der Position dieser virtuellen Quelle und der Frequenz, im Beispiel 440 Hz, Virtuelle Quelle 2 m hinter dem Feld aus 48*27 Lautsprechern:
Mit sinkender Frequenz die Biegung der Membranfläche geringer, im Tiefetonbereich entsteht eine gemeinsame Kolbenbewegung. Bei zwei inch (5,08 cm) Abstand zwischen den Einzelstrahlern ist das Feld etwa 2,43 x 1,38 Meter groß, womit die Nahfeldbedingung unter Wohnraumverhältnissen erreicht ist. Das hat auch den Vorteil, dass die Spiegelschallquellen des Wiedergaberaumes wegen der hohen Richtwirkung des großen Lautsprecherfeldes kaum noch ungewollt mit Energie versorgt werden. Dadurch erzeugt er weniger Nachhall. Wenn dann seine ersten Reflexionen die ersten Reflexionen des Aufnahmeraumes vortäuschen, ist die Illusion perfekt.
4.4 Die Subtraktion der Wiedergaberaum- Akustik
In den zahlreichen wissenschaftlichen Publikationen zum Thema Wellenfeldsynthese fällt auf, das der entscheidende Vorteil der Wellenfeldsynthese bisher kaum beachtet wurde. Im Unterschied zu allen anderen Audiowiedergabeverfahren sind bei der Synthese die Komponenten direkte Welle, erste Reflexionen und Nachhall getrennt manipulierbar. Bei allen konventionellen Verfahren werden sie schon auf der Aufnahmeseite vermischt.
Wenn diese Möglichkeit genutzt wird, ergeben sich ungeahnte Möglichkeiten für die Reproduktion. Dazu müssen wir aber den gesamten Systemansatz der Übertragung von Audiosignalen in Frage stellen. Traditionell beginnt die Übertragungskette beim Mikrofon und endet an den Lautsprechern. Aber wenn die Lautsprecher ihre Arbeit getan haben, wird das Signal im Wiedergaberaum völlig verändert. Für eine realistische Wahrnehmung ist die Einbeziehung des Wiedergaberaumes in die Übertragungskette substantiell. Deshalb ist der hier beschriebene „ Holofonie“- Ansatz nicht, wie allgemein auch die Wellenfeldsynhese, darauf ausgerichtet perfekte Signale in den Lautsprechern zu erzeugen. Ziel des Verfahrens ist es, an den Ohren des Zuhörers die gleichen Verhältnisse zu schaffen wie an einer festgelegten Zuhörerposition im Aufnahmeraum. Dazu werden im System eine Default- Zuhörerposition im Wiedergaberaum und eine vom Produzenten festgelegte, aber nachträglich veränderbare Position eines virtuellen Zuhörers im Aufnahmeraum eingeführt.
Mit diesem Systemansatz müssen wir die Wiedergaberaumakustik nicht mehr unterdrücken, um die Doppelräumigkeit der konventionellen Verfahren zu vermeiden. Die Schallumwege und Pegelveränderungen werden dadurch in die Synthese einbezogen, dass die beiden Zuhörerpositionen in Konguenz gesetzt werden. Der modellbasierte Ansatz subtrahiert dann die zusätzlichen Umwege der ersten Reflexionen im Wiedergaberaum, stellt ihre ursprünglichen Einfallsrichtungen in allen drei Raumdimensionen wieder her und verrechnet unterschiedliche Reflexionsfaktoren.
Das sehr einfache Modell berücksichtigt dabei nur die direkte Welle und die ersten Wandreflexionen. Sie sind die wichtigsten Komponenten für den räumlichen Eindruck. Wird die korrekte Anfangszeitlücke erzeugt, so ist für alle späteren Reflexionen Zeit und Richtung weniger signifikant. Für die übergreifende Berechnung muss die Geometrie von Aufnahme- und Wiedergaberaum in einem groben Modell bekannt sein. Dann werden die beiden Zuhörerpositionen als Ursprung eines gemeinsamen Koordinatensystems gesetzt. Der äußere Raum in der Skizze ist der Aufnahmeraum 3b, innen der kleinere Wiedergaberaum 3i mit dem frontalen WFS- Lautsprecherfeld 3g.

Die Schallquelle 3c wird von dem WFS- Lautsprecherfeld wie von einen akustischen Vorhang perfekt rekonstruiert. Jedoch die Deckenreflexion im Aufnahmeraum 3d liegt weit außerhalb des vom Lautsprecherfeld darstellbaren Bereiches. Um diese erste schallstarke Reflexion zu simulieren muss ihre Position auf einer Kreisbahn um den Zuhörerpunkt in den Bereich gebracht werden, in dem das Lautsprecherfeld im Wiedergaberaum eine Spiegelschallquelle 3e ausbildet. In einem zweiten Schritt wird diese Position dann an der geometrischen Position der Wiedergaberaumdecke gespiegelt. Von diesem Startpunkt 4b aus treffen die Wellenfronten der virtuellen Schallquelle exakt im gleichen Zeitabstand nach der direkten Welle und annähernd aus der Richtung wie im Aufnahmeraum beim Zuhörer ein.
Diese Prozedur simuliert die Höhe des Aufnahmeraumes für die akustische Wahrnehmung. Auf alle reflektierenden Wände angewendet wird so die Größe des Aufnahmeraumes akustisch vorgetäuscht. Das Timbre des Aufnahmeraumes wird dann über die Faltung des Signals in die Impulsantwort des Aufnahmeraumes erzeugt.
4.5 Kombination des Modellbasierten Ansatzes mit dem Impulsantwort- basierenden Verfahren
In den frühen Jahren der Forschung an der Wellenfeldsynthese war der Versuch aussichtslos, mit der verfügbaren Rechenleistung den korrekten Ausgangspunkt aller Reflexionen eines Schallfeldes in allen drei Raumdimensionen korrekt synthetisieren zu wollen. Das war sicher auch ein Hauptgrund für die bis heute übliche Reduktion des Verfahrens auf die horizontale Ebene des Zuhörers. Bis heute ist die Entwicklung effektiver Prozeduren für die Extrapolation und Interpolation der gegebenen Messwerte auf die korrekten Positionen der Vielzahl von virtuellen Schallquellen und Spiegelschallquellen zu jedem einzelnen der Lautsprecher Gegenstand intensiver Forschung, vor allem im europäischen Raum. Aktuelle Veröffentlichungen zu effektiven Rechenverfahren dafür [3] oder feldbezogenen Lösungsansätze [4] belegen den Stellenwert der Wellenfeldsynthese als volumenbasierte Lösung zur Audioreproduktion. Bis heute konnte aber eine dreidimensionale Wellenfeldsynthese für frei bewegliche Schallquellen noch nicht praktisch realisiert werden. Eine Möglichkeit, die verbleibenden Probleme zu lösen wäre die Kombination des modellbasierten Ansatzes mit dem datenbasierten Ansatz:
Der Nachhall enthält wichtige Informationen über die Aufnahmeraumeigenschaften. Die Feinstruktur der Oberflächen, die das Timbre des Raumes bestimmen, wird mit dem Nachhall reproduziert. Die Faltung des Signals in die Impulsantwort des Aufnahmeraumes ist eine bewährte Methode um diesen Nachhall sehr authentisch zu erzeugen. Jedoch ist die Richtung, aus der uns die Schallwellen treffen dabei von untergeordneter Bedeutung. Auch im Aufnahmeraum treffen sie uns von überall her, wir können den Spiegelschallquellen der zweiten und aller späteren Reflexionen keinen konkreten Ausgangspunkt mehr zuordnen.
Andererseits beeinflusst die direkte Welle und ihre erste Reflexion kaum das Timbre des Raumes, aber wir haben über optische Verknüpfungen erlernt ihnen einen Ausgangspunkt zuzuordnen. Der bestimmt die wahrgenommene Größe des Raumes und unseren Raumeindruck. Deshalb ist es wenig sinnvoll, direkte Welle, erste Reflexionen, und Nachhall in der gleichen Weise zu verarbeiten. Die Faltung des gesamten Signals in die räumliche Impulsantwort liefert zwar perfekte Ergebnisse, jedoch ist es überflüssig den exakten Ausgangspunkt jeder Reflexion im Nachhallanteil zu reproduzieren. Das ist mit enormem Aufwand verbunden und ist, speziell wenn sich die primäre Schallquelle im Aufnahmeraum bewegt, für eine dreidimensionale Reproduktion bis heute an der Grenze der verfügbaren Rechenleistung.
Der Nachhallanteil bleibt relativ unverändert wenn sich die primäre Quelle bewegt, während sich direkte Welle und erste Reflexionen dann stark in Pegel und Richtung verändern. Das ist mit dem Modellbasierten Ansatz viel leichter zu berechnen. So kann dann sogar simuliert werden, dass sich der Zuhörer im Aufnahmeraum bewegt. Entsprechend verändertn sich die Koordinaten aller Schallquellen im Aufnahmeraum und auch alle Ausgangspunkte ihrer ersten Reflexionen verändern ihre relative Position zum virtuellen Zuhörer, was alle Verzögerungszeiten und Pegel von jedem einzelnen Lautsprecher entsprechend verändert.
Wie auch im realen Konzertsaal steigt der Wiedergabepegel für die direkte Welle sehr stark an, wenn die Zuhörerposition sehr nahe an den Solisten herankommt. Die Pegel für die ersten Reflexionen und den Nachhall verändern sich dabei aber kaum. Weil im Nahfeld des gerichtet abstrahlenden Lautsprecherfeldes kaum Reflexionsanteile des Wiedergaberaumes zu hören sind, wird der Zuhörer bei der Wiedergabe dann wirklich den Eindruck einer sehr nahen Schallquelle haben. Welche akustische Perspektive gewählt wird, legt der Regisseur der Aufnahme fest. Die Daten werden in MPEG4 oder einem anderen geeigneten Standard mit dem Signal übertragen, aber der Zuhörer im Heimkino kann sie bei Bedarf mit seinem Joystick oder der Fernbedienung modifizieren und sich so an jede beliebige Schallquelle im Aufnahmeraum heranzoomen.
In der nächsten Überarbeitung des mathematischen Modells soll auch die Ausrichtung des virtuellen Zuhörers im Aufnahmeraum in die Berechnung eingehen, so das er den Kopf drehen oder heben kann. Die im Kapitel Divergenzproblem beschriebene Lösung, laufzeitbedingte Fehlortungen im Bereich der konkaven Wellenfronten zwischen abstrahlendem Lautsprecher und virtueller Schallquelle zu vermeiden, ist schon entsprechend DE 102006054961A1 in die Kalkulation der Werte einbezogen.
Die Kombination mit der Impulsantwortbasierten Methode für den Nachhall lässt sich sehr leicht realisieren. Einige Kanäle sind für die Reproduktion des Nachhalls, der durch herkömmliche Faltung des Summensignals in die Impulsantwort oder durch getrennte Aufzeichnung mit einem omnidirektionalen Mikrofon gewonnen werden kann, reserviert. Für die Faltung gibt das Programm die Zeit aus, in der die Nachhall- Impulsantwort unterdrückt werden muss um zu vermeiden dass die ersten Reflexionen doppelt reproduziert werden. Dieser Nachhall wird dann aus allen Richtungen mit einem Pegel, der nur von der gesamt- Volume Einstellung abhängig ist, wiedergegeben. Das entspricht gut seiner räumlichen Verteilung im Aufnahmeraum.
Deshalb kann bei diesem Ansatz darauf verzichtet werden, dass ein Technikerteam mit Mikrofonarrays die räumliche Impulsantwort des Aufnahmeraumes aufzeichnet. Auch die mathematisch aufwendige Extrapolation dieser Messwerte Werte auf jede einzelne Lautsprecherposition bei der Wiedergabe entfällt. Normale Impulsantworten des Aufnahmeraumes, so wie sie auch im Netz für alle erdenklichen akustischen Umgebungen zu finden sind, reichen völlig aus. Wenn dazu ein grobes geometrisches Modell des Aufnahmeraumes erstellt wird, kann jedes trocken aufgezeichnete Signal so wiedergeben werden, als ob es in den attraktivsten akustischen Umgebungen der Welt aufgenommen wäre.
4.6 Kompatibilität
Der modellbasierte Ansatz ist auch gut geeignet, virtuelle Wiedergabeumgebungen für konventionelle Tonträger zu erzeugen. Dazu selektiert der MODE- Betriebsartenschalter eine geeignete Wiedergabekonfiguration. Die von dem Lautsprecherfeld erzeugten Wellenfronten haben gegenüber der Wiedergabe mit Einzellautsprechern deutlich hörbare Vorteile:
Mono: Das Lautsprecherfeld erzeugt parallele Wellenfronten, hoher Direktschallanteil, geringer Einfluss der Wiedergaberaumakustik
Focus Mono: Bündelt auf die Zuhörerposition, hohe Lautstärke bei wenig Störung der Umgebung, geringer Einfluss der Wiedergaberaumakustik
Stereo: Der größte Vorteil des Verfahrens ist die Möglichkeit, die Wiedergaberaumakustik dem Programmaterial anpassen zu können. Dazu werden zusätzliche erste Reflexionen eines passenden Wiedergaberaumes erzeugt. Es ist in anderen Verfahren nachgewiesen das eine solche Täuschung kaum auffällt, das sie aber die Möglichkeit bietet die Akustik eines passenden Wiedergaberaumes zu simulieren. Bisher war nur die Anpassung des Frequenzganges möglich, nach dem beschriebenen Verfahren kann auch ein Raum passender Größe simuliert werden. Die akustischen Differenzen zwischen Aufnahmeraum und Wiedergaberaum sind heute der entscheidende Faktor für unbefriedigende Reproduktionen.
Ambisconics:Sehr interessant wären die steuerbaren Wellenfronten in Kombination mit dem Ambiophonics- Verfahren zur Wiedergabe von konventionellen Stereoaufzeichnungen. Die " they are here" - Illusion dieses Verfahrens wäre so mit dem besseren Akzeptanzfaktor der Lautsprecherwand zu erreichen.
Sourround: Virtuelle Quellen außerhalb des realen Wiedergaberaumes erzeugen hohen Direktschallanteil bei großem sweet- spot, elevierte virtuelle Quellen können eine 3D- Illusion erzeugen, Erweiterung der Kanalzahl ist durch Softwareupdates möglich.
Ambisconics: Ein vorgeschalteter oder implementierter Ambisonics- Decoder kann virtuelle Quellen an so vielen Positionen erzeugen, wie Eingangskanäle vorhanden sind. Dabei ist auch High Order Ambisonics möglich. Die virtuellen Lautsprecher können weit entfernt simuliert werden, wodurch die Systemforderung nach den parallelen Wellenfronten gut erfüllt wird. Trotzdem bleibt der Zuhörer wegen der gerichteten Abstrahlung im Nahfeld, wodurch der schädliche Einfluss des Wiedergaberaumes bei weit entfernten realen Lautsprecherboxen vermieden wird. So kann Ambisonics auch ohne eine Vielzahl von Einzellautsprechern ein überzeugendes dreidimensionales Schallfeld erzeugen.
Wave field synthesis: Mit geeignetem Ausgangsmaterial unterscheidet sich die Wiedergabe kaum noch vom Original. Der Zuhörer kann seine Abhörposition im Aufnahmeraum selbst bestimmen.
5. Marktreife und Perspektiven
Seit fast dreißig Jahren ist die Wellenfeldsynthese Gegenstand intensiver Forschung an mehreren etablierten Instituten. Technisch ist das Verfahren inzwischen beherrschbar, die bisher größte Anlage ist in einem Hörsaal der TU Berlin aufgebaut und hat etwa 2700 Einzellautsprecher. Viel beachtet wurde in Fachkreisen die gelungene Live- Übertragung eines Konzertes aus dem Kölner Dom in den Hörsaal der TU im Sommer 2008. In mehreren Kinos, auch in einem der „Manns Chinese Theatres“ in Hollywood, wurden von der Thüringer IOSONO ® GmbH sehr erfolgreich umlaufende WFS- Lautsprecherreihen installiert.
Zweidimensionale WFS- Lautsprecherfelder werden bisher nicht kommerziell produziert, eine dreidimensionale Rekonstruktion des Ausgangsschallfeldes ist mit dem Verfahren der Wellenfeldsynthese bisher noch nicht praktisch gelungen. In der AES- Publikation „ The Theory of Wave Field Synthesis Revisited ” [6] vom May 2008 beschreibt aber Spors, Rabenstein und Ahrens nun auch den mathematischen Ansatz für eine solche dreidimensionale, Impulsantwort- basierende Wellenfeldsynthese. Doch auch das Ergebnis der hier beschriebenen Berechnungen für Verzögerungszeiten und Pegel könnte bei entsprechender Formatierung als Impulsantwort für die ersten Reflexionen betrachtet werden. So könnten die praktisch erprobten Rendering- Verfahren für die Impulsantwort- basierte Methode auch für den modellbasierten Ansatz verwendet werden.
Für ein zweidimensionales Lautsprecherfeld wären für eine ausreichend große Strahlerfläche bei akzeptablen Aliasing- Werten etwa 1296 Einzellautsprecher nötig. Dann ändern sich 9072 delay- Zeiten und ebenso viele Pegelwerte sobald sich eine primäre Schallquelle bewegt. Macht die dedizierte Zuhörerposition einen Schritt oder nur eine kleine Drehung, sind es bei einer 32- Kanal- Anlage schon 580.608 neue Rechenergebnisse. Weil aber alle Berechnungen einfache geometrische Operationen sind ist das nach [5] im 125 ms Takt geforderte Update heute für keinen PC ein Problem.
Die große Zahl der Elementarwellen mit dynamischen Lautsprechern zu erzeugen, wäre sehr aufwendig. Wegen der hervorragenden Anpassung an den Lastwiderstand der Luft würde die große Gesamtstrahlerfläche aber schon bei sehr kleinem Membranhub ausreichenden Schalldruck erzeugen. Wird die Übergangsfrequenz zum Subwoofer nicht zu tief angesetzt, reichen sogar die etwa 20 Mikrometer Membranauslenkung der preiswerten, von Warwick Audio patentierten Lautsprecherfolie aus, um ausreichenden Schalldruck zu erzeugen. Auch andere Lösungen mit Elektrostaten oder digitalen Lautsprechern wären denkbar.
Die beschriebenen Lösungsansätze für das gemeinsame System aus Aufnahme- und Wiedergaberaum sind durch das Patent DE 10 2005 001 395 vom 12.01.2005 geschützt. Mit dem modellbasierten Ansatz ist es aber auch möglich bei gegebener Lautsprecheranzahl das Aliasing deutlich zu reduzieren und den Truncation- Effekt weitgehend zu überwinden. Realistisch scheint das Ziel, mit 256 Lautsprechern im Heimbereich die " stage to fault the brain", die vom Originalereignis nicht mehr zu unterscheidende subjektive Wahrnehmung, zu erreichen.
Literatur
[1] Berkhout, A.J. (1988): A holographic approach to acoustic control'. Journal of the Audio Engineering Society, Vol.36, No.12, December 1988, pp.977-995.
[2] Jens Blauert: Räumliches Hören . S. Hirzel Verlag, Stuttgart 1974. ISBN 3-7776-0250-7
[3] Andreas Franck, Karlheinz Brandenburg : Efficient Delay Interpolation for Wave Field Synthesis, AES Convention 125 ( San Francisco , October 2008), Paper 7613
[4] Heinrich, Gregor; Jung, Christoph; Hahn, Volker; Leitner, Michael: A Platform for Audiovisual Telepresence Using Model- and Data-Based Wave-Field Synthesis, AES Convention 125 ( San Francisco , October 2008), Paper 7608
[5] William Francis Wolcott IV: Wave Field Synthesis with Real-time Control,Project Report, University of California Santa Barbara 2007
[6] The theory of wave field synthesis revisited. S. Spors, R. Rabenstein, and J. Ahrens. In 124th AES Convention, Amsterdam , The Netherlands , May 2008. Audio Engineering Society