Hochauflösende Spektrogramme

Stimmige Kunst

Animetra hat die Künstlerin Elia Navarro bei ihrem Werk „distances“ für ihre Ausstellung im Rahmen des „ENTER for Newcomer“-Projekts im DOCK Basel unterstützt.

Elia hat für „distances“ 21 Personen verschiedener Herkunft denselben Satz sprechen lassen und aufgezeichnet. Die Spektrogramme dieser Aufzeichnungen – also visuelle Darstellungen der zeitlichen Klangverläufe – hat sie großformatig auf halbtransparente Folien gedruckt und hochkant aufgehängt. Auf den ersten Blick zeigen die Bilder vermeintlich identische Strukturen, beim zweiten Blick erkennt man jedoch feine Nuancen, erzeugt durch die Verschiedenartigkeit der Stimmen und Akzente.

Das Problem dabei: Kommerziell erhältliche Software ist nicht in der Lage, die hohe Bildauflösung bereitzustellen, die für hochwertige Großformatdrucke nötig ist. Daher haben wir für Elia eine maßgeschneiderte Software entwickelt, die in der Lage ist, Spektrogramme in der Auflösung 20.000 x 4096 Pixel zu berechnen – also mit fast zehnmal mehr Bildinformation als Ultra-HD (4K).

Für die technisch interessierten…

Spektrogramme bilden in der vertikalen Achse das Frequenzspektrum des Tonmaterials ab, also dessen klangliche Zusammensetzung (oben sind die hohen Frequenzen, unten die tiefen) und auf der horizontalen Achse die Zeit, über deren Verlauf man so spektrale Veränderungen sehen kann.

Um Spektrogramme zu erzeugen, wird das zu Grunde liegende Signal mit der sogenannten „Diskreten Fourier-Transformation“ (DFT) analysiert. Dabei ergibt sich die Eigenheit, dass vertikaler und horizontaler Informationsgehalt voneinander umgekehrt abhängig sind („Küpfmüllersche Unbestimmtheitsrelation“): Umso höher die zeitliche Auflösung (horizontal) ist, desto niedriger wird die spektrale Auflösung (vertikal) und umgekehrt. Dies war bei der von Elia angezielten horizontalen Breite von 20.000 Pixeln ein großes Problem, da die benötigte sehr hohe zeitliche Auflösung (bei 40 bis 70 Sekunden Aufnahmedauer 286 bis 500 Spektralanalysen pro Sekunde) eine sehr mangelhafte vertikale Höhe von unter 80 Pixeln bedeutet.

Da die Anwendung im Gegensatz zu den meisten vergleichbaren Produkten nicht echtzeitfähig sein musste, wurde die DFT so angepasst, dass sie durch mehrfache Analysedurchläufe und zeitgleich sehr hoher spektraler Analyseauflösung zwar deutlich mehr CPU-Performance benötigt, aber dafür die angeforderten Auflösungen in beiden Achsen liefern kann. Die Software bietet zudem die für Spektrogramme üblichen Verzerrungen an, um der menschlichen Hörphysiologie zu entsprechen und Batch-Rendering, um mehrere Dateien in einem Arbeitsschritt analysieren lassen zu können.

Beispielbild in voller Auflösung

Scroll to Top