Audio

Tonaufnahmen werden in der altertumswissenschaftlichen Forschung eher selten erzeugt. Sie werden f├╝r die Aufnahme von Interviews, rekonstruierten Musikinstrumenten im Rahmen der Musikarch├Ąologie oder akustischen Eigenschaften von arch├Ąologischen Orten erstellt. Sogar H├Ârb├╝cher altertumswissenschaftlichen Inhalts existieren mittlerweile.

Eine Audiodatei enth├Ąlt auditive Inhalte, die durch zus├Ątzliche Komponenten wie Kapiteleinteilungen angereichert sein k├Ânnen. Die zusammenfassende Speicherung aller Inhalte erfolgt in einem Containerformat. Die auditiven Inhalte selbst werden nochmals in einem eigenen Format, dem sogenannten Codec, gespeichert. Je nachdem welches Containerformat verwendet wird, k├Ânnen weitere Informationen, wie Metadaten oder Transkriptionen gespeichert werden.

Langzeitformate

Da es sich bei den Dateiformaten f├╝r digitale Audiodateien um Containerformate handelt, muss bei der Auswahl f├╝r die Langzeitarchivierung nicht nur ein passendes Format, sondern auch ein geeigneter Codec gefunden werden. Dabei gelten f├╝r die Auswahl des Codecs und des Containerformats die Kriterien, die f├╝r die Wahl von Dateiformaten beschrieben werden: Es sollte sich um einen weit verbreiteten, m├Âglichst nicht propriet├Ąren und offen dokumentierten Standard handeln, der verlustfreie oder gar keine Kompression anwendet. Au├čerdem sollte darauf geachtet werden, dass das gew├Ąhlte Format die Speicherung aller relevanten Elemente der Audiodatei, wie etwa Kapiteleinteilungen, unterst├╝tzt.

Da viele Containerformate f├╝r Audio nur ein Codec-Format speichern k├Ânnen, werden diese in der Regel unter einem Namen zusammengefasst.

F├╝r die Speicherung von unkomprimierten Audiodaten hat sich lineares PCM (Lineare Puls-Code-Modulation, auch LPCM) als Standard durchgesetzt, das von verschiedenen Containerformaten unterst├╝tzt und auch von der IASA (International Association of Sound and Audiovisual Archives) empfohlen wird. Der einzige Nachteil ist der gro├če Speicherplatzbedarf mit etwa 10 MB pro Minute.

Eine verlustfrei komprimierende Alternative f├╝r die Langzeitarchivierung stellt der Free Lossless Audio Codec (FLAC) dar, der offen dokumentiert und frei verf├╝gbar ist. FLAC wird beispielsweise von dem Containerformat Matroska unterst├╝tzt oder kann als eigenst├Ąndiges Format verwendet werden.

Das Waveform Audio File Format (WAVE) wurde von Microsoft und IBM als Teil des Resource Interchange File Format (RIFF) entwickelt. Es ist ein offen dokumentiertes aber propriet├Ąres Format, das mehrere Audio-Codecs unterst├╝tzt. Aufgrund der weiten Verbreitung wird dieses Format jedoch zusammen mit linearem PCM von der IASA empfohlen und hat sich als Standard de facto durchgesetzt.

Die European Broadcast Union (EBU) hat auf WAVE aufbauend das Format BWF entwickelt, das zus├Ątzlich die Einbettung von Metadaten unterst├╝tzt. F├╝r die Langzeitarchivierung sollte dieses Format mit linearem PCM verwendet werden. F├╝r Dateien, die gr├Â├čer als 4 GB sind, hat die EBU das Format RF64/MBWF entwickelt, das zus├Ątzlich die Speicherung von mehr als zwei Tonkan├Ąlen erlaubt.

Das Containerformat Matroska (MKA) wird seit 2003 explizit als offenes Containerformat entwickelt, das modernen Anspr├╝chen gen├╝gt und viele verschiedene Codecs enthalten sowie zus├Ątzliche Elemente, wie Kapiteleinteilungen, speichern kann. Das Format basiert auf einer bin├Ąren Variante von XML, n├Ąmlich EBML (Extensible Binary Meta Language), was eine zuk├╝nftige flexible Erweiterung erlaubt, jedoch auch sicher stellt, dass ├Ąltere Programme weiterhin damit umgehen k├Ânnen. Zus├Ątzlich ist das Format fehlertolerant und kann bis zu einem gewissen Grad auch besch├Ądigte Dateien wiedergeben. Wenn die Audiodaten in linearem PCM oder FLAC gespeichert werden, kann Matroska f├╝r die Langzeitarchivierung empfohlen werden.

Aus der Familie der MPEG-Containerformate, die von der Moving Picture Experts Group (MPEG) entwickelt werden und ISO/IEC zertifiziert sind, stammen das MP3- und das AAC-Format. MP3 (MPEG-1 Audio Layer III) wurde schon in MPEG-1 spezifiziert, das seit 1991 unter ISO/IEC 11172 zertifiziert ist. Es handelt sich dabei um einen Audiocodec mit verlustbehafteter Komprimierung, der jedoch eine weite Verbreitung gefunden hat und in einem gleichnamigen Containerformat gespeichert wird.

Advanced Audio Coding (AAC) ist ein Audiocodec, der als Nachfolger von MP3 im Rahmen von MPEG-2 und MPEG-4 spezifiziert wurde und unter ISO/IEC 13818-7 und 14496-3 standardisiert ist. Auch AAC komprimiert verlustbehaftet und kann in einem gleichnamigen Container gespeichert werden oder beispielsweise auch in dem Containerformat MP4. MP3 und AAC sollten nur dann als Langzeitformat f├╝r Dateien verwendet werden, wenn diese urspr├╝nglich in dem Format entstanden sind.

Das von Apple entwickelte Audio Interchange File Format (AIFF) ist nicht f├╝r die Langzeitarchivierung geeignet, weil es propriet├Ąr ist und haupts├Ąchlich nur auf Apple-Systemen Verbreitung gefunden hat. Das von Microsoft entwickelte Windows Media Audio (WMA) ist ebenfalls ein propriet├Ąres Format, das sich wegen der verwendeten verlustbehafteten Kompression nicht f├╝r die Langzeitarchivierung eignet. Das Format Ogg wurde vor allem f├╝r das Streaming entwickelt und ist aufgrund der verwendeten verlustbehafteten Codecs Opus und Vorbis nicht als Langzeitformat geeignet.

Format Begr├╝ndung
  FLAC Free Lossless Audio Codec ist ein verlustfrei komprimierender Codec, der offen dokumentiert und frei verfügbar ist.
WAVE Waveform Audio File Format wurde von Microsoft und IBM entwickelt und ist offen dokumentiert aber propriet├Ąr. Die Audiodaten sollten als lineares PCM gespeichert werden.
BWF Das Format BWF baut auf WAVE auf und wurde von der EBU entwickelt, um zus├Ątzlich die Einbettung von Metadaten zu unterst├╝tzen. Die Audiodaten sollten als lineares PCM gespeichert werden.
┬á Matroska Ein offenes Containerformat, das eine gro├če Bandbreite von Codecs und erg├Ąnzenden Inhalten unterst├╝tzt. Die Audiodaten sollten als lineares PCM oder FLAC gespeichert werden.
RF64/MBWF Wurde von der EBU aus BWF entwickelt, um Dateien zu speichern, die gr├Â├čer als 4 GB sind oder mehr als zwei Tonkan├Ąle beinhalten. Die Audiodaten sollten als lineares PCM gespeichert werden.
AAC/MP4 Advanced Audio Coding ist der Nachfolger von MP3 und unter ISO/IEC 13818-7 und 14496-3 standardisiert. Er kann unter anderem in den Formaten AAC oder MP4 gespeichert werden. Die Daten werden verlustbehaftet komprimiert, weshalb er nur f├╝r Dateien verwendet werden darf, die urspr├╝nglich in diesem Format entstanden sind.
MP3 MPEG-1 Audio Layer III ist unter ISO/IEC 11172 zertifiziert und verwendet verlustbehaftete Kompression. MP3 kann nur als Langzeitformat f├╝r Dateien verwendet werden, die urspr├╝nglich in diesem Format entstanden sind.
┬á AIFF Das Audio Interchange File Format (AIFF) von Apple ist nicht f├╝r die Langzeitarchivierung geeignet, weil es propriet├Ąr ist.
WMA Windows Media Audio ist ein von Microsoft entwickeltes Format mit verlustbehafteter Kompression
Ogg Ein von Xiph entwickeltes und offenes Format, das jedoch nicht f├╝r die Archivierung geeignet ist, da die Codecs Opus und Vorbis verlustbehaftet komprimieren.

Dokumentation

Neben den allgemeinen minimalen Angaben zu Einzeldateien, wie sie in dem Abschnitt Metadaten in der Anwendung gelistet sind, werden f├╝r Audiodateien weitere Angaben ben├Âtigt, die insbesondere technische Details dokumentieren.

Die technischen Angaben zu Codec, Bitrate, Abtastrate und Abtasttiefe werden zur korrekten Wiedergabe der Datei ben├Âtigt und vermitteln einen ersten Eindruck ├╝ber die Qualit├Ąt der Datei. Angaben zu L├Ąnge, Tonkan├Ąlen und weiteren Inhalten sind zur Pr├╝fung auf Vollst├Ąndigkeit der Datei erforderlich.

Bereits eingebettete Metadaten, wie beispielsweise Exif, oder Bestandteile im Containerformat sollten behalten und archiviert werden. Am besten werden sie in eine eigene Text- oder XML-Datei transferiert und getrennt gespeichert.

Metadatum Beschreibung
Beteiligte Angabe der Beteiligten, wie etwa Autor, Komponist, Interpret, Interviewpartner etc.
L├Ąnge Dauer der Audiodatei. Diese Angaben sollten konform zu ISO 8601 erfolgen. Beispiel: P3Y6M4DT12H30M5S (3 Jahre, 6 Monate, 4 Tage, 12 Stunden, 30 Minuten und 5 Sekunden) oder T2H2M (2 Stunden und 2 Minuten)
Audiocodec Angabe des verwendeten Audiocodecs
Tonkan├Ąle Angabe der Anzahl der Tonspuren und Benennung des Systems, z.B. 5 (Dolby 5.1)
Bitrate Angabe der Datenrate in Bits pro Sekunde, z.B. 666 kbps
Abtastrate Angabe der Abtastrate in Hertz, z.B. 44.1 kHz
Abtasttiefe Angabe der Anzahl der Quantisierungsstufen als Bittiefe, z.B. 16 bit
Weitere Inhalte Angabe ├╝ber weitere Inhalte die in dem Containerformat enthalten sind oder als zus├Ątzliche Datei vorliegen, wie beispielsweise Transkriptionen
Aufnahmeger├Ąt Herstellername und Modell des Aufnahmeger├Ąts (z.B. eines Analog-Digital-Umsetzers oder einer Kamera)
Software Name und Versionsnummer der Software mit der die Audiodatei aufgenommen, erstellt oder bearbeitet wurde, wie z.B. Audacity 2.1.2

Weitere Metadaten sind methodenabh├Ąngig und k├Ânnen in den jeweiligen Abschnitten nachgelesen werden.

Weitere Inhalte

Abtastrate ┬Ě Abtasttiefe ┬Ě Aufnahme ┬Ě Digitalisierung ┬Ě Metadaten ┬Ě┬áQuantisierung ┬Ě Tonkanal ┬Ě Tonsystem ┬Ě Transcodierung ┬Ě Wiedergabeprogramme

Die eigentlichen Audiodaten werden in einem eigenen Format gespeichert, dem sogenannten Codec, welcher wiederum in einem Containerformat eingebettet wird. N├Ąhere Erl├Ąuterungen dazu sind in dem Kapitel Video in den Unterabschnitten Containerformat sowie Codec und Kompression zu finden.

Die Qualit├Ąt einer Audiodatei ist zu einem gro├čen Teil von der Abtastrate und Abtasttiefe abh├Ąngig. Die Anzahl der Tonkan├Ąle und deren Anordnung werden mittels der Angabe des Tonsystems beschrieben, welche notwendig ist, um die Datei korrekt abzuspielen.

Die Datenmenge von Audiodaten ist nicht nur von der Abtastrate und der Abtasttiefe, sondern auch von der Bitrate abh├Ąngig. In dem Kapitel Video wird dieser Begriff in dem Unterabschnitt Datenrate erl├Ąutert.

Abtastrate und Abtasttiefe

Mit analoger Technik kann Ton so aufgenommen werden, wie er physikalisch auftritt, n├Ąmlich als durchg├Ąngige Schallwelle. Um dieses Signal zu digitalisieren muss es in bestimmten Zeitintervallen gemessen und gespeichert werden. Die Zeitintervalle, also die H├Ąufigkeit, in der das Signal gemessen wird, wird als Abtastrate bezeichnet. Je kleiner das Zeitintervall, desto gr├Â├čer die Abtastrate und desto mehr entspricht das digitale Signal dem analogen Signal. Die Abtastrate wird meist in Kilohertz (kHz) angegeben.

Wie genau der gemessene und gespeicherte Wert dann dem urspr├╝nglichen Signal entspricht, h├Ąngt von der Messgenauigkeit ab. Diese Messgenauigkeit wird durch die Anzahl der Bits bestimmt und wird als Abtasttiefe bezeichnet. Sie ist vergleichbar mit der Farbtiefe, die in dem Kapitel ├╝ber Rastergrafiken ab Seite \pageref{RG_Farbtiefe} beschrieben wird. Je gr├Â├čer die Abtasttiefe, desto feiner kann das Signal gemessen werden und die urspr├╝ngliche Tonqualit├Ąt reproduziert werden.

Eine h├Âhere Abtastrate und eine gr├Â├čere Abtasttiefe f├╝hren zu einer originalgetreueren digitalen Repr├Ąsentation des Signals.

Der gemessene Wert des Signals kann zwischen zwei Werten der durch die Messgenauigkeit vorgegebenen Messskala liegen, weshalb dieser auf den n├Ąchstliegenden Wert gerundet werden muss. Dieser Vorgang wird als Quantisierung bezeichnet.

audio_abtastrateAbtasttiefe.png

Die Abtastung und Quantisierung eines Schallsignals. Das Schallsignal (blau) wird in einem vorgegebenen Intervall (senkrechte Linien) gemessen. Der gemessene Wert wird auf den n├Ąchstgelegenen Wert der durch die Abtasttiefe vorgegebenen Skala (horizontale Linien) quantisiert (Kreuze), weshalb die digitale Repr├Ąsentation des Signals leicht abweicht.
Die Abtastung und Quantisierung eines Schallsignals. Das Schallsignal (blau) wird in einem vorgegebenen Intervall (senkrechte Linien) gemessen. Der gemessene Wert wird auf den n├Ąchstgelegenen Wert der durch die Abtasttiefe vorgegebenen Skala (horizontale Linien) quantisiert (Kreuze), weshalb die digitale Repr├Ąsentation des Signals leicht abweicht.

Puls-Code-Modulation (PCM) bezeichnet das Abtasten eines Signals in einer vorgegebenen Abtastrate und die anschlie├čende Quantisierung des gemessenen Wertes. Die lineare Puls-Code-Modulation verwendet dabei einen immer gleich gro├č bleibenden Wertebereich, also immer die gleiche Messskala f├╝r die abgetasteten Werte.

Tonkan├Ąle und Tonsysteme

Bei der Wiedergabe von Audiodateien, beispielsweise ├╝ber Kopfh├Ârer, besteht die M├Âglichkeit T├Âne nur auf einem der beiden H├Ârer auszugeben, um einen r├Ąumlichen Schalleindruck zu erzeugen. Daf├╝r werden technisch die in der Audiodatei gespeicherten Tonkan├Ąle (Tonspuren) verwendet und an die unterschiedlichen Ausgabeger├Ąte geleitet, wie etwa an den linken und den rechten Kopfh├Ârer.

In einer Audiodatei k├Ânnen eine, zwei oder noch mehr Tonspuren enthalten sein. Dabei kann die intendierte Anordnung der Lautsprecher je nach Anzahl der Kan├Ąle variieren. Bei einer Tonspur wird davon ausgegangen, dass sich das Ausgabeger├Ąt vor dem H├Ârer befindet und bei zwei Tonspuren von zwei Ausgabeger├Ąten links und rechts vom H├Ârer. Ab drei Kan├Ąlen sind mehr als zwei Anordnungen m├Âglich, weshalb die Benennung des Tonsystems oder eine Angabe zur Anordnung notwendig wird.

Dieser Abschnitt vereint Hinweise zum Umgang mit Audiodaten. Es gibt Erl├Ąuterungen mit Literatur- und Programmhinweisen ├╝ber die Ansicht und Extraktion von Metadaten, die Aufnahme, die Wiedergabe und die Transcodierung von Audiodateien. F├╝r die Aufnahme und Digitalisierung von Ton werden Mindestanforderungen spezifiziert und Hinweise auf vertiefende Informationen gegeben.

Metadaten

Die technischen Metadaten sind in der Regel in dem Header der Datei gespeichert und k├Ânnen von verschiedenen Programmen ausgelesen werden. Ein Programm, das mit vielen Formaten umgehen kann und auch den Export von Metadaten in eine gesonderte Datei erlaubt ist MediaInfo.

Zu den Exportformaten geh├Âren PBCore und EBUCore. Es handelt sich dabei um Metadatenschemata, die speziell f├╝r Film und Ton von Public Broadcasting in den USA, beziehungsweise von der European Broadcasting Union (EBU) entwickelt wurden. Die Moving Pictures Experts Group (MPEG) hat MPEG-7 f├╝r die Dokumentation von Multimediadateien entwickelt, der insbesondere zur Erweiterung der anderen MPEG-Standards gedacht ist.

F├╝r das Editieren von Metadaten im BWF-Format gibt es das Programm BWF MetaEdit.

Aufnahme und Bearbeitung

audio_audacity.png

Audacity (audacity.org)
Audacity (audacity.org)
F├╝r die Aufnahme und Bearbeitung von Audiodaten kann das kostenlose Programm Audacity verwendet werden. Audacity gibt es f├╝r alle g├Ąngigen Betriebssysteme.

Bei der Aufnahme sollte auf eine angemessene Aufnahmequalit├Ąt geachtet werden. In der Handreichung Empfehlungen zu datentechnischen Standards und Tools bei der Erhebung von Sprachkorpora der DFG werden eine Abtastrate von 22 kHz und eine Abtasttiefe von 16 bit als Mindestanforderungen spezifiziert.┬á Jedoch ist eine h├Âhere Abtastrate von 48 kHz empfehlenswert, da diese eher der Grenzfrequenz des menschlichen Geh├Ârs entspricht, besser w├Ąren sogar 96 kHz. Die Abtastung sollte linear erfolgen.

Welche Abtastrate sich f├╝r die gew├╝nschte Aufnahme am besten eignet, kann mittels der Nyquist-Frequenz ermittelt werden. Die Nyquist-Frequenz besagt, dass das originale Signal exakt reproduziert werden kann, wenn die Abtastrate doppelt so hoch wie die h├Âchste Signalfrequenz ist.

Wiedergabeprogramme

Jedes Betriebssystem hat meist schon ein Programm f├╝r die Wiedergabe von Audiodateien vorinstalliert. Jedoch k├Ânnen diese Programme nur mit einer begrenzten Auswahl von Containerformaten und Codecs umgehen. Codecs k├Ânnen nachtr├Ąglich installiert werden, wobei aber auf Kompatibilit├Ąt mit dem Wiedergabeprogramm geachtet werden muss.

Ein Programm, das mit allen hier vorgestellten Formaten und Codecs umgehen kann, ist der VLC media player. Unter der unscheinbaren Oberfl├Ąche verbirgt sich eine Vielzahl an Funktionalit├Ąten und das Programm gibt es f├╝r alle g├Ąngigen Betriebssysteme.

Transcodierung

F├╝r die Transcodierung, also die Konvertierung von einem Codec in einen weiteren gibt es einige frei verf├╝gbare Programme, wie beispielsweise der bereits genannte VLC media player, der eine leicht verst├Ąndliche grafische Oberfl├Ąche anbietet. F├╝r fortgeschrittene Anwender ist das ebenfalls frei verf├╝gbare FFmpeg zu empfehlen, das komplexere und detailliertere Transcodierungsoptionen erlaubt und auch von der Kommandozeile aus gesteuert werden kann.

Digitalisierung

F├╝r die Digitalisierung von analogem Audiomaterial gibt es von der IASA konkrete Vorgaben, die eine minimale Abtastrate von 48 kHz und eine minimale Abtasttiefe von 24 Bits empfehlen, um eine m├Âglichst hohe Qualit├Ąt des Digitalisats zu gew├Ąhrleisten. Als Formate werden WAVE oder BWF mit linearem PCM vorgegeben. Ausf├╝hrliche Hinweise sind in den Guidelines on the Production and Preservation of Digital Audio Objects (IASA-TC 04) der IASA zu finden.

Es sollte darauf geachtet werden, dass das originale analoge Material weiterhin erhalten bleibt und die Konsultierung eines darauf spezialisierten Archivs oder Dienstleisters ist ratsam.

Archaeology Data Service, Digital Audio: A Guide to Good Practice
http://guides.archaeologydataservice.ac.uk/g2gp/Audio_Toc

W. Bergmeyer, Audio, In: H. Neuroth -- A. O├čwald -- R. Scheffel -- S. Strathmann -- K. Huth (Hrsg.) nestor Handbuch. Eine kleine Enzyklop├Ądie der digitalen Langzeitarchiverung. Version 2.3 (2010) Kap. 17.6
http://www.nestor.sub.uni-goettingen.de/handbuch

V. Ernst -- J. Kepier -- J. Renz -- A. Romeyke -- T. B├Ąhr, Leitfaden f├╝r die digitale Langzeitarchivierung audiovisueller Medien (2016)
http://nbn-resolving.de/urn:nbn:de:0008-2016102107

FADGI (Hrsg.), Guidelines: Embedded Metadata in Broadcast WAVE Files
http://www.digitizationguidelines.gov/guidelines/digitize-embedding.html

IASA (Hrsg.), Guidelines on the Production and Preservation of Digital Audio Objects (IASA-TC 04)
http://www.iasa-web.org/tc04/audio-preservation

JISC (Hrsg.), Infokit: Digital file formats. Audio
http://www.jiscdigitalmedia.ac.uk/infokit/file_formats/digitisation-audio

JISC (Hrsg.), Infokit: Digital file formats. Digital audio formats and compression
http://www.jiscdigitalmedia.ac.uk/infokit/file_formats/digital-audio-for...

Koordinationsstelle f├╝r die dauerhafte Archivierung elektronischer Unterlagen (Hrsg.) Katalog archivischer Dateiformate: Audiodaten
http://kost-ceco.ch/wiki/whelp/KaD/pages/Audio.html

R. Kromer, On Audio-Visual File Formats (Notizen zur Pr├Ąsentation 2015)
http://reto.ch/training/2015/20150424/audio.html

Memoriav (Hrsg.), Memoriav Empfehlungen Ton. Die Erhaltung von Tondokumenten (2014)
http://memoriav.ch/wp-content/uploads/2015/02/Empfehlungen_Ton_de.pdf

Y. Trivedi, HTG Explains: What Are the Differences Between All Those Audio Formats? (2011)
http://www.howtogeek.com/howto/40465/htg-explains-what-are-the-differenc...

Wikipedia Mehrkanal-Tonsystem (deutsch 05. 2016)
https://de.wikipedia.org/wiki/Mehrkanal-Tonsystem

Formatspezifikationen

Tools und Programme

Audio - Diskussion

Haben Sie Anregungen, ├änderungsw├╝nsche oder Erg├Ąnzungen zu dem Kapitel? Dann k├Ânnen Sie diese als Diskussionsbeitrag formulieren. Um die Funktion zu nutzen, ist eine Anmeldung erforderlich.

Bitte geben Sie m├Âglichst genau an, worauf Sie sich beziehen.

Das IANUS-Team pr├╝ft die Diskussionsbetr├Ąge regelm├Ą├čig und arbeitet diese bei Relevanz in die IT-Empfehlungen ein.

 

Letzte Änderung: 13. September 2016