Tabellen - Vertiefung

tabelle_web.png

In der Tabelle ist die Spalte B blau markiert. Die Zeile 3 ist gelb markiert. Die gr├╝n hervorgehobene ├ťberschneidung aus der Zeile und der Spalte ist die Zelle B3. Die erste Spalte stellt die Vorspalte und die erste Zeile die Kopfzeile dar.
In der Tabelle ist die Spalte B blau markiert. Die Zeile 3 ist gelb markiert. Die gr├╝n hervorgehobene ├ťberschneidung aus der Zeile und der Spalte ist die Zelle B3. Die erste Spalte stellt die Vorspalte und die erste Zeile die Kopfzeile dar.

Tabellen bestehen in ihrer einfachsten Form aus Zeilen und Spalten, deren ├ťberschneidung eine Zelle bilden, in der ein Wert eingetragen wird. Die Namen der Spalten werden in die erste Zeile, der Kopfzeile (header), eingetragen. In der ersten Spalte, der Vorspalte, k├Ânnen die Zeilenbezeichnungen stehen.

Digitale Tabellen und Tabellenkalkulationen (spreadsheets) bieten erweiterte Funktionalit├Ąten.

F├╝r die Langzeitarchivierung von Tabellen sind strukturierte Textdateien mit Trennzeichen (delimiter separated values), wie CSV- oder TSV-Dateien, gut geeignet. Um Tabellen als XML-Dateien zu speichern, gibt es verschiedene XML Schemata und Dokumenttypdefinitionen.

Tabellenkalkulationen

Als Tabellenkalkulation wird sowohl das Programm, als auch die damit erstellte Datei mit einer oder mehreren Tabellen bezeichnet. Im Folgenden ist die resultierende Datei gemeint.

Eine Tabellenkalkulation kann mehrere Tabellen, sogenannte Arbeitsbl├Ątter (worksheets oder spreadsheets) enthalten. Die Daten selbst k├Ânnen innerhalb der Tabellenkalkulation verwendet werden, um mittels Formeln neue Daten zu erzeugen oder Grafiken zu erstellen. Dazu erlauben die Programme eine Referenzierung auf Werte in anderen Zellen, die sich auch in einem anderen Arbeitsblatt befinden k├Ânnen. Es handelt sich dabei um Relationen.

Die g├Ąngigsten Tabellenkalkulationsprogramme erm├Âglichen die Erstellung und Verwendung von Makros, mit denen typische Befehlsfolgen und Bedienungsschritte aufgezeichnet und automatisiert wiederholt werden k├Ânnen.

Formatierungsangaben k├Ânnen in digitalen Tabellen und Tabellenkalkulationen ebenfalls vorgenommen werden. Dabei k├Ânnen wie in Textdokumenten nicht nur die Schriftart, Schriftgr├Â├če und ├Ąhnliches angepasst werden, sondern auch das Aussehen von Zellen, Zeilen und Spalten mittels Angaben zu Rahmenlinien und Hintergrundfarben. Soll der durch die Formatierungsangaben erzeugte optische Eindruck ebenfalls archiviert werden, weil er f├╝r das Verst├Ąndnis der Tabelle zentrale Informationen transportiert, empfiehlt sich eine zus├Ątzliche Speicherung der Tabellenkalkulation als PDF/A-Dokument.

Strukturierte Textdateien mit Trennzeichen

tabelle_tsv-web.png

Die Tabelle aus der oberen Abbildung im TSV-Format.
Die Tabelle aus der oberen Abbildung im TSV-Format.

Tabellen k├Ânnen in einem textbasierten Format gespeichert werden. Dabei handelt es sich um eine Textdatei, die auf eine bestimmte Weise strukturiert ist. F├╝r Tabellen gibt es insbesondere die Formate CSV (comma-separated values) und TSV (tab-separated values), die sich nur geringf├╝gig voneinander unterscheiden. Textbasierte Formate ber├╝cksichtigen keine Formatierungsangaben, sondern speichern nur die reinen Werte aus jeder Zelle ab.

Jede Zeile einer CSV- oder TSV-Datei entspricht der Zeile einer Tabelle. Die einzelnen Zellen werden durch sogenannte Trennzeichen voneinander getrennt. In TSV-Dateien ist dies das Tabulator-Zeichen (U+0009), welches nach dem Standard der Internet Assigned Numbers Authority (IANA) nicht als Inhalt der Zellen erlaubt ist.

F├╝r CSV-Dateien gibt es mit RFC 4180 bisher nur einen De-facto-Standard, der als Trennzeichen ein Komma (,) vorsieht. Da Kommas innerhalb von Zellen auch als Wert erlaubt werden, sind f├╝r diesen Fall Anf├╝hrungszeichen ('') als Textbegrenzungszeichen vorgesehen, die vor und nach der jeweiligen Zelle eingef├╝gt werden. In der Abbildung unten ist links ein Beispiel einer CSV-Datei zu sehen und rechts daneben wie diese in einem Tabellenkalkulationsprogramm dargestellt wird.

tabelle_csv-web.png

(a) Eine CSV-Datei. In der Spalte 'Gew. (g)' sind die Werte jeweils mit Textbegrenzungszeichen ('') versehen, da innerhalb des Wertes ein Komma verwendet wird. (b) Die CSV-Datei aus a, wie sie in einem Tabellenkalkulationsprogramm dargestellt werden k├Ânnte. Die Tabelle stellt Informationen zu M├╝nzen aus dem M├╝nzkabinett der Staatliche Museen zu Berlin dar.
(a) Eine CSV-Datei. In der Spalte 'Gew. (g)' sind die Werte jeweils mit Textbegrenzungszeichen ('') versehen, da innerhalb des Wertes ein Komma verwendet wird. (b) Die CSV-Datei aus a, wie sie in einem Tabellenkalkulationsprogramm dargestellt werden k├Ânnte. Die Tabelle stellt Informationen zu M├╝nzen aus dem M├╝nzkabinett der Staatliche Museen zu Berlin dar.

F├╝r den Fall, dass das Textbegrenzungszeichen auch innerhalb einer Zelle verwendet werden soll, sieht das RFC 4180 vor, dass dieses gedoppelt wird und die Zelle zus├Ątzlich von den Textbegrenzungszeichen umschlossen wird. Die Abbildung unten verdeutlicht die Verwendung der Textbegrenzungszeichen in den Zellwerten.

tabelle_csv-textbegrenzungszeichen-web.png

(a) Eine CSV-Datei, in der Textbegrenzungszeichen ('') innerhalb der Zellen verwendet werden. (b) Die CSV-Datei aus a, wie sie in einem Tabellenkalkulationsprogramm dargestellt werden k├Ânnte.
(a) Eine CSV-Datei, in der Textbegrenzungszeichen ('') innerhalb der Zellen verwendet werden. (b) Die CSV-Datei aus a, wie sie in einem Tabellenkalkulationsprogramm dargestellt werden k├Ânnte.

In der Praxis werden auch andere Trennzeichen und Textbegrenzungszeichen in CSV-Dateien verwendet. Beispielsweise ist das Trennzeichen in den von Microsoft Excel gespeicherten CSV-Dateien ein Semikolon (;) statt eines Kommas. Diese Abweichungen von der Empfehlung des RFC 4180 m├╝ssen in den Metadaten angegeben werden. Au├čerdem ist zu beachten, dass die Verwendung von mehreren verschiedenen Trennzeichen oder Textbegrenzungszeichen in einer Datei nicht erlaubt ist.

Das Speichern von Tabellen in strukturierten Textdateien bringt einige Einschr├Ąnkungen mit sich. Es k├Ânnen keine Formatierungsangaben oder Makros gespeichert werden. Im Gegensatz zu einer Tabellenkalkutalion, wo bei Formeln sowohl die Formel als auch deren Ergebnis gespeichert ist, kann in textbasierten Tabellenformaten entweder nur die Formel selbst oder das Ergebnis gespeichert werden.

Weiterhin ist es nicht m├Âglich verbundene Zellen zu speichern. Bei verbundenen Zellen handelt es sich im Prinzip um einen visuellen Effekt, bei dem eine Zelle die anderen Zellen ├╝berdeckt. Dementsprechend wird in einem textbasierten Format der Wert aus den verbundenen Zellen in die erste Zelle aus der Gruppe geschrieben, w├Ąhrend die ├╝brigen Zellen leer bleiben. Wird die so gespeicherte Tabelle sp├Ąter wieder ge├Âffnet, ist der visuelle Effekt der verbundenen Zellen nicht mehr sichtbar, was die Abbildung unten verdeutlicht.

tabelle_verbundeneZellen-web.png

(a) Eine Tabelle mit verbundenen Zellen in einem Tabellenkalkulationsprogramm. (b) Die Tabelle aus a im CSV-Format. Der Wert aus den verbundenen Zellen steht in der ersten der vorher verbundenen Zellen. (c) Wird die CSV-Tabelle aus b wieder in einem Tabellenkalkulationsprogramm ge├Âffnet, werden die Zellen auch nicht mehr als verbunden angezeigt.
(a) Eine Tabelle mit verbundenen Zellen in einem Tabellenkalkulationsprogramm. (b) Die Tabelle aus a im CSV-Format. Der Wert aus den verbundenen Zellen steht in der ersten der vorher verbundenen Zellen. (c) Wird die CSV-Tabelle aus b wieder in einem Tabellenkalkulationsprogramm ge├Âffnet, werden die Zellen auch nicht mehr als verbunden angezeigt.

Tabellen mit Auszeichnungssprachen

Tabellen k├Ânnen auch als Textdatei mit Auszeichnungssprachen wie XML oder HTML gespeichert werden. Allgemeine Eigenschaften von Auszeichnungssprachen werden in dem Kapitel Textdokumente in dem Abschnitt Auszeichnungssprachen beschrieben.

Vom Prinzip her sind Tabellen mit Auszeichnungssprachen ebenfalls strukturierte Textdateien, die aber weitere Angabem├Âglichkeiten beispielsweise f├╝r Metadaten oder verbundene Zellen bieten.

F├╝r das XML-Format gibt es das OASIS Exchange Table Model (DTD) oder das von der TEI speziell f├╝r die Geistes-, Sozial- und Sprachwissenschaften entwickelte XSD-Schema. Ersteres stammt von dem Tabellenmodell CALS ab, welches von dem US-Verteidigungsministerium entwickelt wurde.

Speziell f├╝r SGML gibt es den Standard ISO 12083, der entwickelt wurde, um Publikationen auszuzeichnen.

Auch HTML und TeX stellen f├╝r die Eingabe von Tabellen jeweils eine spezielle Syntax zur Verf├╝gung, was die Abbildung unten veranschaulicht.

tabelle_divers-web.png

Eine Tabelle (a), wie sie in TeX (b), mit XML (c) und in HTML (d) dargestellt werden k├Ânnte.
Eine Tabelle (a), wie sie in TeX (b), mit XML (c) und in HTML (d) dargestellt werden k├Ânnte.

Wichtig f├╝r die Archivierung von Tabellen mit Auszeichnungssprachen ist, dass alle Dateien wohlgeformt und valide sind, also die Regeln der jeweiligen Auszeichnungssprache und deren Grammatik einhalten. Die jeweils verwendeten DTD- oder XSD-Dateien m├╝ssen in jedem Fall angegeben werden und gegebenfalls mit archiviert werden. Die Dateien selbst sollten UTF-8 ohne BOM als Zeichenkodierung verwenden.

 

Letzte Änderung: 9. August 2017