Tabellen

Tabellen werden verwendet, um Informationen strukturiert in Zellen zu speichern, die in Zeilen und Spalten angeordnet sind. Im Gegensatz zu analogen Tabellen bieten digitale Tabellen, die mit entsprechenden Programmen erstellt werden, eine Vielzahl an weiteren Funktionalit├Ąten. Beispielsweise k├Ânnen Zellinhalte nach bestimmten Kriterien sortiert, dynamisch mittels Formeln erzeugt oder Grafiken aus den Daten generiert werden. Um solche und andere Funktionen zu erhalten, erfordert die Speicherung besondere Aufmerksamkeit.

Langzeitformate

F├╝r einfache Tabellen ohne interaktive Elemente wie Formeln oder f├╝r Tabellenkalkulationen bei denen es ausreicht die Ergebnisse der Formeln zu speichern, wird ein textbasiertes Format mit Trennzeichen f├╝r die Archivierung empfohlen.

Dazu eignet sich beispielsweise das CSV-Format, wobei als Trennzeichen ein Komma (,) und als Textbegrenzungszeichen das Anf├╝hrungszeichen ('') verwendet werden sollte, um den Vorgaben von RFC 4180 gerecht zu werden. Andere Trennzeichen und Textbegrenzungszeichen k├Ânnen in begr├╝ndeten Ausnahmef├Ąllen ebenfalls eingesetzt werden und m├╝ssen entsprechend dokumentiert werden. Als Zeichenkodierung sollte UTF-8 ohne BOM verwendet werden.

Ein alternatives textbasiertes Format f├╝r Tabellen ist das TSV-Format, das als Trennzeichen das Tabulator-Zeichen (U+0009) verwendet. Auch TSV-Dateien sollten UTF-8 ohne BOM als Zeichenkodierung verwenden.

Bei Dateien mit mehr als einem Arbeitsblatt (Tabellenkalkulationen), die als CSV- oder TSV-Datei gespeichert werden sollen, muss jedes Arbeitsblatt gesondert gespeichert werden. Dabei gilt f├╝r die Dateinamen der Arbeitsbl├Ątter, dass der Name des Arbeitsblattes an den Namen der Tabellenkalkulation, am besten durch ein Unterstrich (_) getrennt, angef├╝gt wird (z. B. Tabellenname_Blatt1.csv, Tabellenname_Blatt2.csv usw.).

Tabellenkalkulationen, deren zus├Ątzlichen Funktionalit├Ąten erhalten bleiben sollen, werden am besten in einem offenen auf XML basierenden Format gespeichert, wie beispielsweise XLSX oder ODS. Ersteres ist das Standardformat, das in Microsoft Excel seit 2007 verwendet wird und auch von Microsoft entwickelt wurde. Letzteres ist das Format f├╝r Tabellenkalkulationen, welches in OpenOffice oder LibreOffice verwendet wird. ODS ist ein Teil vom OpenDocument Format (ODF) und wurde von einem technischen Komitee unter der Leitung der Organization for the Advancement of Structured Information Standards (OASIS) entwickelt.

Grafiken, die in Tabellenkalkulationen anhand der Daten erstellt wurden, m├╝ssen zus├Ątzlich exportiert und gesondert in einem geeigneten Format gespeichert werden. Dies gilt ebenfalls f├╝r eingebettete Bilder oder andere Medien. Passende Formate sind beispielsweise in dem Abschnitt Rastergrafiken oder in dem Abschnitt Vektorgrafiken zu finden.

Tabellen k├Ânnen auch im XML-Format gespeichert werden. Es gibt eine ganze Reihe an DTDs oder XSDs, die hier als Grundlage dienen k├Ânnen, wie beispielsweise das Schema der TEI, das OASIS Exchange Table Model oder ISO 12083. Auch das Speichern von Tabellen im HTML-Format ist m├Âglich. In jedem Fall muss die zugrundeliegende DTD oder XSD angegeben und gegebenenfalls mit archiviert werden. Die Dateien sollten UTF-8 ohne BOM als Zeichenkodierung verwenden.

Wenn neben den eigentlichen Daten in den einzelnen Zellen auch das Aussehen der Tabelle archiviert werden soll, kann neben einer CSV-, TSV-, XLSX- oder ODS-Datei zus├Ątzlich eine Version der Tabelle im PDF/A-Format gespeichert werden. Bei der Erstellung von Tabellen sollte aber darauf geachtet werden, dass Informationen nicht nur durch Formatierungsangaben, wie beispielsweise die Farbe von Zellen, vermittelt werden, da je nach gew├Ąhltem Format die Formatierungsangaben verloren gehen k├Ânnen.

Hinweis: Obwohl Textverarbeitungsprogramme entsprechende Funktionen bieten, sollten Tabellen auch tats├Ąchlich als Tabellen in einem der hier gelisteten Formate gespeichert werden.
 

Format Begr├╝ndung
  CSV Das textbasierte CSV-Format sollte mit einem Komma als Trennzeichen und mit Anführungszeichen als Textbegrenzungszeichen verwendet werden. Ausnahmen müssen dokumentiert werden. Die Zeichen sollten in UTF-8 ohne BOM kodiert sein.
TSV TSV (MIME-Type text/tab-separated-values) ist ein textbasiertes Format, welches das Tabulator-Zeichen (U+0009) als Trennzeichen verwendet. Die Zeichen sollten in UTF-8 ohne BOM kodiert sein.
ODS ODS basiert auf XML und ist Teil vom OpenDocument Format. Eingebettete Bilder und Medien m├╝ssen gesondert gespeichert werden.
XLSX XLSX ist das auf XML basierende Format von Microsoft. Eingebettete Bilder und Medien m├╝ssen gesondert gespeichert werden.
XML, HTML Tabellen im textbasierten XML- oder HTML-Format k├Ânnen ebenfalls archiviert werden. XML-Dateien ben├Âtigen zus├Ątzlich eine DTD-Datei oder das XML Schema. Die Zeichen sollten in UTF-8 ohne BOM kodiert sein.
┬á PDF/A Wenn neben der Daten auch das Aussehen der Tabelle erhalten bleiben soll, eignet sich PDF/A am besten. Zus├Ątzlich sollten die tabellarischen Daten in einem nachnutzbaren Format, wie etwa CSV, gespeichert werden.
SXC SXC ist ein Vorg├Ąngerformat von ODS, weshalb letzteres auch bevorzugt werden sollte.
┬á XLS Das XLS-Format von Microsoft eignet sich nicht zur Archivierung, da es propriet├Ąr ist und die Inhalte nicht textbasiert gespeichert werden.

Dokumentation

Neben den allgemeinen minimalen Angaben zu Einzeldateien, wie sie in dem Abschnitt Metadaten in der Anwendung gelistet sind, werden f├╝r Tabellen und Tabellenkalkulationen weitere Angaben ben├Âtigt.

Um die Verst├Ąndlichkeit einer Tabelle auch f├╝r Dritte zu gew├Ąhrleisten, m├╝ssen Name und Zweck der jeweiligen Tabelle und der einzelnen Arbeitsbl├Ątter bekannt sein. Jede Spalte ben├Âtigt eine ├ťberschrift, und zus├Ątzlich m├╝ssen die verwendeten Formatvorgaben, Abk├╝rzungen, Codes, Wertelisten und sonstige Terminologien dokumentiert werden. Um leere Zellen auch explizit als solche zu kennzeichnen, sollte ein vorher festgelegtes Zeichen (z.B. -) eingetragen und dokumentiert werden. Wenn Ma├čeinheiten nicht direkt aus der Tabelle ersichtlich sind, m├╝ssen diese ebenfalls gesondert dokumentiert werden.

Um sicher zu gehen, dass die Tabelle auch vollst├Ąndig vorliegt, sollten die Anzahl der Spalten, Zeilen und der Arbeitsbl├Ątter angegeben werden.

Tabellen in textbasierten Formaten brauchen Angaben zu den verwendeten Trennzeichen, Textbegrenzungszeichen und der Zeichenkodierung.

F├╝r Tabellenkalkulationen m├╝ssen bei Bedarf weitere Informationen zu Relationen, Formeln und Makros dokumentiert werden. Eingebettete Medien, wie etwa Bilder, sollten separat gespeichert und archiviert werden und in einer Liste zugeh├Âriger Dateien aufgef├╝hrt werden. Dies gilt ebenfalls f├╝r Grafiken, die aus den Daten in der Tabellenkalkulation erzeugt wurden.

Metadatum Beschreibung
Beschreibung der Tabelle oder des Arbeitsblattes Welchen Zweck verfolgt die Tabelle oder das Arbeitsblatt?
Bezeichnung der Arbeitsbl├Ątter Auflistung der Bezeichnungen der Arbeitsbl├Ątter.
Spalten├╝berschrift Jede Spalte einer Tabelle muss einen Namen haben.
Spaltenbeschreibung Beschreibung und Auflistung der in der jeweiligen Spalte verwendeten Formatvorgaben, Abk├╝rzungen, Codes, Wertelisten, Eingabekonventionen, Fachvokabulare, Zeichen f├╝r leere Zellen oder Ma├čeinheiten.
Anzahl Spalten Wie viele Spalten enth├Ąlt die Tabelle?
Anzahl Zeilen Wie viele Zeilen enth├Ąlt die Tabelle?
Anzahl Arbeitsbl├Ątter Anzahl der Arbeitsbl├Ątter in einer Tabellenkalkulation.
Trennzeichen Angabe des verwendeten Trennzeichens bei textbasierten Speicherformaten wie CSV.
Textbegrenzungszeichen Angabe des verwendeten Textbegrenzungszeichens bei textbasierten Speicherformaten wie CSV.
Zeichenkodierung Angabe der verwendeten Zeichenkodierung bei textbasierten Speicherformaten wie CSV oder TSV.
Relationen Welche Querverweise gibt es innerhalb der Tabellenkalkulation?
Formeln Welche Formeln werden in der Tabellenkalkulation verwendet?
Makros Welche Makros gibt es in der Tabellenkalkulation?
Abgeleitete Grafiken Aus den Daten erzeugte Grafiken m├╝ssen zus├Ątzlich separat gespeichert werden und in der Liste zugeh├Âriger Dateien aufgenommen werden.
Sprache In welchen Sprachen ist das Dokument verfasst? Sprachkennungen nach ISO 639 angeben.
Identifikator Wenn das Dokument bereits ver├Âffentlicht wurde und eine ISBN oder einen anderen persistenten Identifikator erhalten hat, sollte dieser angegeben werden.
Weitere Dateien Liste abgeleiteter Grafiken und eingebetteter Medien, wie Bilder, die zus├Ątzlich separat gespeichert wurden. Liegt eine Dokumentationsdatei f├╝r das Dokument vor, muss diese ebenfalls genannt werden.

Weitere Metadaten sind methodenabh├Ąngig und k├Ânnen in den jeweiligen Abschnitten nachgelesen werden.

Weitere Inhalte

Auszeichnungssprachen ┬Ě Bereinigen von Tabellen ┬Ě CSV- und TSV-Format ┬Ě Grafiken exportieren ┬Ě Tabellenkalkulationen ┬Ě Tabellenkalkulationsprogramme ┬Ě Tabelle als CSV oder TSV speichern

tabelle_web.png

In der Tabelle ist die Spalte B blau markiert. Die Zeile 3 ist gelb markiert. Die gr├╝n hervorgehobene ├ťberschneidung aus der Zeile und der Spalte ist die Zelle B3. Die erste Spalte stellt die Vorspalte und die erste Zeile die Kopfzeile dar.
In der Tabelle ist die Spalte B blau markiert. Die Zeile 3 ist gelb markiert. Die gr├╝n hervorgehobene ├ťberschneidung aus der Zeile und der Spalte ist die Zelle B3. Die erste Spalte stellt die Vorspalte und die erste Zeile die Kopfzeile dar.

Tabellen bestehen in ihrer einfachsten Form aus Zeilen und Spalten, deren ├ťberschneidung eine Zelle bilden, in der ein Wert eingetragen wird. Die Namen der Spalten werden in die erste Zeile, der Kopfzeile (header), eingetragen. In der ersten Spalte, der Vorspalte, k├Ânnen die Zeilenbezeichnungen stehen.

Digitale Tabellen und Tabellenkalkulationen (spreadsheets) bieten erweiterte Funktionalit├Ąten.

F├╝r die Langzeitarchivierung von Tabellen sind strukturierte Textdateien mit Trennzeichen (delimiter separated values), wie CSV- oder TSV-Dateien, gut geeignet. Um Tabellen als XML-Dateien zu speichern, gibt es verschiedene XML Schemata und Dokumenttypdefinitionen.

Tabellenkalkulationen

Als Tabellenkalkulation wird sowohl das Programm, als auch die damit erstellte Datei mit einer oder mehreren Tabellen bezeichnet. Im Folgenden ist die resultierende Datei gemeint.

Eine Tabellenkalkulation kann mehrere Tabellen, sogenannte Arbeitsbl├Ątter (worksheets oder spreadsheets) enthalten. Die Daten selbst k├Ânnen innerhalb der Tabellenkalkulation verwendet werden, um mittels Formeln neue Daten zu erzeugen oder Grafiken zu erstellen. Dazu erlauben die Programme eine Referenzierung auf Werte in anderen Zellen, die sich auch in einem anderen Arbeitsblatt befinden k├Ânnen. Es handelt sich dabei um Relationen.

Die g├Ąngigsten Tabellenkalkulationsprogramme erm├Âglichen die Erstellung und Verwendung von Makros, mit denen typische Befehlsfolgen und Bedienungsschritte aufgezeichnet und automatisiert wiederholt werden k├Ânnen.

Formatierungsangaben k├Ânnen in digitalen Tabellen und Tabellenkalkulationen ebenfalls vorgenommen werden. Dabei k├Ânnen wie in Textdokumenten nicht nur die Schriftart, Schriftgr├Â├če und ├Ąhnliches angepasst werden, sondern auch das Aussehen von Zellen, Zeilen und Spalten mittels Angaben zu Rahmenlinien und Hintergrundfarben. Soll der durch die Formatierungsangaben erzeugte optische Eindruck ebenfalls archiviert werden, weil er f├╝r das Verst├Ąndnis der Tabelle zentrale Informationen transportiert, empfiehlt sich eine zus├Ątzliche Speicherung der Tabellenkalkulation als PDF/A-Dokument.

Strukturierte Textdateien mit Trennzeichen

tabelle_tsv-web.png

Die Tabelle aus der oberen Abbildung im TSV-Format.
Die Tabelle aus der oberen Abbildung im TSV-Format.

Tabellen k├Ânnen in einem textbasierten Format gespeichert werden. Dabei handelt es sich um eine Textdatei, die auf eine bestimmte Weise strukturiert ist. F├╝r Tabellen gibt es insbesondere die Formate CSV (comma-separated values) und TSV (tab-separated values), die sich nur geringf├╝gig voneinander unterscheiden. Textbasierte Formate ber├╝cksichtigen keine Formatierungsangaben, sondern speichern nur die reinen Werte aus jeder Zelle ab.

Jede Zeile einer CSV- oder TSV-Datei entspricht der Zeile einer Tabelle. Die einzelnen Zellen werden durch sogenannte Trennzeichen voneinander getrennt. In TSV-Dateien ist dies das Tabulator-Zeichen (U+0009), welches nach dem Standard der Internet Assigned Numbers Authority (IANA) nicht als Inhalt der Zellen erlaubt ist.

F├╝r CSV-Dateien gibt es mit RFC 4180 bisher nur einen De-facto-Standard, der als Trennzeichen ein Komma (,) vorsieht. Da Kommas innerhalb von Zellen auch als Wert erlaubt werden, sind f├╝r diesen Fall Anf├╝hrungszeichen ('') als Textbegrenzungszeichen vorgesehen, die vor und nach der jeweiligen Zelle eingef├╝gt werden. In der Abbildung unten ist links ein Beispiel einer CSV-Datei zu sehen und rechts daneben wie diese in einem Tabellenkalkulationsprogramm dargestellt wird.

tabelle_csv-web.png

(a) Eine CSV-Datei. In der Spalte 'Gew. (g)' sind die Werte jeweils mit Textbegrenzungszeichen ('') versehen, da innerhalb des Wertes ein Komma verwendet wird. (b) Die CSV-Datei aus a, wie sie in einem Tabellenkalkulationsprogramm dargestellt werden k├Ânnte. Die Tabelle stellt Informationen zu M├╝nzen aus dem M├╝nzkabinett der Staatliche Museen zu Berlin dar.
(a) Eine CSV-Datei. In der Spalte 'Gew. (g)' sind die Werte jeweils mit Textbegrenzungszeichen ('') versehen, da innerhalb des Wertes ein Komma verwendet wird. (b) Die CSV-Datei aus a, wie sie in einem Tabellenkalkulationsprogramm dargestellt werden k├Ânnte. Die Tabelle stellt Informationen zu M├╝nzen aus dem M├╝nzkabinett der Staatliche Museen zu Berlin dar.

F├╝r den Fall, dass das Textbegrenzungszeichen auch innerhalb einer Zelle verwendet werden soll, sieht das RFC 4180 vor, dass dieses gedoppelt wird und die Zelle zus├Ątzlich von den Textbegrenzungszeichen umschlossen wird. Die Abbildung unten verdeutlicht die Verwendung der Textbegrenzungszeichen in den Zellwerten.

tabelle_csv-textbegrenzungszeichen-web.png

(a) Eine CSV-Datei, in der Textbegrenzungszeichen ('') innerhalb der Zellen verwendet werden. (b) Die CSV-Datei aus a, wie sie in einem Tabellenkalkulationsprogramm dargestellt werden k├Ânnte.
(a) Eine CSV-Datei, in der Textbegrenzungszeichen ('') innerhalb der Zellen verwendet werden. (b) Die CSV-Datei aus a, wie sie in einem Tabellenkalkulationsprogramm dargestellt werden k├Ânnte.

In der Praxis werden auch andere Trennzeichen und Textbegrenzungszeichen in CSV-Dateien verwendet. Beispielsweise ist das Trennzeichen in den von Microsoft Excel gespeicherten CSV-Dateien ein Semikolon (;) statt eines Kommas. Diese Abweichungen von der Empfehlung des RFC 4180 m├╝ssen in den Metadaten angegeben werden. Au├čerdem ist zu beachten, dass die Verwendung von mehreren verschiedenen Trennzeichen oder Textbegrenzungszeichen in einer Datei nicht erlaubt ist.

Das Speichern von Tabellen in strukturierten Textdateien bringt einige Einschr├Ąnkungen mit sich. Es k├Ânnen keine Formatierungsangaben oder Makros gespeichert werden. Im Gegensatz zu einer Tabellenkalkutalion, wo bei Formeln sowohl die Formel als auch deren Ergebnis gespeichert ist, kann in textbasierten Tabellenformaten entweder nur die Formel selbst oder das Ergebnis gespeichert werden.

Weiterhin ist es nicht m├Âglich verbundene Zellen zu speichern. Bei verbundenen Zellen handelt es sich im Prinzip um einen visuellen Effekt, bei dem eine Zelle die anderen Zellen ├╝berdeckt. Dementsprechend wird in einem textbasierten Format der Wert aus den verbundenen Zellen in die erste Zelle aus der Gruppe geschrieben, w├Ąhrend die ├╝brigen Zellen leer bleiben. Wird die so gespeicherte Tabelle sp├Ąter wieder ge├Âffnet, ist der visuelle Effekt der verbundenen Zellen nicht mehr sichtbar, was die Abbildung unten verdeutlicht.

tabelle_verbundeneZellen-web.png

(a) Eine Tabelle mit verbundenen Zellen in einem Tabellenkalkulationsprogramm. (b) Die Tabelle aus a im CSV-Format. Der Wert aus den verbundenen Zellen steht in der ersten der vorher verbundenen Zellen. (c) Wird die CSV-Tabelle aus b wieder in einem Tabellenkalkulationsprogramm ge├Âffnet, werden die Zellen auch nicht mehr als verbunden angezeigt.
(a) Eine Tabelle mit verbundenen Zellen in einem Tabellenkalkulationsprogramm. (b) Die Tabelle aus a im CSV-Format. Der Wert aus den verbundenen Zellen steht in der ersten der vorher verbundenen Zellen. (c) Wird die CSV-Tabelle aus b wieder in einem Tabellenkalkulationsprogramm ge├Âffnet, werden die Zellen auch nicht mehr als verbunden angezeigt.

Tabellen mit Auszeichnungssprachen

Tabellen k├Ânnen auch als Textdatei mit Auszeichnungssprachen wie XML oder HTML gespeichert werden. Allgemeine Eigenschaften von Auszeichnungssprachen werden in dem Kapitel Textdokumente in dem Abschnitt Auszeichnungssprachen beschrieben.

Vom Prinzip her sind Tabellen mit Auszeichnungssprachen ebenfalls strukturierte Textdateien, die aber weitere Angabem├Âglichkeiten beispielsweise f├╝r Metadaten oder verbundene Zellen bieten.

F├╝r das XML-Format gibt es das OASIS Exchange Table Model (DTD) oder das von der TEI speziell f├╝r die Geistes-, Sozial- und Sprachwissenschaften entwickelte XSD-Schema. Ersteres stammt von dem Tabellenmodell CALS ab, welches von dem US-Verteidigungsministerium entwickelt wurde.

Speziell f├╝r SGML gibt es den Standard ISO 12083, der entwickelt wurde, um Publikationen auszuzeichnen.

Auch HTML und TeX stellen f├╝r die Eingabe von Tabellen jeweils eine spezielle Syntax zur Verf├╝gung, was die Abbildung unten veranschaulicht.

tabelle_divers-web.png

Eine Tabelle (a), wie sie in TeX (b), mit XML (c) und in HTML (d) dargestellt werden k├Ânnte.
Eine Tabelle (a), wie sie in TeX (b), mit XML (c) und in HTML (d) dargestellt werden k├Ânnte.

Wichtig f├╝r die Archivierung von Tabellen mit Auszeichnungssprachen ist, dass alle Dateien wohlgeformt und valide sind, also die Regeln der jeweiligen Auszeichnungssprache und deren Grammatik einhalten. Die jeweils verwendeten DTD- oder XSD-Dateien m├╝ssen in jedem Fall angegeben werden und gegebenfalls mit archiviert werden. Die Dateien selbst sollten UTF-8 ohne BOM als Zeichenkodierung verwenden.

 

Dieser Abschnitt liefert Hinweise zum Umgang mit Tabellen und Tabellenkalkulationen in der Praxis und stellt Tabellenkalkulationsprogramme vor. Es wird erl├Ąutert, wie Tabellen als CSV- oder TSV-Datei gespeichert und wie Grafiken aus Tabellenkalkulationen exportiert werden k├Ânnen. F├╝r die Bereinigung von Tabellen wird eine automatisierte L├Âsung vorgeschlagen.

Tabellenkalkulationsprogramme

F├╝r die Bearbeitung von Tabellen und Tabellenkalkulationen gibt es dezidierte Tabellenkalkulationsprogramme, wie OpenOffice Calc, LibreOffice Calc oder Microsoft Excel. OpenOffice und LibreOffice speichern Tabellenkalkulationen standardm├Ą├čig im ODS-Format. Seit 2007 speichert Microsoft Word im XLSX-Format. Beide Formate sind offen dokumentiert, basieren auf XML und sind f├╝r die Langzeitarchivierung geeignet.

Aus den Daten erzeugte Grafiken, eingebettete Bilder oder andere Medien sollten zus├Ątzlich als separate Dateien in einem geeigneten Langzeitformat gespeichert werden. Dies stellt sicher, dass die Qualit├Ąt der urspr├╝nglichen Datei erhalten bleibt, automatisch erzeugte Grafiken nicht verloren gehen und wie urspr├╝nglich intendiert aussehen.

Die Darstellung von Tabellenkalkulationen mit umfangreichen Formatierungsangaben kann auf verschiedenen Computern unterschiedlich ausfallen, was vor allem an unterschiedlichen Einstellungen liegt. Wenn bestimmte Schriftarten auf einem System fehlen, werden sie automatisch ersetzt, was ebenfalls zu unterschiedlichen Darstellungsweisen f├╝hrt. Wenn eine stabile system├╝bergreifende Darstellung von Tabellenkalkulationen gew├╝nscht ist, kann dies nur mittels Konvertierung in ein PDF-Dokument gew├Ąhrleistet werden. F├╝r die Langzeitspeicherung sollte PDF/A verwendet werden. Hinweise zum Erstellen von PDF- und PDF/A-Dokumenten sind im Praxisteil zu PDF-Dokumenten zu finden.

Tabellen als CSV- oder TSV-Dateien speichern

Alle g├Ąngigen Tabellenkalkulationsprogramme bieten Exportfunktionen zur Speicherung von Tabellen als CSV- oder TSV-Dateien. Dabei ist zu beachten, dass jeweils nur das aktuell gew├Ąhlte Arbeitsblatt gespeichert wird und Formatierungsangaben und Makros nicht gespeichert werden. Bei den Formeln wird ├╝blicherweise nur der Ergebniswert gespeichert, wenn keine andere Einstellung vorgenommen wird.

Eine TSV-Datei kann in Microsoft Excel ├╝ber "Datei > Speichern unter" mit dem Dateityp "Text (Tabstopp-getrennt) (*.txt)" erzeugt werden. Die Datei wird als TXT-Datei gespeichert, erf├╝llt jedoch alle Anforderungen an eine TSV-Datei.

F├╝r das CSV-Format bietet Microsoft Excel ├╝ber "Datei > Speichern unter" gleich mehrere Optionen, von denen "CSV (Trennzeichen-getrennt) (*.csv)" verwendet werden sollte, da "CSV (Macintosh) (*.csv)" und "CSV (MS-DOS) (*.csv)" andere problembehaftete Zeichenkodierungen verwenden, die f├╝r ├Ąltere Systeme gedacht waren. Die von Microsoft Excel erzeugten CSV-Dateien werden standardm├Ą├čig mit einem Semikolon (;) als Trennzeichen und Anf├╝hrungszeichen (") als Textbegrenzungszeichen gespeichert. Da abweichend von den Vorgaben des RFC 4180 als Trennzeichen ein Komma und kein Semikolon verwendet wird, ist in diesem Fall die Angabe des Trennzeichens in den Metadaten notwendig.

Microsoft Excel verwendet ANSI f├╝r die Zeichenkodierung der Dateien, weshalb dies nachtr├Ąglich auf UTF-8 ohne BOM angepasst werden muss. Im Kapitel "Textdokumente" sind im Abschnitt "Einstellen der Zeichenkodierung" n├Ąhere Erl├Ąuterung dazu zu finden. Dieser Schritt sollte allerdings erst dann erfolgen, wenn die Tabellen nicht mehr mit Excel bearbeitet werden sollen, weil das Programm nicht mit UTF-8 kodierten Dateien umgehen kann und daher die Zeichen nicht richtig darstellt.

tabelle_calcCSV.png

Der Dialog \"Textexport\" in LibreOffice Calc zur Speicherung von CSV-Dateien.
Der Dialog "Textexport" in LibreOffice Calc zur Speicherung von CSV-Dateien.

Wesentlich komfortabler und flexibler ist die Erstellung von CSV-Dateien mit LibreOffice Calc oder OpenOffice Calc. ├ťber "Datei > Speichern unter" wird der Dateityp "Text CSV (.csv) (*.csv)" angeboten. Wird bei der Option "Filtereinstellungen bearbeiten" ein Haken gesetzt, erscheint bei dem Klick auf "Speichern" der Dialog "Textexport" (nebenstehende Abbildung), in dem die Zeichenkodierung bei "Zeichensatz", das Trennzeichen bei "Feldtrenner" und das Textbegrenzungszeichen bei "Texttrenner" ausgew├Ąhlt werden k├Ânnen.

Mit der Option "Zellinhalt wie angezeigt speichern" wird der Inhalt der Zellen in der CSV-Datei so gespeichert, wie sie zu sehen sind. Wird die Option nicht ausgew├Ąhlt, werden beispielsweise die W├Ąhrungssymbole, die mittels Angaben f├╝r die Zellformatierung automatisch eingef├╝gt wurden, nicht gespeichert. Die Option "Formeln anstatt berechneter Werten speichern" erm├Âglicht die Speicherung der eingegebenen Formeln anstatt der Werte.

TSV-Dateien werden in LibreOffice Calc oder OpenOffice Calc zun├Ąchst als CSV-Datei angelegt, wobei als Feldtrenner {Tabulator} gew├Ąhlt wird. Um zu verdeutlichen, dass es sich um eine TSV-Datei und nicht um eine CSV-Datei handelt, sollte die Dateiendung nachtr├Ąglich manuell ge├Ąndert werden.

Grafiken exportieren

Grafiken, die in Tabellenkalkulationsprogrammen mittels der eingetragenen Daten erzeugt wurden, m├╝ssen f├╝r die Archivierung der Tabelle zus├Ątzlich als gesonderte Bilddatei in einem geeigneten Format gespeichert werden. Passende Formate sind in den Kapiteln "Rastergrafiken" und "Vektorgrafiken" beschrieben.

Der Export von Grafiken funktioniert bei LibreOffice Calc mit einem Klick mit der rechten Maustaste auf die Grafik. In dem erscheinenden Men├╝ gibt es den Eintrag "Als Bild exportieren". Es erscheint ein Speicherdialog f├╝r die Grafik in dem verschiedene Formate zur Auswahl stehen. Wird die Grafik als Rastergrafik gespeichert, muss vorher auf eine geeignete Gr├Â├če der Grafik geachtet werden, indem sie beispielsweise vorher in der Tabellenkalkulation vergr├Â├čert wird.

Eine alternative Exportmethode, die auch in OpenOffice Calc und Microsoft Excel funktioniert, ist das Zwischenspeichern der Grafik und anschlie├čende Speichern in einem dezidierten Grafikprogramm. Die Grafik kann in dem Grafikprogramm bearbeitet und angepasst werden, bevor sie gespeichert wird. Auch hier muss beim Speichern auf eine geeignete Gr├Â├če des Bildes geachtet werden.

Die oben beschriebenen Schritte m├╝ssen f├╝r alle Grafiken in der Tabellenkalkulation wiederholt werden, was bei Tabellenkalkulationen mit vielen Grafiken ein langwieriger Vorgang sein kann. F├╝r diesen Fall bietet sich die Option an, die gesamte Tabellenkalkulation mittels "Datei > Speichern unter" als HTML-Datei ("Webseite" oder "HTML-Dokument") in einem gesonderten Ordner zu speichern. In dem Ordner werden alle Grafiken als PNG- oder JPG-Datei abgelegt. Bei dieser Exportvariante ist zu beachten, dass die erzeugten Einzelbilder eventuell M├Ąngel in der Qualit├Ąt aufweisen.

Bereinigung von Tabellen

Bei Tabellen, die ├╝ber einen l├Ąngeren Zeitraum von mehreren Bearbeitern gepflegt werden, k├Ânnen trotz festgelegter Vorgaben Inkonsistenzen auftreten. Solche Inkonsistenzen k├Ânnen beispielsweise darin bestehen, dass f├╝r die Materialbeschreibung mal "Silber" und mal "Ag" verwendet wird. Bei einer automatisierten statistischen Auswertung k├Ânnte das zu Verzerrungen f├╝hren. F├╝r solche F├Ąlle kann das frei verf├╝gbare Programm OpenRefine verwendet werden. Es erm├Âglicht die Aufdeckung und Bereinigung von Inkonsistenzen in Tabellen. Dar├╝ber hinaus bietet es Funktionen, um die Daten zus├Ątzlich ├╝ber Transformationen oder durch externe Webinhalte anzureichern.

Archaeology Data Service, Databases and Spreadsheets: A Guide to Good Practice
http://guides.archaeologydataservice.ac.uk/g2gp/DbSht_Toc

T. Hicks, Should We Be Using ISO 12083?, The Journal of Electronic Publishing 3, 1998, 4
http://quod.lib.umich.edu/j/jep/3336451.0003.407?view=text;rgn=main

Research Data Management Service Group, Preparing tabular data for description and archiving
http://data.research.cornell.edu/content/tabular-data
 

Formatspezifikationen

Tools und Programme

Tabellen - Diskussion

Haben Sie Anregungen, ├änderungsw├╝nsche oder Erg├Ąnzungen zu dem Kapitel? Dann k├Ânnen Sie diese als Diskussionsbeitrag formulieren. Um die Funktion zu nutzen, ist eine Anmeldung erforderlich.

Bitte geben Sie m├Âglichst genau an, worauf Sie sich beziehen.

Das IANUS-Team pr├╝ft die Diskussionsbetr├Ąge regelm├Ą├čig und arbeitet diese bei Relevanz in die IT-Empfehlungen ein.

 

Letzte Änderung: 4. April 2016