Tabellen - Praxis

Dieser Abschnitt liefert Hinweise zum Umgang mit Tabellen und Tabellenkalkulationen in der Praxis und stellt Tabellenkalkulationsprogramme vor. Es wird erl├Ąutert, wie Tabellen als CSV- oder TSV-Datei gespeichert und wie Grafiken aus Tabellenkalkulationen exportiert werden k├Ânnen. F├╝r die Bereinigung von Tabellen wird eine automatisierte L├Âsung vorgeschlagen.

Tabellenkalkulationsprogramme

F├╝r die Bearbeitung von Tabellen und Tabellenkalkulationen gibt es dezidierte Tabellenkalkulationsprogramme, wie OpenOffice Calc, LibreOffice Calc oder Microsoft Excel. OpenOffice und LibreOffice speichern Tabellenkalkulationen standardm├Ą├čig im ODS-Format. Seit 2007 speichert Microsoft Word im XLSX-Format. Beide Formate sind offen dokumentiert, basieren auf XML und sind f├╝r die Langzeitarchivierung geeignet.

Aus den Daten erzeugte Grafiken, eingebettete Bilder oder andere Medien sollten zus├Ątzlich als separate Dateien in einem geeigneten Langzeitformat gespeichert werden. Dies stellt sicher, dass die Qualit├Ąt der urspr├╝nglichen Datei erhalten bleibt, automatisch erzeugte Grafiken nicht verloren gehen und wie urspr├╝nglich intendiert aussehen.

Die Darstellung von Tabellenkalkulationen mit umfangreichen Formatierungsangaben kann auf verschiedenen Computern unterschiedlich ausfallen, was vor allem an unterschiedlichen Einstellungen liegt. Wenn bestimmte Schriftarten auf einem System fehlen, werden sie automatisch ersetzt, was ebenfalls zu unterschiedlichen Darstellungsweisen f├╝hrt. Wenn eine stabile system├╝bergreifende Darstellung von Tabellenkalkulationen gew├╝nscht ist, kann dies nur mittels Konvertierung in ein PDF-Dokument gew├Ąhrleistet werden. F├╝r die Langzeitspeicherung sollte PDF/A verwendet werden. Hinweise zum Erstellen von PDF- und PDF/A-Dokumenten sind im Praxisteil zu PDF-Dokumenten zu finden.

Tabellen als CSV- oder TSV-Dateien speichern

Alle g├Ąngigen Tabellenkalkulationsprogramme bieten Exportfunktionen zur Speicherung von Tabellen als CSV- oder TSV-Dateien. Dabei ist zu beachten, dass jeweils nur das aktuell gew├Ąhlte Arbeitsblatt gespeichert wird und Formatierungsangaben und Makros nicht gespeichert werden. Bei den Formeln wird ├╝blicherweise nur der Ergebniswert gespeichert, wenn keine andere Einstellung vorgenommen wird.

Eine TSV-Datei kann in Microsoft Excel ├╝ber "Datei > Speichern unter" mit dem Dateityp "Text (Tabstopp-getrennt) (*.txt)" erzeugt werden. Die Datei wird als TXT-Datei gespeichert, erf├╝llt jedoch alle Anforderungen an eine TSV-Datei.

F├╝r das CSV-Format bietet Microsoft Excel ├╝ber "Datei > Speichern unter" gleich mehrere Optionen, von denen "CSV (Trennzeichen-getrennt) (*.csv)" verwendet werden sollte, da "CSV (Macintosh) (*.csv)" und "CSV (MS-DOS) (*.csv)" andere problembehaftete Zeichenkodierungen verwenden, die f├╝r ├Ąltere Systeme gedacht waren. Die von Microsoft Excel erzeugten CSV-Dateien werden standardm├Ą├čig mit einem Semikolon (;) als Trennzeichen und Anf├╝hrungszeichen (") als Textbegrenzungszeichen gespeichert. Da abweichend von den Vorgaben des RFC 4180 als Trennzeichen ein Komma und kein Semikolon verwendet wird, ist in diesem Fall die Angabe des Trennzeichens in den Metadaten notwendig.

Microsoft Excel verwendet ANSI f├╝r die Zeichenkodierung der Dateien, weshalb dies nachtr├Ąglich auf UTF-8 ohne BOM angepasst werden muss. Im Kapitel "Textdokumente" sind im Abschnitt "Einstellen der Zeichenkodierung" n├Ąhere Erl├Ąuterung dazu zu finden. Dieser Schritt sollte allerdings erst dann erfolgen, wenn die Tabellen nicht mehr mit Excel bearbeitet werden sollen, weil das Programm nicht mit UTF-8 kodierten Dateien umgehen kann und daher die Zeichen nicht richtig darstellt.

tabelle_calcCSV.png

Der Dialog \"Textexport\" in LibreOffice Calc zur Speicherung von CSV-Dateien.
Der Dialog "Textexport" in LibreOffice Calc zur Speicherung von CSV-Dateien.

Wesentlich komfortabler und flexibler ist die Erstellung von CSV-Dateien mit LibreOffice Calc oder OpenOffice Calc. ├ťber "Datei > Speichern unter" wird der Dateityp "Text CSV (.csv) (*.csv)" angeboten. Wird bei der Option "Filtereinstellungen bearbeiten" ein Haken gesetzt, erscheint bei dem Klick auf "Speichern" der Dialog "Textexport" (nebenstehende Abbildung), in dem die Zeichenkodierung bei "Zeichensatz", das Trennzeichen bei "Feldtrenner" und das Textbegrenzungszeichen bei "Texttrenner" ausgew├Ąhlt werden k├Ânnen.

Mit der Option "Zellinhalt wie angezeigt speichern" wird der Inhalt der Zellen in der CSV-Datei so gespeichert, wie sie zu sehen sind. Wird die Option nicht ausgew├Ąhlt, werden beispielsweise die W├Ąhrungssymbole, die mittels Angaben f├╝r die Zellformatierung automatisch eingef├╝gt wurden, nicht gespeichert. Die Option "Formeln anstatt berechneter Werten speichern" erm├Âglicht die Speicherung der eingegebenen Formeln anstatt der Werte.

TSV-Dateien werden in LibreOffice Calc oder OpenOffice Calc zun├Ąchst als CSV-Datei angelegt, wobei als Feldtrenner {Tabulator} gew├Ąhlt wird. Um zu verdeutlichen, dass es sich um eine TSV-Datei und nicht um eine CSV-Datei handelt, sollte die Dateiendung nachtr├Ąglich manuell ge├Ąndert werden.

Grafiken exportieren

Grafiken, die in Tabellenkalkulationsprogrammen mittels der eingetragenen Daten erzeugt wurden, m├╝ssen f├╝r die Archivierung der Tabelle zus├Ątzlich als gesonderte Bilddatei in einem geeigneten Format gespeichert werden. Passende Formate sind in den Kapiteln "Rastergrafiken" und "Vektorgrafiken" beschrieben.

Der Export von Grafiken funktioniert bei LibreOffice Calc mit einem Klick mit der rechten Maustaste auf die Grafik. In dem erscheinenden Men├╝ gibt es den Eintrag "Als Bild exportieren". Es erscheint ein Speicherdialog f├╝r die Grafik in dem verschiedene Formate zur Auswahl stehen. Wird die Grafik als Rastergrafik gespeichert, muss vorher auf eine geeignete Gr├Â├če der Grafik geachtet werden, indem sie beispielsweise vorher in der Tabellenkalkulation vergr├Â├čert wird.

Eine alternative Exportmethode, die auch in OpenOffice Calc und Microsoft Excel funktioniert, ist das Zwischenspeichern der Grafik und anschlie├čende Speichern in einem dezidierten Grafikprogramm. Die Grafik kann in dem Grafikprogramm bearbeitet und angepasst werden, bevor sie gespeichert wird. Auch hier muss beim Speichern auf eine geeignete Gr├Â├če des Bildes geachtet werden.

Die oben beschriebenen Schritte m├╝ssen f├╝r alle Grafiken in der Tabellenkalkulation wiederholt werden, was bei Tabellenkalkulationen mit vielen Grafiken ein langwieriger Vorgang sein kann. F├╝r diesen Fall bietet sich die Option an, die gesamte Tabellenkalkulation mittels "Datei > Speichern unter" als HTML-Datei ("Webseite" oder "HTML-Dokument") in einem gesonderten Ordner zu speichern. In dem Ordner werden alle Grafiken als PNG- oder JPG-Datei abgelegt. Bei dieser Exportvariante ist zu beachten, dass die erzeugten Einzelbilder eventuell M├Ąngel in der Qualit├Ąt aufweisen.

Bereinigung von Tabellen

Bei Tabellen, die ├╝ber einen l├Ąngeren Zeitraum von mehreren Bearbeitern gepflegt werden, k├Ânnen trotz festgelegter Vorgaben Inkonsistenzen auftreten. Solche Inkonsistenzen k├Ânnen beispielsweise darin bestehen, dass f├╝r die Materialbeschreibung mal "Silber" und mal "Ag" verwendet wird. Bei einer automatisierten statistischen Auswertung k├Ânnte das zu Verzerrungen f├╝hren. F├╝r solche F├Ąlle kann das frei verf├╝gbare Programm OpenRefine verwendet werden. Es erm├Âglicht die Aufdeckung und Bereinigung von Inkonsistenzen in Tabellen. Dar├╝ber hinaus bietet es Funktionen, um die Daten zus├Ątzlich ├╝ber Transformationen oder durch externe Webinhalte anzureichern.

Letzte Änderung: 10. Dezember 2015