Webseiten - Praxis

In diesem Abschnitt werden Programme und Editoren vorgestellt, um eine Webseite zu bearbeiten.  Neben einer allgemeinen Übersicht der Archivierungsmöglichkeiten, wird auf die verschiedene Möglichkeiten eingegangen, um Webseiten als PDF, MHTML, MAFF oder HTML mit Data-URIs zu archivieren. Auch Archivierungsmöglichkeiten fĂŒr gesamte Websites werden vorgestellt, sowie einige Hinweise zu Screenshots gegeben. Zahlreiche Hinweise finden sich auch im Praxisabschnitt des Kapitels Textdokumente.

Editoren

Um HTMl, CSS und JavaScript Dateien von Webseiten zu bearbeiten, wird ein Texteditor benötigt. Eine ausfĂŒhrliche Übersicht bietet der Abschnitt Praxis im Kapitel Textdokumente. ZusĂ€tzlich zu den dort besprochenen Editoren existieren spezielle Editoren fĂŒr das Webdesign, unter UmstĂ€nden mit WYSIWYG-Modi, bzw. mĂ€chtige Code-Editoren, die umfangreiche Möglichkeiten zur Codeerstellung bieten, jedoch oftmals auch das nötige Hintergrundwissen hinsichtlich der verwendeten Sprache und deren Syntax verlangen. Ein Beispiel fĂŒr einen WYSIWYG-Editor ist Adobe Muse CC, Beispiele fĂŒr professionelle Code-Editoren sind Adobe Dreamweaver CC und Sublime Text von Jon Skinner wobei es sich jeweils um proprietĂ€re Softwarelösungen handelt. Die Systeme von Adobe sind fĂŒr Windows und Mac OS verfĂŒgbar, Sublime Text zusĂ€tzlich fĂŒr Linux.

Frei verfĂŒgbare Alternativen stellen Aptana Studio, SeaMonkey und  BlueGriffon dar, die alle fĂŒr Windows, Mac OS und Linux verfĂŒgbar sind. Aptana Studio bietet Werkzeuge zur Erstellung von HTML, CSS und JavaScript. SeaMonkey und BlueGriffon haben einen WYSIWYG-Editor.

Archivierungsmethoden

Die Archivierung einer Webseite wird schnell und einfach durch ihre Konvertierung in eine PDF-Datei und anschließende Speicherung als PDF/A-Datei bewerkstelligt. Sie kann auf unterschiedliche Weise mittels des Webbrowsers, durch eigene Online-Konvertierungsdienste oder spezielle Softwareprogramme erfolgen.

Alternativ kann eine Speicherung und Archivierung der Webseite als HTML-Datei mit Data URIs, MHTML-Datei oder MAFF-Container vorgenommen werden. Hierbei ist zu beachten, dass nicht alle Webbrowser alle Formate unterstĂŒtzen bzw. ein vorhergehendes Entpacken der komprimierten Webseite nötig ist. Eine Übersicht der unterstĂŒtzten Formate fĂŒr aktuelle Webbrowser ist in den folgenden Tabellen gegeben.

Webbrowser Data-URI MAFF MHTML PDF
Chrome (54.0.x) ✓ (✓)* ✓ ✓
Edge ✓ (✓)* ✕ ✓
Firefox (49.0.x) ✓ ✓ (✓)** ✓
Internet Explorer (11.x) ✓ (✓)* ✓ ✓
Opera (40.0.x) ✓ (✓)* ✓ ✓
Safari (10.0.x) ✓ (✓)* (✓)** ✓
Vivaldi (1.4.x) ✓ (✓)* ✓ ✓
*vorheriges Entpacken **PlugIn benötigt
Webbrowser Data-URI MAFF MHTML PDF
Chrome (54.0.x) (✓)* (✓)* ✓** ✓
Firefox (49.0.x) ✕ ✓ ✓* ✓
Internet Explorer (11.x) ✕ ✕ ✓ ✓
Opera (40.0.x) ✕* ✕ ✓ ✓
Safari (10.0.x) ✕ ✕ ✕ ✓
Vivaldi (1.4.x) ✕ ✕ ✓** ✓
*PlugIn benötigt **MHTML muss aktiviert werden

Eine weitere Methode stellt die Archivierung der Webseite durch spezielle Archivierungsdienste (z.B. Internet Archive https://archive.org/web/) dar.

Allen Methoden ist gemein, dass sie fĂŒr gewöhnlich keine multimedialen (und extern von anderen Webseiten) eingebundene Inhalte (Video, 3D-Modelle) in die PDF-Datei integrieren. Derartige Inhalte mĂŒssen in der Regel separat archiviert werden.

Archivierung als PDF

Jeder Webbrowser ermöglicht das Ausdrucken einer Webseite, durch Verwendung eines PDF-Druckers. Anschließend  kann das PDF in PDF/A konvertiert werden. NĂ€here Informationen zur Generierung von PDF-Dateien findet sich im Praxisteil des Kapitels PDF-Dokumente.

Diese Methode stellt sicher, dass alle Informationen der angezeigten Webseite (exklusive multimedialer Inhalte, etwa Videos oder eingebettete 3D-Modelle) gespeichert und anschließend archiviert werden kann. Je nach Webseite, Webbrowser und PDF-Drucker variiert das Ergebnis jedoch hinsichtlich der Übernahme des Layouts. Meist können direkt im Browser oder in den Einstellungen des PDF-Generators fĂŒr den Ausdruck typische Parameter konfiguriert werden: Druck der gesamten Webseite oder eines Auszugs, definiert durch die Seitenzahlen, Hoch- oder Querformat, Druck in Farbe oder Graustufen/Schwarz-Weiß, Papierformat, SeitenrĂ€nder, Auflösung, Hintergrundgrafiken, Kopf- und Fußzeilen (diese enthalten in der Regel das Datum des Ausdrucks und die URI der ausgedruckten Webseite). EingeschrĂ€nkte Formatierungen können besonders durch die Anpassung der RĂ€nder, des verwendeten Papierformats und dessen Orientierung vorgenommen werden.

Spezielle Plug-Ins fĂŒr Webbrowser ermöglichen es, die Webseite auch unter Beibehaltung des Layouts als PDF-Datei zu speichern. Sie bieten oftmals umfangreiche Optionen hinsichtlich der gewĂŒnschten PDF-Datei, so z.B. die Speicherung als ein langes, durchgehendes Dokument im Format der Webseite, was die Adaptierung der Webseite auf ein bestimmtes Format (z.B. A4) und die damit verbundene Aufsplittung der Webseite in ein mehrseitiges PDF-Dokument obsolet macht. Anschließend kann diese wieder in eine PDF/A konvertiert werden. Je nach verwendetem Webbrowser und Plug-in sowie besuchter Webseite können die Ergebnisse zwischen Original und Kopie variieren. Den PDF-Dateien werden zudem meistens Angaben zum verwendeten Plug-in in Form eines Wasserzeichens hinzugefĂŒgt. Derzeit aktuelle Plug-ins sind etwa "Firefox Web2PDF Converter", "Save as PDF" sowie "FireShot". Das Angebot an solchen Plug-ins ist sehr vielfĂ€ltig, umfangreich und schnelllebig; diese und weitere Plug-ins können von den jeweiligen auf Webbrowsererweiterungen spezialisierten Onlinestores der einzelnen Anbieter bezogen werden.

Eine weitere Möglichkeit bietet die Konvertierung einer Webseite durch einen Online-Konvertierungsdienst, etwa Web2PDF. Nach der Eingabe der URI der zu konvertierenden Webseite wird ein PDF-Dokument generiert und zum Download angeboten. Je nach Webseite und Konvertierungsdienst können die Ergebnisse zwischen Original und Kopie variieren. Den PDF-Dateien werden zudem meistens Angaben zum verwendeten Plug-in in Form eines Wasserzeichens hinzugefĂŒgt. Im Anschluss an den Download kann die PDF-Datei zu einer PDF/A-Datei konvertiert und archiviert werden.

web_pdf.png

Das Glossar der IT-Empfehlungen als Screenshot (links), als mit dem Browser erzeugte PDF-Datei (mitte) und als mittels dem "`Save as PDF"'-Plug-in erzeugtes PDF (rechts).
Das Glossar der IT-Empfehlungen als Screenshot (links), als mit dem Browser erzeugte PDF-Datei (mitte) und als mittels dem "`Save as PDF"'-Plug-in erzeugtes PDF (rechts).

Spezielle (kommerzielle) Programme wie die Literaturverwaltungssoftware Citavi beherrschen ebenso das Speichern von Webseiten unter Beibehaltung des Layouts als PDF. Auch bietet etwa Adobe Acrobat Pro DC eine Option zur Konvertierung von Webseiten in ein PDF-Dokument.

Archivierung als MHTML

web_vivaldi.png

Einstellungen im Webbrowser Vivaldi
Einstellungen im Webbrowser Vivaldi
MHTML-Dateien können mit Webbrowsern erstellt und geöffnet werden. Auch mit Texteditoren können MHTML-Dateien angesehen werden. Jedoch benötigen Firefox und Safari noch ein Plug-in. Bei den Webbrowsern Chrome und Vivaldi muss zuvor MHTML in den experimentellen Funktionen aktiviert werden: Bei Chrome wird hierfĂŒr chrome://flags/, bei Vivaldi vivaldi://flags in die Adresszeile eingegeben und die entsprechende Funktion aktiviert. Ein Neustart des Webbrowsers wird danach benötigt. Im Head der MHTML-Dateien können Metadaten mittels eines Texteditors eingetragen werden. Der Inhalt wie auch das Layout und alle Hyperlinks werden bei MHTML-Dateien in der Regel vollstĂ€ndig ĂŒbernommen.

web_mhtml.png

Der Quellcode einer MHTML-Datei. Rechts ist der Code einer eingebetteten Grafik zu sehen.
Der Quellcode einer MHTML-Datei. Rechts ist der Code einer eingebetteten Grafik zu sehen.

Archivierung als MAFF-Datei

Die Speicherung einer Webseite als MAFF-Datei wird derzeit nur von Mozilla Firefox mittels des Plug-ins "Mozilla Archive Format, with MHT and Faithful Save" unterstĂŒtzt. MAFF-Dateien können nur von Mozilla Firefox mit diesem Plug-in geöffnet werden. Alle weiteren, aktuellen Webbrowsern können MAFF_Dateien öffnen, indem sie mittels eines Datenkompressionsprogramms entpackt werden.

Archivierung als HTML mit Data-URI

Alle aktuellen Webbrowser können HTML-Dateien mit Data-URIs öffnen. Derzeit beherrscht nur der Webbrowser Google Chrome die Speicherung von Webseiten als HTML-Dateien mit Data-URIs mittels des Plug-ins "`SingleFile"'. Eine alte Version des gleichen Plug-ins existiert auch fĂŒr frĂŒhere Versionen des Webbrowsers Opera.  Im Head der HTML-Dateien mit Data-URLs können Metadaten mittels eines Texteditors eingetragen werden. Der Inhalt wie auch das Layout und alle Hyperlinks werden bei HTML-Dateien mit Data-URIs in der Regel vollstĂ€ndig ĂŒbernommen.

web_datauri.png

Links der Quellcode einer HTML-Datei mit Data-URIs. Rechts die Darstellung im Browser. Eindeutig erkennbar ist die vollstĂ€ndige Übernahme des Inhalts samt der Hyperlinks sowie die vollstĂ€ndige Übernahme des Designs. Der blau unterstrichene Codeblock ist eine Data-URI eines Bildes.
Links der Quellcode einer HTML-Datei mit Data-URIs. Rechts die Darstellung im Browser. Eindeutig erkennbar ist die vollstĂ€ndige Übernahme des Inhalts samt der Hyperlinks sowie die vollstĂ€ndige Übernahme des Designs. Der blau unterstrichene Codeblock ist eine Data-URI eines Bildes.

Archivierung von Websites

web_wayback.png

Screenshot der Webseite von IANUS in Google Chrome im Vollbild (oben) und ein Abbild der Webseite auf Internet Archive. Eindeutig erkennbar ist die vollstĂ€ndige Übernahme des Inhalts samt der Hyperlinks sowie die vollstĂ€ndige Übernahme des Designs.
Screenshot der Webseite von IANUS in Google Chrome im Vollbild (oben) und ein Abbild der Webseite auf Internet Archive. Eindeutig erkennbar ist die vollstĂ€ndige Übernahme des Inhalts samt der Hyperlinks sowie die vollstĂ€ndige Übernahme des Designs.
Webseiten können durch Websitearchivierungsdienste archiviert werden, wie sie durch die Bayerische Landesbibliothek (auf Antrag) oder Internet Archive angeboten werden. Dabei erfolgt die Speicherung einer Webseite auf einem Server dieser Dienste und kann ĂŒber das Internet abgerufen werden. Man gibt dazu die URI der zu archivierenden Seite  bei dem Archivierungsdienst an und wird kurz darauf auf die archivierte Seite unter einer neuen URI weitergeleitet. Es kann sowohl die einzelne Webseite als auch die gesamte (oder ein Großteil) der gesamten Website archiviert werden. Metadaten mĂŒssen separat z.B. in Form einer XML-Datei, die auch den Link zur archivierten Seite enthĂ€lt, gespeichert werden. Da Websitearchivierungsdienste wie Internet Archive das WWW auch selbststĂ€ndig durchsuchen und Websites archivieren, kann die zu archivierende Webseite bereits auf dieser Plattform gesichert worden sein. Dies wird durch die Archivierungsdienste jedoch gesondert ausgewiesen und hindert nicht daran, die Webseite zusĂ€tzlich ein weiteres Mal zu archivieren. Plug-ins wie "`Archiveror"' fĂŒr Google Chrome oder Mozilla Firefox ermöglichen die Archivierung einer Webseite direkt aus dem Browser heraus auf Internet Archive.

Dezidierte Softwarelösungen wie Wget oder Heritrix ermöglichen den automatisierten Abruf aller zu einer Website gehörenden Komponente. Sie wurden primĂ€r fĂŒr Linux entwickelt, können aber auch auf anderen Betriebssystemen verwendet werden. Beide sind frei verfĂŒgbar und können die gefundenen Ressourcen als WARC-Datei speichern.

Screenshots von Webseiten

Die Speicherung von Webseiten in der Form von Screenshots ist nicht fĂŒr die Archivierung geeignet, ist aber ein gutes Hilfsmittel, um das ursprĂŒngliche Aussehen der Webseite zu dokumentieren. Screenshots können mit Hilfe der Screenshot-Funktion des Computers, spezieller Screenshot Software (z.B. Microsofts Snipping Tool) oder durch eigene, auf die Verarbeitung von Webseiten spezialisierte Plug-ins fĂŒr Webbrowser erzeugt werden. WĂ€hrend fĂŒr gewöhnlich mit der Screenshot Funktion des Computers der gesamte Bildschirm bzw. aktive Fenster und mit Screenshot Softwarelösunge zusĂ€tzlich einzelne Bildauschnitte als Grafiken gespeichert werden können, fertigen erwĂ€hnte Plug-ins einen Screenshot der gesamten Webseite oder eines ausgewĂ€hlten Teiles davon an. Screenshots werden durch die erwĂ€hnten Funktionen und Programme in der Regel im PNG- oder JPEG-Format gespeichert.

Letzte Änderung: 26. Januar 2017