Peter Diepold und Christian Richter

"Meta-Tags"

Hilfe zum Auffinden von Web-Seiten

Im Web Veröffentlichen. Das World Wide Web als interaktives Massenmedium bietet Lehrern und Schülergruppen die Möglichkeit, eigene Arbeiten - Projektberichte, Unterrichtsmaterialien, Lernprogramme, Bilder, Audiovisuelles Material - über das Internet anderen zugänglich zu machen. Beispiele solcher Veröffentlichungen finden sich in zunehmender Zahl auf dem SchulWeb (www.schulweb.de) und dem Deutschen Bildungs-Server (dbs.schule.de). Es ist faszinierend zu sehen, mit welcher Kreativität und oft sogar schon Professionalität solche Veröffentlichungen gestaltet sind, seien es Schülerzeitungen, Projektergebnisse oder Web-Seiten, die auf Japanisch, Russisch, Arabisch, Türkisch oder Chinesisch über die Schule berichten.

Informationsflut. Web-Seiten ins Internet stellen ist eine Sache, gelesen werden eine ganz andere. Wenn inzwischen an die 100 Millionen Computerbegeisterte mit dem Internet verbunden sind, von denen nicht wenige nicht nur surfen, sondern sich aktiv mit eigenen Beiträgen beteiligen, dann steigt die Flut der Web-Dokumente bald ins Unermeßliche. Die Gefahr besteht, daß der eigene Beitrag im Meer der Informationen untergeht.

Such-Maschinen. Die großen Suchmaschinen wie Lycos, Yahoo u.a. durchstreifen ohne Unterlaß diese Informationsflut, suchen Titel und Texte und stellen systematisch Verweise auf. Wenn jemand Material zu einem bestimmten Thema sucht, liefern ihm die search engines die entsprechenden Verweise. Allerdings kann man mit unspezifischen Anfragen wenig erreichen, denn wer will schon Hunderte oder Tausende von Verweisen (URLs) überprüfen, bis er die entscheidenden Dokumente gefunden hat, die er eigentlich sucht? Es ist so, als ob man in einer großen Bibliothek alle Bücher durchblättert auf der Suche nach den zwei oder drei entscheidenden Büchern.

Bibliographische Hilfen. Für Bücher gibt es Kataloge und Bibliographien; das sind Sammlungen von Informationen über Literatur, kurz: Meta-Informationen: Autor, Titel, Erscheinungsort, Jahr, Verlag, einige wichtige Schlagworte, oft auch eine kurze Zusammenfassung (Referat, abstract). Wenn man sich dieser bibliographischen Hilfen bedient - wie sie z.B. für den Bereich pädagogischer Literatur seit einigen Jahren die CD-ROM "Fachinformation (FIS) Bildung" mit ca. 300 Tsd. Titeln enthält -, kann man schnell und gezielt - z.B. in einer Kombination mehrerer Merkmale - die gesuchte Literatur finden.

Meta-Informationen. Ein ähnliches System ist für multimediale Dokumente denkbar. So baut der Deutsche Bildungs-Server eine spezielle Datenbank mit Meta-Informationen auf, die z.B. für Internet-Projekte oder multimediale Unterrichtsmaterialien im Netz Recherchen nach Kriterien wie Schulart, Schulfach, Schulstufe, Themen usw. ermöglicht und - über die URL - direkt auf die Ressourcen verweist.

Meta-Tags. In der HTML-Sprache (hypertext markup language), in der Web-Dokumente verfaßt sind, besteht die Möglichkeit, solche Meta-Informationen getrennt vom Textteil ("body") in einem besonderen Teil, dem "head" unterzubringen und sie als besondere Informationen mit dem Stichwort "Meta" zu kennzeichnen. Diese Informationen werden nicht am Bildschirm angezeigt, wenn ein solches Dokument durch einen Browser wie Netscape Navigator oder Internet Explorer dargestellt werden; sie können jedoch durch den Befehl "view source" oder mit einem Texteditor sichtbar gemacht werden:



<HEAD>
<TITLE>Botanik: Mikroskopie</TITLE>
<META NAME="GENERATOR" CONTENT="Internet Assistant for Word 1.0Z">
<META NAME="AUTHOR" CONTENT="Peter v. Sengbusch">
</HEAD>


Beispiel: HEAD der Seite http://www.rrz.uni-hamburg.de/~biologie/b_online/t03/03.htm

Harvest. Spezielle Suchprogramme, wie das freie Programm Harvest ("Ernte"), können diese Informationen von verschiedenen Servern einsammeln, strukturieren und in einer Datenbank für die gezielte Suche nutzen. Dieses Programm benutzt auch der Deutsche Bildungs-Server und sammelt auf diese Weise regelmäßig Informationen über Dokumente aus dem Bildungsbereich, wie sie auf den Bildungsservern der Länder und der Schulbuchverlage im Netz angeboten werden.

Dublin Core. Es ist sicher sinnvoll, wenn man sich über die Art und Weise einigt, in der solche Meta-Informationen mit Meta-Tags dargestellt werden. Ein solcher Vorschlag, der vor etwa zwei Jahren in Dublin, Ohio (USA) von einer Gruppe von Informationswissenschaftlern, Bibliothekaren und Dokumentaren gemacht wurde und sich zu einer Norm entwickelt hat, nach der an vielen Stellen verfahren wird (so auch im DBS), ist der sog. "Dublin Core".

Der Dublin Core sieht 15 Elemente vor, die als Bezeichner von Metatags verwendet werden können:
TITLE Titel, Name des Dokuments oder der Ressource
CREATOR Autor, Verfasser, Urheber
SUBJECT Thema, inhaltliche Bezüge, Schlagwörter
DESCRIPTION kurze Inhaltswiedergabe, Beschreibung
PUBLISHER Verlag, Herausgeber, veröffentlichende Institution
CONTRIBUTORS Sonstige an der Erstellung und Veröffentlichung beteiligte Personen
DATE Datum der Erstellung, der letzten Änderung oder der Begrenzung der Gültigkeit
TYPE Zuordnung zu einer bestimmten Klasse, einem bestimmten Genre
FORMAT Dateiformat, entsprechend dem MIME-Standard
IDENTIFIER weltweit eindeutige Kennzeichnung, z.B. URL oder ISBN
SOURCE bei nichtorginären Beiträgen die Quelle bzw. das Original
LANGUAGE Sprache, in der das Dokument vorliegt
RELATION Einordnung in andere Dokumente oder Zuordnung zu anderen Ressourcen
COVERAGE Räumliche und zeitliche Zuordnung
RIGHTS Verweis auf die Nutzungsbedingungen entsprechend dem Urheberrecht

Allgemein haben Metatags in HTML-Dokumenten folgende Syntax:

<META NAME="Feldbezeichner" CONTENT="Feldinhalt"> 

Bei Tags, die dem Dublin Core entsprechen, beginnt der Feldbezeichner mit "DC.". Zur genaueren Spezifizierung kann an den Feldbezeichner gegebenenfalls ein "subelement" angehängt werden:

<META NAME="Feldbezeichner.Subelement"
      CONTENT="(Scheme=Kodierungsschema) Feldinhalt"> 

Werden Scheme oder Subelement nicht deklariert, werden die im Dublin Core definierten default qualifiers verwendet (siehe http://www.roads.lut.ac.uk/Metadata/DC-Qualifiers.html und http://www.loc.gov/marc/dcqualif.html ).

DBS-Metatags. Der DBS benutzt einen eigenen Satz von Metatags, um Metainformationen aus HTML-Dokumenten zu gewinnen. Er enthält neben Elementen des Dublin Core weitere Elemente, die einigen spezifischen Erfordernissen eines Bildungsservers Rechnung tragen. Der oben schon als Beispiel herangezogenen Web-Seite http://www.rrz.uni-hamburg.de/~biologie/b_online/t03/03.htm könnten die folgenden Metatags hinzugefügt werden:

<META NAME="DC.Title" CONTENT="Botanik: Mikroskopie  "> 
Titel des Dokuments. Soll der Titel auch im Fensterkopf des Browsers erscheinen ist die zusätzliche Verwendung des TITLE-Tags nötig:
<TITLE>Botanik: Mikroskopie</TITLE>
<META NAME="DC.Creator" CONTENT="Peter v. Sengbusch "> 
Der Autor des Dokumentes. Genauere Angaben zu Autor müssen durch entsprechende subelements bezeichnet werden, z.B.:
<META NAME="DC.Creator.CorporateName.Address" 
      CONTENT="b-online@botanik.uni-hamburg.de "> 
Wenn das Feld ausdrücklich nur den Namen des Autors enthalten soll, kann man dies auch durch ein Subelement ausdrücken:
<META NAME="DC.Creator.PersonalName" 
      CONTENT="Peter v. Sengbusch "> 
<META NAME="DC.Subject.Keywords" CONTENT="Botanik ">
<META NAME="DC.Subject.Keywords" CONTENT="Mikroskopie "> 
<META NAME="DC.Subject.Keywords" CONTENT="Mikrophotographie ">
<META NAME="DC.Subject.Keywords" CONTENT="Präparationstechniken ">
Schlagworte, (fakultativ). Für den Harvester des DBS ist die kommaseparierte Form gleichwertig:
<META NAME="DC.Subject.Keywords" CONTENT="Botanik, Mikroskopie, 
      Mikrophotographie, Präparationstechniken ">
<META NAME="DC.Relation.Requires" CONTENT="WWW-Browser "> 
Technische Anforderungen für die Nutzung der Ressource (fakultativ).
<META NAME="DBS.Publisher.UseRestrictionsAndCost" 
      CONTENT="Frei über das WWW abrufbar. Für die Verwendung im 
      Unterricht oder zur Unterrichtsvorbereitung unentgeltlich. "> 
Bezugsbedingungen, (fakultativ). An dieser Stelle können alle für die Nutzung der Ressource wichtigen Konditionen eingetragen werden, die im Tag DC.Rights nicht geregelt sind, z.B. das Nutzungsentgelt.
<META NAME="DBS.Subject.SubjectAreaOfInstruction" CONTENT="Biologie / 
      Biologisches Grundpraktikum / Untersuchungstechniken und ökologische 
      Bezüge / Mathematisch-naturwissenschaftlicher Kurs Physik / Optische 
      Geräte "> 
(Schul-)Fach/Sachgebiet, Lehrplaneinheit, Thema. An dieser Stelle sind auch Mehrfachnennungen möglich. Es ist sinnvoll, wie in diesem Beispiel, die fachliche Zuordnung auf verschiedenen Allgemeinheitsstufen vorzunehmen, damit die Ressource gefunden wird, wenn allgemein nach Materialien für das Fach Biologie gesucht wird, aber auch wenn speziell nach Untersuchungstechniken gesucht wird.
<META NAME="DBS.Subject.UserLevel" CONTENT="Sekundarstufe I / Sekundarstufe II "> 
Schulstufe ( Kindergarten, Grundschule, Sekundarstufe I, Sekundarstufe II, Hochschule, Berufsbildung, Erwachsenenbildung).
<META NAME="DC.Description" CONTENT="(Scheme=Freetext) 
      Nach einem kurzen Überblick zur Geschichte der Mikroskopie wird in die 
      verschiedenen Verfahren der Mikroskopie eingeführt. Viele instruktive 
      Abbildungen unterstützten das Verständnis der physikalisch-
      technischen Grundlagen. Wer sich tiefer in das Thema einarbeiten will, 
      findet zahlreiche Literaturhinweise. ">
Kurzbeschreibung. Die Kurzbeschreibung darf bis zu 510 Zeichen lang sein. Das entspricht ca. 8 Zeilen á 60 Zeichen. Diese Beschränkung gilt für die Ressourcendatenbank des DBS. Für die verschiedenen Indexdienste, deren Robots die Metatags ebenfalls auswerten, gelten jeweils eigene Obergrenzen.
<META NAME="DC.Description" CONTENT="(Scheme=URL)     "> 
URL einer weiteren Beschreibung, (fakultativ). Wenn man die Kurzbeschreibung durch eine Version ergänzen möchte, oder eine im WWW erreichbare weitere Beschreibung der Ressource kennt, kann man an dieser Stelle einen entsprechenden Verweis eintragen. Es darf nur eine gültige URL pro DC.Description-Metatag eingetragen werden.
<META NAME="DC.Date.Created" CONTENT="(Scheme=ISO.31-1:1992) 1996-07-02">
Erstellungsdatum, (fakultativ)
<META NAME="DC.Date.Modified" CONTENT="(Scheme=ISO.31-1:1992) 1996-07-11"> 
Datum der letzten Änderung, (fakultativ)
<META NAME="DC.Date.Valid" CONTENT="(Scheme=ISO.31-1:1992) 2001-07-01"> 
Verfallsdatum, (fakultativ). Für dieses Beispiel wurde willkürlich ein Datum festgelegt.
<META NAME="DC.Type" CONTENT="(Scheme=Freetext) Lehr-Lernmittel/
      Aufgabensammlung "> 
Ressourcenkategorie (Antrag, Anleitung/Manual, Artikel/Aufsatz/Bericht/Thesenpapier, Biographie, Gesetz/Verordnung/Konvention/Vertrag, Gutachten, Illustration/Veranschaulichung, Index/Katalog/Datenbank/Bibliographie, Kurs/Onlinekurs/Virtuelles Seminar, Lehr-Lernmittel/Aufgabensammlung, Lyrik/Belletristik/Bildende Kunst, Monographie/Buch/Dissertation, Nachschlagewerk, Periodikum/Zeitschrift, Plan/Planung, Produktinformation/Werbung, Projekt, Sammlung/Sammelband, Stellungnahme/Kommentar). Das Dokument sollte einer der genannten Kategorien zugeordnet werden.
<META NAME="DC.Format" CONTENT="(Scheme=IMT) text/html "> 
Ressourcenformat (entsprechend dem MIME-Standard application, audio, image, multipart, text, video - jeweils ergänzt durch "/" und das konkrete Dateiformat also z.B.: text/html, image/gif, application/compressed-zip, video/mpeg).
<META NAME="DBS.Format.PhysicalMedium" CONTENT="Internet "> 
Physisches Medium, auf dem die Ressource erhältlich ist (AudioCD, Audiokasssette, CD-ROM, Datendiskette, Printmedium, Internet, Videokassette).
<META NAME="DC.Identifier" CONTENT="(Scheme=URL) 
     http://www.rrz.uni-hamburg.de/~biologie/b_online/t03/03.htm "> 
URL, über die die Ressource im Netz aufgerufen werden kann.
<META NAME="DC.Source" CONTENT="  "> 
Quelle, aus der die Ressource ursprünglich stammt, (fakultativ)
<META NAME="DC.Language" CONTENT="(Scheme=Freetext) deutsch "> 
Sprache, in der die Ressource geschrieben ist. Für den DBS die Sprache bitte wie oben angeben. Für internationale Suchmaschinen kann man zusätzlich ein anderes Kodierungsschema wählen:
<META NAME="DC.Language" CONTENT="(Scheme=Z39.53) GER "> 
<META NAME="DC.Relation.IsPartOf" CONTENT="(Scheme=URL) 
    http://www.rrz.uni-hamburg.de/~biologie/b_online/inhalt.htm "> 
Zugehörigkeit zu einer umfassenderen Ressource, (fakultativ). Das voreingestellte Kodierungsschema ist URL. Es darf nur eine gültige URL pro DC.Relation.IsPartOf-Metatag eingetragen werden.
<META NAME="DC.Rights" CONTENT="(Scheme=URL) 
    http://www.rrz.uni-hamburg.de/~biologie/b_online/copyrig.htm "> 
URL eines Copyrightvermerks, (fakultativ). Da das gleiche Copyright oft auf mehrere Dokumente anwendbar ist, ist es üblich, die Copyrightbestimmungen in einer separaten Datei zu halten, auf die dann von mehreren Dokumenten verwiesen wird. Der DBS erwartet, daß der DC.Rights-Metatag das Kodierungsschema URL hat. Wer das Copyright auch direkt im Dokument vermerken will, kann den entsprechenden Metatag mit dem Kodierungsschema Freetext hinzufügen:
<META NAME="DC.Rights" CONTENT="(Scheme=Freetext) Das Werk Botanik online 
    einschließlich aller seiner Teile ist urheberrechtlich geschützt. 
    Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes 
    ohne Zustimmung von Botanik online ist unzulässig.
    Das gilt insbesondere für Vervielfältigungen, Übersetzungen und die 
    Einspeicherung und Verarbeitung in Datenverarbeitungssystemen zwecks 
    kommerzieller Nutzung. Bei Kopien für nichtkommerzielle Zwecke ist 
    diese Copyright-Notiz der Kopie anzufügen.

    P. v. Sengbusch / 5-7-96 / b-online@botanik.uni-hamburg.de "> 


Meta-Tags: "Werbung" für die eigenen Web-Seiten. Was nutzt es, wenn man einen Projektbericht, eine interessante Lernsoftware, eine Multi-Media-Show über die eigene Schule auf einen Server bringt, aber keiner nimmt davon Kenntnis? Autoren möchten, daß ihre Arbeiten auch zur Kenntnis genommen, gelesen und benutzt werden. Wenn sie Meta-Tags benutzen, werden ihre Web-Dokumente leichter und gezielter von den Such-Maschinen auffindbar; dies wird in Zukunft immer wichtiger werden.

Meta-Tag-Formular. Den Deutschen Bildungs-Server erreichen täglich Bitten von Lehrern oder Teams, mit einem "Link" im DBS auf ihr Web-Dokument zu verweisen. Das tun wir gern, denn unsere Hauptaufgabe ist es ja gerade, strukturierte Informationen über solche Ressourcen zu vermitteln. Wir bitten die Autoren in diesem Falle regelmäßig, spezifische Informationen über ihr Angebot auf einem Bildschirm-Formular einzutragen. Diese Meta-Informationen werden dann nach der formalen und inhaltlichen Prüfung in die Datenbank des DBS übernommen und sind dort - und auf den Landesservern, mit denen der DBS kooperiert - recherchierbar.


Eintrag von Metainformationen in ein Formular des DBS

Wie schreibt man Meta-Tags? Gar nicht - denn dieses Formular erzeugt automatisch eine Datei, die die Meta-Informationen in Meta-Tags nach dem Dublin Core umsetzt. Diese Datei kann sich der Autor, wenn er möchte, direkt auf seinen Computer kopieren, um die in ihr enthaltenen Metatags mit einem Texteditor in sein Web-Dokument einzufügen. Voilà! Dort findet sie jede Suchmaschine, die nach Meta-Informationen sucht.

Pflege von Meta-Daten. Und dort, in seinem Dokument selbst, kann der Autor leicht und jederzeit Korrekturen einfügen: z.B. weitere Schlagwörter seiner Wahl, Update des Änderungs- oder Verfalldatums, Bezugsänderungen, Korrekturen von URLs oder E-Mail-Adressen u.a.m. Meta-Tags per Hand zu schreiben, ist eine aufwendige und fehleranfällige Sache, die man getrost dem Formular überlassen kann; Korrekturen dagegen in eine bestehende Seite von Meta-Tags einzutragen und diese damit aktuell zu halten, ist kein großer Aufwand. Der Vorteil ist: man braucht nur eine einzige Stelle, nämlich das eigene Dokument selbst, zu pflegen und muß nicht Korrekturänderungen an mehrere Bildungsserver melden. Diese überprüfen ja automatisch und regelmäßig die eingetragenen Dokumente auf Veränderungen und übernehmen diese in ihre Datenbank.

Die Zukunft. Wir erwarten, daß sich die Praxis, wichtige Web-Seiten durch entsprechende Meta-Informationen nach dem Standard des Dublin Core zu dokumentieren, allgemein durchsetzen wird. Der Dublin Core ist einerseits sehr flexibel und läßt den Bedürfnissen einzelner Fachbereiche oder den Anforderungen bestimmter Arten von Ressourcen großen Spielraum, andererseits schafft er die nötige Vereinheitlichung der Beschreibung von Web-Dokumenten aller Art, die nötig ist, um in einer Flut von Informationen gezielt nach bestimmten Kategorien suchen zu können. Dies gilt insbesondere, wenn man die nationalen Aktivitäten im Bereich von Pädagogik und Bildung mit den europäischen und transatlantischen verbinden möchte. Wir arbeiten derzeit daran, die Kategorien unseres Meta-Tags-Erzeugungs-Formulars nicht nur auf deutsch, sondern auch auf englisch zu formulieren und entsprechende Einträge zu übersetzen, so daß nicht nur deutschsprachige, sondern auch englischsprachige Suchmaschinen auf die Meta-Tags der Dokumente zugreifen können.

10. Juni 1997, 19. Februar 1998

Anschrift der Verfasser:
Prof. Dr. Peter Diepold und Dr. Christian Richter
Humboldt-Universität zu Berlin
Abt. Pädagogik und Informatik
Geschwister-Scholl-Str. 7
D-10099 Berlin
Tel. (030) 2093-4178; Fax: -4198
e-mail: dbs@educat.hu-berlin.de

   Bonsai

Diesem Link bitte nicht folgen Diesem Link bitte nicht folgen Diesem Link bitte nicht folgen