In Meta-Angaben können Sie verschiedene nützliche Anweisungen für Web-Server, Web-Browser und automatische Suchprogramme im Internet ("Robots") notieren. Meta-Angaben können Angaben zum Autor und zum Inhalt der Datei enthalten. Sie können aber auch HTTP-Befehle absetzen, zum Beispiel zum automatischen Weiterleiten des Web-Browsers zu einer anderen Adresse.
Meta-Angaben sind nicht für persönliche Anmerkungen oder Kommentare zum Quelltext der HTML-Datei gedacht. Für solche Angaben können Sie Kommentare definieren.
Der HTML-Standard seit Version 4.0 schreibt keine konkreten Meta-Angaben mehr vor, sondern definiert lediglich den grundsätzlichen Aufbau einer Meta-Angabe. Zur Standardisierung von Meta-Angaben arbeitet das W3-Konsortium stattdessen an einer Sprache namens Resource Description Framework (RDF). Auf den Web-Seiten des W3-Konsortiums finden Sie Informationen zum Resource Description Framework.
Für jede Meta-Angabe notieren Sie ein Meta-Tag im HTML-Dateikopf. Es ist also kein Problem, mehrere Meta-Tags zu notieren.
<head> <meta name="author" content="Anna Lyse"> <meta http-equiv="expires" content="Sat, 01 Dec 2001 00:00:00 GMT"> <!-- ... andere Angaben im Dateikopf ... --> </head>
Eine Meta-Angabe steht in einem Standalone-Tag namens meta
. Jedes Meta-Tag hat dann in der Regel zwei Attribute. Das eine Attribut lautet entweder name
oder http-equiv
, und das andere lautet stets content
. Durch die beiden Attribute lassen sich typische "Konfigurationsdaten" vom Typ "Eigenschaft=Wert" erzeugen. Im obigen Beispiel wird auf diese Weise z.B. mit name
eine Eigenschaft "author"
angegeben, der mit content
ein Wert Anna Lyse
zugewiesen wird. In der zweiten Meta-Angabe des Beispiels wird einer Eigenschaft namens expires
der Wert Sat, 01 Dec 2001 00:00:00 GMT
zugewiesen. In dem zweiten Beispiel wird die Eigenschaft jedoch mit http-equiv
definiert.
Eigenschaften, die mit name
definiert werden, richten sich überwiegend an auslesende Client-Programme, also an Web-Browser, aber auch an Suchmaschinen-Robots, die Web-Seiten zum Füttern ihrer Suchmaschinendatenbank auslesen.
Eigenschaften, die mit http-equiv
definiert werden, sind dagegen ursprünglich für den Web-Server gedacht. Die Idee dahinter ist, dass der Web-Server, wenn er von einem aufrufenden Browser die Anfrage erhält, diese HTML-Datei zu übermitteln, die Meta-Tags vorher ausliest und Angaben, die mit http-equiv
definiert wurden, in den HTTP-Header einbaut, den er an den aufrufenden Web-Browser schickt. Dies soll dem Autor der HTML-Datei ermöglichen, die Kommunikation zwischen Web-Server und Web-Browser zu beeinflussen. Angaben dieser Art bewirken jedoch selten das Gewünschte, da die gängigen Web-Server die Daten vor dem Übertragen der Datei an den Browser standardmäßig nicht auslesen. Somit liegt es am Browser, solche Meta-Angaben wie HTTP-Header zu interpretieren.
Für Wertzuweisungen an content
gelten alle Regeln für Zeichenvorrat, Sonderzeichen und HTML-eigene Zeichen.
Wenn Sie XHTML-konform arbeiten möchten, müssen Sie das meta
-Element als inhaltsleer kennzeichnen. Dazu notieren Sie das alleinstehende Tag in der Form <meta name="Eigenschaft" content="Wert" />
. Weitere Informationen finden Sie im Kapitel XHTML und HTML.
Mit Meta-Angaben wird leider auch viel Missbrauch getrieben. Da die meisten Meta-Angaben keine unmittelbar nachvollziehbare Wirkung am Bildschirm haben und andererseits mit Suchdiensten zu tun haben, regen sie offenbar magisch die Phantasie mancher Geister an, die meinen, mit einem Mammutaufgebot irgendwo aufgeschnappter Meta-Angaben würden sie über Nacht zum Superstar, da ihre Homepage dann immer ganz oben bei den Suchtreffern eines Suchdienstes erscheint. Nachdem Seitenautoren massenhaft widersinnige und irreführende Meta-Angaben verwendet hatten, sind die namhaften Suchdienste dazu übergegangen, Meta-Angaben keine besondere Bedeutung mehr zuzumessen. Stattdessen legen sie Wert auf den Inhalt und berechnen die Relevanz einer Seite anhand der Anzahl der fremden Seiten, die auf diese verweisen. Eine Homepage kann daher nicht durch Meta-Angaben, sondern durch die Qualität der Inhalte erfolgreich werden. Zu einer sauber gemachten Homepage gehört aber auch der sinnvolle Einsatz von Meta-Angaben.
Die hier beschriebenen Meta-Angaben sind am verbreitetsten, sie wurden einst von fast allen großen Suchmaschinen im Web ausgelesen. Die heutigen heutigen populären Suchmaschinen berücksichtigen sie teilweise immer noch. Insbesondere für seiteninterne Suchprogramme, die sich auf die Korrektheit der Metadaten verlassen können, sind die Angaben nach wie vor wichtig.
Sie können Ihre Autorenschaft, eine Kurzbeschreibung des Inhalts, charakteristische Stichwörter und das Publikationsdatum notieren. Insbesondere die Kurzbeschreibung wird in manchen Suchmaschinen angezeigt, wenn ein Anwender nach etwas sucht und diese Datei zu den Treffern gehört. Es ist also sinnvoll, diese Meta-Angaben in allen inhaltlich relevanten HTML-Dateien zu notieren und dabei redaktionell genauso sorgfältig zu sein wie bei dem Text, der im Browser-Fenster angezeigt wird.
<head> <meta name="description" content="Dieser Beschreibungstext soll einem Anwender im Suchdienst bei Auffinden dieser Datei erscheinen."> <meta name="author" content="Rainer Wahnsinn"> <meta name="keywords" content="HTML, Meta-Informationen, Suchprogramme, HTTP-Protokoll"> <meta name="date" content="2001-12-15T08:49:37+02:00"> <!-- ... andere Angaben im Dateikopf ... --> </head>
Mit <meta name="description" content="Beschreibungstext">
bestimmen Sie einen Beschreibungstext (meta = "über", name = Name, description = Beschreibung, content = Inhalt).
Mit <meta name="author" content="Autorenname">
teilen Sie den Namen des Autors (d.h.: des inhaltlich Verantwortlichen) für die HTML-Datei mit (author = Autor).
Mit <meta name="keywords" content="[Wortliste]">
bestimmen Sie Stichwörter für ein Suchprogramm. Ein Anwender, der in der Suchdatenbank des Suchprogramms nach einem dieser Stichwörter sucht, soll die aktuelle HTML-Datei bevorzugt als Suchtreffer angezeigt bekommen, da das Stichwort in dieser Datei ein zentrales Thema ist (keywords = Schlüsselwörter). Trennen Sie die einzelnen Schlüsselwörter durch Kommata. Ein Schlüsselwort kann durchaus aus zwei oder mehreren Einzelwörtern bestehen. Halbe oder ganze Sätze gehören hier allerdings nicht hin, denn dafür gibt es den Beschreibungstext, den Sie bei name="description"
notieren können.
Mit <meta name="date" content="[Datum/Uhrzeit]">
geben Sie an, wann die Datei publiziert wurde. Die Zeitangabe sollte einem standardisierten Schema folgen. Im obigen Beispiel ist 2001
die Jahreszahl, 12
der Monat (Dezember), 15
der Tag, 08
die Stunden, 49
die Minuten und 37
die Sekunden. Die Angabe 02:00
hinter dem Pluszeichen ist die Abweichung von der koordinierten Weltzeit (UTC) in Stunden und Minuten, im Beispiel zwei Stunden. Dies entspricht der Mitteleuropäischen Sommerzeit. Wenn Sie nur das Datum, aber keine Uhrzeit angeben wollen, notieren Sie nur den Teil der Datumsangabe bis vor dem großen T (für Time).
Sie können mehrere gleichartige Meta-Angaben notieren und dabei zwischen verschiedenen Sprachen trennen. Inbesondere Stichwörter und Kurzbeschreibungen des Inhalts können Sie mehrsprachig angeben.
<head> <meta name="keywords" lang="de" content="Ferien, Griechenland, Sonnenschein"> <meta name="keywords" lang="en-us" content="vacation, Greece, sunshine"> <meta name="keywords" lang="en" content="holiday, Greece, sunshine"> <meta name="keywords" lang="fr" content="vacances, Grèce, soleil"> <!-- ... andere Angaben im Dateikopf ... --> </head>
Im Beispiel werden die gleichen Stichwörter in den Sprachen Deutsch, US-Englisch, Britisch-Englisch und Französisch definiert. Dabei wird das Attribut lang
benutzt, um die Sprache anzugeben. Als Angabe ist ein Sprachenkürzel erlaubt, z.B. de
für deutsch, en
für englisch, fr
für französisch, it
für italienisch oder es
für spanisch.
Das Attribut lang
gehört zu den Universalattributen in HTML. Wenn Sie XHTML-konform arbeiten, sollten Sie zusätzlich das XML-Universalattribut xml:lang
angeben.
Sie können ein externes "Profil" für Meta-Angaben angeben, an das Sie sich halten.
Es kann sich dabei um allgemein bekannte Profile handeln, die bestimmte Internet-Adressen als Heimat haben. Denkbar ist eine solche Adresse beispielsweise für Dublin Core. Ebenso ist es aber auch möglich, ein eigenes Profil mit eigenen Meta-Definitionen anzugeben.
<head profile="http://example.org/profil.html"> <meta name="Kategorie" content="A.1.B"> <!-- ... andere Angaben im Dateikopf ... --> </head>
Um ein Profil einzubinden, notieren Sie im einleitenden <head>
-Tag das Attribut profile
. Als Wert weisen Sie einen URI zu, unter dem die Profildatei abgelegt ist. Wie diese Profildatei auszusehen hat, ist nicht vorgeschrieben. Üblicherweise wird eine HTML-Datei angegeben, die die Meta-Eigenschaften tabellarisch auflistet und definiert. Das W3-Konsortium möchte die angegebene Adresse eher als "global eindeutigen Namen" verstanden wissen. Web-Browser oder Suchmaschinen, die das entsprechende Profil kennen, brauchen dann gar nichts auszulesen, sondern erfahren auf diese Weise einfach, dass die nachfolgenden Meta-Angaben diesem Profil gemäß zu interpretieren sind.
In dem Beispiel wird ein Profil zugrunde gelegt, das auf der Internet-Adresse http://example.org/profil.html abgelegt ist. Es wird angenommen, dass in dem Profil eine Meta-Eigenschaft mit dem Namen Kategorie
definiert wird. Diese Eigenschaft kann dann mit <meta name="Kategorie" content="...">
benutzt werden.
Damit Ihre Metadaten automatisch verarbeitet werden können, sollten die Werte, die Sie beim content
-Attribut einer Meta-Angabe notieren, in einem bekannten Format abgefasst sein - vorausgesetzt, ein passendes existiert. Mit Hilfe eines zusätzlichen Attributs können Sie ein solches Schema angeben.
<head profile="http://example.org/profil.html"> <meta name="Typ" scheme="MIME-Typ" content="image/svg+xml"> <!-- ... andere Angaben im Dateikopf ... --> </head>
In dem Beispiel wird ein Profil zugrunde gelegt, das auf der Internet-Adresse http://example.org/profil.html
abgelegt ist. Es wird angenommen, dass in dem Profil eine Eigenschaft mit dem Namen Typ
definiert wird. Diese Eigenschaft kann dann in einer Meta-Angabe mit name="Typ"
bezeichnet werden. Das scheme
-Attribut stellt den Versuch dar, der auslesenden Software einen Hinweis zu geben, wie der zugehörige Wert beim content
zu verstehen ist. Im Beispiel wird mit scheme="MIME-Typ"
versucht, der Software mitzuteilen, dass die Angabe bei content
einen MIME-Typ meint.
Die Art und Weise, wie auf ein Schema verwiesen wird, ist nicht festgelegt. Dadurch entsteht das Problem, das die Schema-Angabe lösen soll, letztlich auch beim scheme
-Attribut selbst. Moderne Metadaten-Profile wie Dublin Core definieren daher nicht nur Eigenschaften, sondern geben gleichzeitig Bezeichner für mögliche Schemata vor.
Eine internationale Gruppe von Experten, unter dem Namen Dublin Core Metadata Initiative vereint, hat ein allgemeines System für Meta-Angaben entwickelt. Damit lassen sich nicht nur Informationen über HTML-Dokumente ausdrücken, es ist auch möglich, zum Beispiel Bilder, Filme, Termine und sogar physische Gegenstände damit zu beschreiben. Das System ist einfach zu handhaben und berücksichtigt alle wichtigen Angaben, die zu einem Dokument im WWW gemacht werden können. Die Meta-Angaben von Dublin Core werden auch vom W3-Konsortium begrüßt, welches vor allem bei RDF Gebrauch davon macht.
Dublin Core definiert im Wesentlichen 15 Eigenschaften, sogenannte Elemente, denen gewisse Werte zugeordnet werden können. Zusätzliche Unterelemente erlauben speziellere Meta-Angaben. Eine vollständige Auflistung und Beschreibung der Elemente finden Sie unter DCMI Metadata Terms. Der Dublin-Core-Standard schlägt für einige Angaben passende Schemata vor, unter anderem für Medientypen, Sprachenkürzel und Datumsangaben.
Die Spezifikation Expressing Dublin Core in HTML/XHTML meta and link elements beschreibt, wie Sie solche Meta-Angaben in HTML-Dateien einbinden können: Der Elementname wird im name
-Attribut des Meta-Tags untergebracht, der zugehörige Wert wie gewohnt im content
-Attribut. Optional können Sie im scheme
-Attribut das Datenformat angeben, dem der Wert entspricht.
<head profile="http://dublincore.org/documents/dcq-html/"> <link rel="schema.DC" href="http://purl.org/dc/elements/1.1/"> <link rel="schema.DCTERMS" href="http://purl.org/dc/terms/"> <meta name="DC.title" content="SELFHTML: Meta-Angaben"> <meta name="DC.creator" content="Stefan Münz"> <meta name="DC.subject" content="Meta-Angaben"> <meta name="DC.description" content="Heute bekannte Meta-Angaben in HTML"> <meta name="DC.publisher" content="TeamOne"> <meta name="DC.contributor" content="Wolfgang Nefzger"> <meta name="DC.date" content="2001-12-15T08:49:37+02:00" scheme="DCTERMS.W3CDTF"> <meta name="DC.type" content="Text" scheme="DCTERMS.DCMIType"> <meta name="DC.format" content="text/html" scheme="DCTERMS.IMT"> <meta name="DC.identifier" content="http://de.selfhtml.org/html/kopfdaten/meta.htm" scheme="DCTERMS.URI"> <meta name="DC.source" content="http://www.w3.org/TR/html401/struct/global.html#h-7.4.4" scheme="DCTERMS.URI"> <meta name="DC.language" content="de" scheme="DCTERMS.RFC3066"> <meta name="DC.relation" content="http://dublincore.org/" scheme="DCTERMS.URI"> <meta name="DC.coverage" content="Munich" scheme="DCTERMS.TGN"> <meta name="DC.rights" content="Alle Rechte liegen beim Autor"> <!-- ... andere Angaben im Dateikopf ... --> </head>
Für verarbeitete Programme wie Suchmaschinen können Sie ausdrücklich angeben, dass Ihr Dokument der Dublin-Core-Spezifikation zum Einbetten von Metadaten in HTML entspricht. Dazu geben Sie die Adresse http://dublincore.org/documents/dcq-html/ als Metadaten-Profil an.
Bei Meta-Angaben, die einem bestimmten öffentlichen System angehören, wird dem Namen einer Meta-Angabe eine Kurzbezeichnung für das System vorangestellt. Bei den 15 wichtigsten Elementen von Dublin Core lautet dieses Präfix DC
, bei den Unterelementen und den Schemata müssen Sie DCTERMS
notieren. Dahinter folgt, durch einen Punkt getrennt, der Elementname beziehungsweise der Bezeichner des Datenformates. Um eindeutig herauszustellen, dass alle Meta-Angaben mit diesem Präfix zum Dublin-Core-System gehören, wird mittels link
-Verweisen auf die sogenannten Namensräume für Dublin Core verwiesen. Somit ist Eindeutigkeit gewährleistet, selbst wenn andere Metadaten-System ebenfalls mit diesen Kürzeln arbeiten sollten.
Mit <meta name="DC.title" content="Titel">
können Sie einen Titel für die Datei angeben, ähnlich wie im title
-Element von HTML (title = Titel).
Mit <meta name="DC.creator" content="Name">
weisen Sie den geistigen Urheber des Inhalts der Datei aus (Creator = Ersteller).
Mit <meta name="DC.subject" content="Text">
geben Sie das Thema an, das in der Datei behandelt wird (Subject = Thema).
Mit <meta name="DC.description" content="Text">
können Sie eine Kurzbeschreibung des Datei-Inhalts notieren (Description = Beschreibung).
Mit <meta name="DC.publisher" content="Name">
können Sie angeben, wer für die Publikation der Datei verantwortlich ist. Das kann der Autor selbst sein, aber auch etwa ein Verlag oder der Nachfahre eines verstorbenen Autors (Publisher = Veröffentlicher).
Mit <meta name="DC.contributor" content="Name">
können Sie Co-Autoren oder Personen angeben, die neben dem Hauptautor maßgeblich am Inhalt beteiligt sind, z.B. Grafiker, Musiker, Übersetzer (Contributor = Beitragender). Falls mehrere Co-Autoren beteiligt waren, notieren Sie mehrere Meta-Tags mit name="DC.contributor"
.
Mit <meta name="DC.date" content="Datum">
können Sie angeben, wann die Datei publiziert wurde. Das Datum sollte einem der in Date and Time Formats angegebenen Formate entsprechen. Das im Beispiel verwendete Format wird im Zusammenhang mit der herkömmlichen Datums-Angabe beschrieben. Mit dem Attribut scheme="DCTERMS.W3CDTF"
können Sie ausdrücklich notieren, dass die Zeitangabe einem solchen standardisierten Schema entspricht.
Mit <meta name="DC.type" content="Typ">
können Sie den Typ des Inhalts angeben, über den Sie die Meta-Angaben machen. Folgende Typen sind erlaubt:
Collection
= wenn der Inhalt ein Verzeichnis mit Verweisen zu Unterseiten ist und die Meta-Angaben das Verzeichnis als solches beschreiben.
Dataset
= wenn die enthaltene Information datensatzartig vorliegt, z.B. in einer Tabelle.
Event
= wenn der Inhalt für ein zeitliches Ereignis steht, z.B. eine Ausstellung oder eine Hochzeitsfeier.
Image
= wenn der Inhalt eine visuelle Darstellung ist, z.B. ein Foto, eine Zeichnung oder auch eine Animation oder ein Film.
InteractiveResource
= wenn der Zweck der Seite in der Interaktion mit dem Anwender liegt, z.B. wenn es sich um ein Anmeldeformular handelt oder ein Java-Applet eingebettet ist, das einen Chat realisiert.
PhysicalObject
= wenn es sich beim Inhalt der Seite um einen beliebigen physischen Gegenstand handelt. Da dies bei HTML-Dateien nicht möglich ist, hat es wenig Sinn, diesen Typ zu notieren. Falls es sich um eine visuelle Wiedergabe eines solchen Gegenstandes handelt, wählen Sie den Typ Image
, bei einer textuellen Beschreibung den Typ Text
und bei einer Audio-Aufnahme den Type Sound
.
Service
= wenn die Seite eine Dienstleistung realisiert, z.B. einen Online-Banking-Dienst.
Software
= wenn der Inhalt Software anbietet, z.B. zum Download, und sich die Meta-Angaben auf diese Software beziehen.
Sound
= wenn der Inhalt primär akustisch ist, z.B. ein eingebettetes MP3-Musikstück zum Abspielen anbietet oder einen laufenden Radiosender über Real Audio einbettet.
Text
= wenn der Inhalt textorientiert ist - egal ob es sich um Sachtexte, Literatur, Witze, Nachrichten oder wissenschaftliche Abhandlungen handelt.
Um ausdrücklich anzugeben, dass Sie einen dieser vordefinierten Typen verwenden, notieren Sie das Attribut scheme="DCTERMS.DCMIType"
.
Mit <meta name="DC.format" content="Typ">
können Sie das Datenformat bzw. den Medientyp der Datei angeben. Als Wert können Sie einen MIME-Typ angeben. Der MIME-Typ für HTML lautet text/html
. Mit dem Attribut scheme="DCTERMS.IMT"
können Sie verdeutlichen, dass es sich bei der Angabe um einen Medientyp nach dem offiziellen Schema handelt.
Mit <meta name="DC.identifier" content="Wert">
können Sie eine eindeutige Nummer oder Bezugsadresse für die Datei angeben (identifier = eindeutiger Bezeichner). Bei Web-Seiten ist das beispielsweise der Original-URI. Mit dem Zusatz scheme="DCTERMS.URI"
machen Sie darauf aufmerksam, dass der Wert ein gültiger URI ist.
Mit <meta name="DC.source" content="Quelle">
können Sie eine Quelle nennen, von der die aktuelle Datei abgeleitet ist (source = Quelle). Im obigen Beispiel wurde eine Webseite als Quelle angegeben. Sie können jedoch auch den Titel einer Offline-Publikation nennen. Das kann beispielsweise der Fall sein, wenn eine HTML-Datei Auszüge aus einem Buch beinhaltet. Wenn es sich bei der Quellenangabe um einen URI handelt, können Sie dies mit dem Attribut scheme="DCTERMS.URI"
betonen.
Mit <meta name="DC.language" content="Sprache">
können Sie die Sprache angeben, in der der Inhalt der Datei verfasst ist (language = Sprache). Als Angabe bei content
wird ein Sprachenkürzel nach RFC 3066 erwartet.
Mit <meta name="DC.relation" content="Quelle">
können Sie angeben, welche Beziehung zwischen der aktuellen Datei und einem zugehörigen Editionsprojekt bestehen (Relation = Bezug). Der Wert bei content
kann z.B. eine verbale Beschreibung sein, welcher Art der Bezug ist.
Mit <meta name="DC.coverage" content="Text">
können Sie einen zeitlichen oder geografischen Bezugspunkt für den Inhalt der Datei angeben (coverage = Erfassung, Berichterstattung). Das kann bei geografischen Angaben etwa ein Ort, eine Längen-/Breitengradangabe oder eine Region sein, bei zeitlichen Angaben ein Datum oder ein Zeitalter. Im obigen Beispiel wird ein Stadtname aus dem Getty Thesaurus of Geographic Names verwendet. Als Datenformat ist daher scheme="DCTERMS.TGN"
notiert.
Mit <meta name="DC.rights" content="Text">
können Sie eine Angabe zum Copyright des Datei-Inhalts machen (rights = Rechte). Sie können dabei aber auch einen URI angeben, unter dem die genauen rechtlichen Bestimmungen aufgeführt sind. In diesem Fall sollten Sie mit scheme="DCTERMS.URI"
darauf hinweisen, dass es sich bei dem Wert um einen URI handelt.
Sie müssen nicht alle Meta-Angaben des Dublin-Core-Satzes verwenden. Es ist kein Problem, wenn Sie nur zu denjenigen etwas notieren, wo Sie sinnvolle Angaben machen können. Auch die Angabe der Datenformate im scheme
-Attribut ist nicht unbedingt notwendig, aber empfehlenswert, sofern ein entsprechendes Schema existiert.
Obwohl Dublin Core ein bekanntes und ausgereiftes Metadaten-System darstellt, erscheint der praktische Nutzen solcher Meta-Angaben auf den ersten Blick gering. Die führenden Suchmaschinen im Web ignorieren sie mittlerweile völlig. Dies ist als Reaktion auf den Missbrauch zu verstehen, der mit Meta-Angaben in der Vergangenheit getrieben wurde. Der Nutzen von Dublin-Core-Metadaten ist also eher dort anzusiedeln, wo verarbeitende Programme den Metadaten vertrauen können. Bei umfangreichen Web-Angeboten eignen sich derartige Metadaten zum Beispiel für die interne Verwaltung, für dynamisch generierte Inhaltsverzeichnisse und für seiteninterne Suchfunktionen.
Die folgenden Angaben werden von den meisten Suchmaschinen-Robots beachtet.
Wenn Sie eine HTML-Datei zwar im Web anbieten, aber trotzdem verhindern möchten, dass die Datei über öffentliche Suchdienste auffindbar sein soll, können Sie eine entsprechende Anweisung als Meta-Information für Suchprogramme notieren. Sie können solchen Suchprogrammen aber auch mit einer entsprechenden Eingabe signalisieren, dass Sie ein Auslesen der Datei und aller Dateien, die darin über Verweise erreichbar sind, ausdrücklich wünschen.
<head> <meta name="robots" content="noindex"> <!-- ... andere Angaben im Dateikopf ... --> </head>
Mit <meta name="robots" content="noindex">
verbieten Sie einem Suchprogramm, Inhalte aus der HTML-Datei an seine Suchdatenbank zu übermitteln (robots = Suchprogramme, content = Inhalt, noindex = keine Indizierung). Anstelle von noindex
können Sie auch none
notieren (none = keine).
Daneben sind folgende weitere Angaben möglich:
<meta name="robots" content="index">
. Damit erlauben Sie einem Suchprogramm ausdrücklich, Inhalte aus der aktuellen HTML-Datei an seine Suchdatenbank zu übermitteln (index = Indizierung).
<meta name="robots" content="nofollow">
. Damit erlauben Sie einem Suchprogramm, Inhalte aus der aktuellen HTML-Datei an seine Suchdatenbank zu übermitteln (nofollow = nicht folgen). Sie verbieten dem Suchprogramm jedoch, untergeordnete Dateien Ihres Projekts, zu denen Verweise führen, zu besuchen.
<meta name="robots" content="follow">
. Damit erlauben Sie einem Suchprogramm ausdrücklich, Inhalte aus der aktuellen HTML-Datei und aus untergeordneten Dateien Ihres Projekts, zu denen Verweise führen, zu besuchen und an seine Suchdatenbank zu übermitteln (follow = folgen).
Wenn Sie sich für das Erlauben und Verbieten von Inhalten für Such-Robots interessieren, sollten Sie auch den Abschnitt robots.txt - Robots kontrollieren lesen.
Sie können mit Hilfe einer Meta-Angabe ausdrücklich bestimmen, welchen Zeichensatz die HTML-Datei verwendet.
Diese Angabe ist für den Web-Browser besonders wichtig, denn sie teilt ihm eindeutig mit, nach welchem Zeichensatz die Inhalte der HTML-Datei im Zweifelsfall zu interpretieren sind (siehe Allgemeines zu Zeichen in HTML). Wichtig ist die Angabe vor allem dann, wenn Sie innerhalb der HTML-Datei z.B. deutsche Umlaute nicht über benannte Zeichen maskieren.
<head> <meta http-equiv="content-type" content="text/html; charset=ISO-8859-1"> <!-- ... andere Angaben im Dateikopf ... --> </head>
Die Angabe zum Zeichensatzes wird mit http-equiv="content-type"
definiert. Daran ist schon erkennbar, dass sich die Angabe auch an den Web-Server richtet. Bei content
geben Sie zunächst den MIME-Typ an, der für HTML-Dateien immer text/html
lautet. Dahinter folgt, durch einen Strichpunkt getrennt, die Angabe des Zeichensatzes. Im obigen Beispiel wird der Zeichensatz ISO-8859-1
angegeben. Das ist ein verbreiteter Zeichensatz für westeuropäische Sprachen, unter anderem auch für Deutsch.
Erlaubt sind Zeichensatzangaben, wie sie auf der Web-Adresse http://www.iana.org/assignments/character-sets angegeben sind.
Weitere Informationen über solche Zeichensätze, auch über andere als diesen Zeichensatz, finden Sie im Abschnitt Zeichensätze (ISO-8859-Familie und andere).
Im Konfliktfall, also wenn der Webserver im HTTP-Header eine hiervon abweichende Angabe sendet, wird üblicherweise die Angabe des HTTP-Headers verwendet.
Für HTML-Ergänzungssprachen wie Stylesheets und Scripts können Sie bestimmen, welche Sprachen Sie innerhalb der HTML-Datei verwenden.
<head> <meta http-equiv="Content-Script-Type" content="text/javascript"> <meta http-equiv="Content-Style-Type" content="text/css"> <!-- ... andere Angaben im Dateikopf ... --> </head>
Die Angaben zum Bestimmen der Default-Script-Sprache und der Default-Stylesprache haben einen einheitlichen Aufbau. Die Angabe zur bevorzugten Script-Sprache leiten Sie mit <meta http-equiv="Content-Script-Type"
ein, die Angabe zur bevorzugten Stylesprache mit http-equiv="Content-Style-Type"
. Bei dem Attribut content
müssen Sie dann den MIME-Typ der gewünschten Sprache angeben. Beispiele sind text/css
für Stylesheets und text/javascript
für JavaScript.
Häufig abgerufene Web-Seiten werden im Web auf so genannten Proxy-Servern zwischengespeichert. Das ist dann ein so genannter Proxy-Cache. Auch Browser speichern aufgerufene Seiten, und zwar lokal auf dem Rechner des Anwenders. Dabei spricht man vom Browser-Cache. Die Cache-Speicher sparen in vielen Fällen Leitungswege und Ressourcen. Ein Nachteil ist jedoch, dass dem Anwender möglicherweise Daten angezeigt werden, die gar nicht mehr aktuell sind, weil auf der Originaladresse mittlerweile neue Daten liegen. Sie können mit Hilfe einer Meta-Angabe erzwingen, dass die Daten nicht aus einem Cache-Speicher serviert werden, sondern vom Original-Server. Zu empfehlen ist diese Angabe, wenn Sie die Daten einer HTML-Datei häufig ändern und neu ins Web hochladen.
<head> <meta http-equiv="expires" content="0"> <!-- ... andere Angaben im Dateikopf ... --> </head>
Mit <meta http-equiv="expires" content="0">
veranlassen Sie, dass diese HTML-Datei in jedem Fall von der Originaladresse geladen wird (expires = fällig werden).
Bei content
können Sie anstelle der 0
in diesem Zusammenhang aber auch ein bestimmtes Datum und eine bestimmte Uhrzeit angeben. Dadurch bewirken Sie, dass die Daten dieser Datei nach dem angegebenen Zeitpunkt auf jeden Fall vom Original-Server geladen werden sollen. Datum und Uhrzeit müssen Sie im internationalen Format angeben. Beispiel: content="Sat, 15 Dec 2001 12:00:00 GMT"
. Notieren Sie den Zeitpunkt so wie im Beispiel mit allen Leerzeichen, Doppelpunkten zwischen Stunden, Minuten und Sekunden sowie der Angabe GMT
am Ende. Als Wochentagnamen sind erlaubt Mon
(Montag), Tue
(Dienstag), Wed
(Mittwoch), Thu
(Donnerstag), Fri
(Freitag), Sat
(Samstag) und Sun
(Sonntag). Als Monatsnamen sind erlaubt Jan
(Januar), Feb
(Februar), Mar
(März), Apr
(April), May
(Mai), Jun
(Juni), Jul
(Juli), Aug
(August), Sep
(September), Oct
(Oktober), Nov
(November) und Dec
(Dezember).
Anstelle der 0
können Sie auch eine Zahl angeben. Diese Zahl bedeutet dann die Anzahl Sekunden, nach deren Ablauf der Web-Browser eine Datei, die er im Cache hat, auf jeden Fall wieder vom Server lädt. Mit content="43200"
stellen Sie beispielsweise einen Wert von 12 Stunden ein.
Diese Angabe ist zwar ziemlich eingebürgert und sehr beliebt, weshalb sie hier auch beschrieben wird. In der HTML-Spezifikation verteufelt das W3-Konsortium diese Angabe jedoch mit der Begründung, dass die Seite dann für einige Besucher überhaupt nicht mehr anzeigbar sei. Das mutet zwar etwas seltsam an, da es seit Urzeiten mit praktisch allen Browsern erfolgreich funktioniert. Es sei an dieser Stelle aber auf die Verteufelung hingewiesen.
Benutzt wird diese Angabe in der Praxis oft für das automatische Weiterleiten eines Seitenbesuchers von einer alten Adresse Ihres Web-Projekts zu einer neuen Adresse.
<head> <meta http-equiv="refresh" content="5; URL=http://de.selfhtml.org/"> <!-- ... andere Angaben im Dateikopf ... --> </head>
Mit <meta http-equiv="refresh" content="...">
veranlassen Sie die Weiterleitung zu einer anderen Adresse. Mit content="5;
bestimmen Sie, nach wie viel Sekunden die Weiterleitung starten soll. Die 5
im Beispiel bedeutet also, dass die aktuelle Seite, nachdem sie geladen ist, 5 Sekunden lang angezeigt wird. Danach wird die Adresse aufgerufen, die mit url=..."
angegeben wird. Notieren Sie das gesamte Element inklusive der etwas ungewohnten Stellung der Anführungszeichen so wie im Beispiel oben angegeben. Setzen Sie Ihre gewünschte Anzeigedauer und den Namen der aufzurufenden Adresse ein. Bei lokalen Adressen auf dem gleichen Server können Sie absolute oder relative Pfadangaben ohne Angabe von http://
und Domain notieren. Bei Weiterleitung zu Dateien im gleichen Verzeichnis genügt der Dateiname. Bei einem Timeout von 0
wird die angegebene nächste Datei sofort geladen.
Verlassen Sie sich nicht darauf, dass diese Angabe funktioniert. Wenn Sie etwa eine Weiterleitung zu einer neuen Adresse eingeben, notieren Sie am besten auf der gleichen Seite zur Sicherheit noch einen normalen Verweis zu der neuen Adresse. So finden auch Anwender, bei denen die Meta-Angabe nicht funktioniert, auch über den Verweis den Weg zu Ihrer neuen Heimat.
PICS steht für "Platform for Internet Content Selection". Es handelt sich dabei um ein standardisiertes Schema zum Bezeichnen von Internet-Inhalten. Das Schema wurde ins Leben gerufen, um jugendfreie Internet-Inhalte als solche auszuzeichnen. Es gibt so genannte PICS-Labels, also Auszeichnungen. Anbieter von Web-Seiten können ihre Seiten entweder freiwillig und nach eigenem Ermessen mit einem PICS-Label versehen, oder - und das ist wohl eher Sinn der Sache - sie nehmen einen unabhängigen PICS-Service in Anspruch, der PICS-Zertifikate für Inhalte ausstellt.
Auf Einzelheiten des PICS-Systems wird hier nicht näher eingegangen. Informationen im Web finden Sie auf der PICS-Seite des W3-Konsortiums. Moderne Browser können PICS-Inhalte erkennen. Dazu lassen sich software-seitig Einstellungen vornehmen, zum Beispiel durch Eltern von surfenden Kindern. So kann der Browser bei Seiten mit PICS-Labeln durch Vergleichen der Konfiguration mit dem Label erkennen, ob der Inhalt angezeigt werden darf oder nicht.
<head> <meta http-equiv="PICS-Label" content=' (PICS-1.1 "http://www.gcf.org/v2.5" labels on "1994.11.05T08:15-0500" until "1995.12.31T23:59-0000" for "http://w3.org/PICS/Overview.html" ratings (suds 0.5 density 0 color/hue 1))'> <!-- ... andere Angaben im Dateikopf ... --> </head>
Durch die Meta-Angabe http-equiv="PICS-Label"
können Sie eine PICS-Auszeichnung für eine HTML-Datei notieren. Hinter content
folgt die PICS-Auszeichnung. Die gesamte Auszeichnung wird in einfache Anführungszeichen gesetzt. Die Syntax der PICS-Auszeichnung wird innerhalb davon in runde Klammern eingeschlossen. Innerhalb der runden Klammern stehen zunächst die Pflichtangabe zur PICS-Version und die Angabe des URI, wo die Inhaltskategorisierung definiert wird, auf die hier Bezug genommen wird. Die Angaben labels on
, until
und for
sind optional. Entscheidend ist aber auf jeden Fall die Angabe ratings
, in der die eigentliche Inhaltskategorisierung notiert wird. Die Kategorisierung wird dabei nochmals in runde Klammern eingeschlossen. Die einzelnen dort möglichen Angaben und ihre Bedeutung muss der PICS-Service bereitstellen, der die PICS-Zertifikate
verteilt.
Die folgenden Meta-Angaben sind verstreute "Sammlerstücke". Oft sind es Angaben, die mit bestimmten Web-Servern oder Browsern oder Suchmaschinen-Robots funktionieren, oder Angaben, die von Bearbeitungs-Software eingetragen werden. Manchmal sind es aber möglicherweise auch nur Erfindungen von Leuten, die an magische Kräfte in ihren HTML-Dateien glauben. Hier eine kleine Auswahl solcher Meta-Angaben:
<meta http-equiv="content-language" content="de">
Sprache des Datei-Inhalts. im content
-Attribut wird ein Sprachenkürzel nach RFC 1766 angegeben.
<meta name="generator" content="MS FrontPage 2000">
<meta name="generator" content="Netscape Composer">
Wird von HTML-Editoren, vor allem von WYSIWYG-Editoren, ohne Wissen des Autors eingefügt. Software-Hersteller können so prima das Web durchsuchen und feststellen, wo und wie viel mit ihrer Software gearbeitet wird.
<meta http-equiv="ext-cache"
content="name=/some/path/index.db; instructions=user instructions">
Anweisung an den Netscape-Browser: nicht den normalen lokalen Browser-Cache benutzen, sondern den angegebenen externen Cache.
<meta http-equiv="cache-control" content="no-cache">
Anweisung an den Browser: keinen Cache benutzen, sondern von Originalseite laden.
<meta http-equiv="set-cookie"
content="cookievalue=xxx;expires=friday, 31-dec-99 23:59:59 gmt; path=/;">
Cookie setzen (Netscape)
<meta http-equiv="pragma" content="no-cache">
An Proxy-Agenten: Datei bitte nicht auf Proxy-Server speichern!
Adressbasis und Zielfensterbasis | |
Titel einer HTML-Datei | |
SELFHTML/Navigationshilfen HTML/XHTML HTML-Kopfdaten |
© 2005 Impressum