Zum Inhalt springen

SEO Analyse » SEO Lexikon » s » Sitemap

SitemapDie Sitemap gilt als wichtiger Bestandteil einer Webseite, die in erster Linie der SEO dient und viele der Unterseiten mit URL listet. Somit ist die Sitemap, im Englischen auch Site Map, eine Liste der Seiten einer Webseite, die für Crawler oder Nutzer öffentlich einsehbar bzw. zugänglich ist. Es kann entweder ein Dokument oder eine eigene Web-Seite als Sitemap infrage kommen. In der Regel ist das Dokument bzw. die HTML-Seiten mit den gelisteten Urls hierarchisch organisiert. Neben den Kategorien, welche für den Aufbau einer Webseite zuständig sind, werden in der Sitemap auch bestimmte Media- und Newsbereiche, Community-Elemente, Bloginhalte und Kontaktmöglichkeiten sowie ein Link zum Impressum gelistet. Sitemaps sind im Internet häufig als Sitemap-Protokolle vorzufinden und werden auch als solche bezeichnet. Ein solches Protokoll wurde aus der Idee heraus, crawlerfreundliche Webseiten zu erstellen, gegründet. 2005 entwickelte Google die erste Sitemap-Technologie.

Die zwei Versionen von einer Sitemap

Es gibt zwei gängige Versionen von einer Sitemap. Eine XML-Sitemap ist ein strukturiertes Format, dass der Webseitebetreiber und Besucher nicht zu sehen bekommt. Diese Version kommuniziert praktisch nur mit den Crawlern der Suchmaschinen. Diese können dadurch erkennen, welche Wichtigkeit eine einzelne Unterseite aufweist, wie viele Besucher sie anklicken und wie oft sie aktualisiert wird. XML ist ein Dokument, das eine spezielle Struktur und Codierung verwendet. Die Codierung gilt auch als Standard für Webcrawler, um Sitemaps zu analysieren und zu finden. Die zweite Version ist die HTML-Sitemap. Diese soll dem Benutzer helfen, die Inhalte auf der Webseite besser zu gestalten. HTML-Sitemaps müssen nicht jede Unterseite erfassen. Sie hilft auch Besuchern und Suchmaschinen-Bots Inhalte auf einer Webseite zu finden und ist daher öffentlich zugänglich, etwa über einen Verweis auf der Startseite oder einen Eintrag im Menü der Webseite. HTML-Seiten geben im Gegensatz zu den XML-Versionen das Design der Webseite an. XML-Seiten sind wiederum weiß und weisen keine CSS-Inhalte bzw. HTML-Codes auf. XML ist zudem viel genauer als eine HTML-Codierung. Fehler werden nicht geduldet, wodurch die Syntax stets genau ist.

Ursprung, Zweck und Bedeutung einer Sitemap

Im Jahr 2005 führte Google Sitemaps ein, um Web-Entwicklern die Möglichkeit zu geben, Listen von Links ihrer Webseites zu veröffentlichen. Der Grundgedanke ist, dass einige Webseiten eine Vielzahl von dynamischen Seiten aufweisen, die nur aufgrund von Besucherinhalten wie Foren existieren. Die Sitemap-Datei enthält Urls zu diesen Seiten, sodass Webcrawler sie finden können. Die großen Suchmaschinen – Bing, Google, Yahoo und Ask – nutzen allesamt gemeinsam ein Sitemap-Protokoll, was es Webseitenbetreibern natürlich vereinfacht, sich an die Vorgaben und Beschränkungsrichtlinien, die weiter unten gelistet sind, zu halten. Sitemaps können jedoch nicht garantieren, dass alle Links gecrawlt werden, und übernehmen auch keine Garantie für die Indizierung. Allerdings ist eine Sitemap immer noch die beste Versicherung, um einer Suchmaschine mitzuteilen, dass die eigene Webseite existiert und sich vergrößert bzw. neue Inhalte bietet.

Die Beschränkungen bei der Sitemap

Es gibt einige Beschränkungen, auf die man im Rahmen der Verwendung einer Sitemap achten sollte. So ist es nicht erlaubt, mehr als 50.000 Urls, die auf Inhalte der Webplattform verweisen, in der Sitemap zu listen. Hat man mehr Inhalte, muss man manche herausstreichen bzw. nur die wichtigsten in die Sitemap aufnehmen. Eine weitere Beschränkung bezieht sich auf die Größe der Sitemap. Diese darf nicht mehr als 10 MB bzw. 10.485.760 Byte aufweisen. Auch bei der Verwendung von komprimierten Webseites muss auf diese Obergrößengrenze geachtet werden. Man kann jedoch die Beschränkungen umgehen, indem man einfach mehrere Sitemaps nutzt. Die Haupt-Sitemap verweist auf alle anderen Sitemaps, wodurch man insgesamt theoretisch 2,5 Milliarden Urls in sein Sitemap-Protokoll aufnehmen kann.

Sitemap und Robot.txt

Webseitenbetreiber nutzen in der Regel eine Robots.txt-Datei. Diese Datei gilt als Befehlshaber von Crawlern. Sie gibt mit Kommandos an, welchen Seiten und Dateien von den Suchmaschinen-Bots registriert und aufgesucht werden können. Dadurch übt man einen großen Einfluss auf die Indexierung von Webseiten auf. Man kann etwa bestimmen, dass Crawler bestimmte Bilder nicht in die Bildersuchmaschinen von Google und Co. implementieren dürfen. Auch wertvolle, aber öffentlich zugängliche Inhalte, die nicht alle Welt täglich begutachten soll, kann man so von einer Indexierung bei Suchmaschinen ausschließen. Da die Sitemap für eine Webseite keinen großen Mehrwert hat, ist es sehr ratsam, sie ebenfalls von der Suchmaschinenindexierung auszuschließen. Im schlimmsten Fall verschlechtert sich aufgrund der reinen Ansammlung von Links sogar die Reputation, die man bisher bei Google und anderen Suchmaschinen genossen hat.

Sitemap nutzen und einbauen

Wer Erfahrung mit dem Codieren von Webdokumenten hat, kann per einfachen Codeschnipsel eine Sitemap erstellen und auf den Server, auf dem sich die Webseite befindet, hochladen. Dies gelingt auch mit den sogenannten Content Management Systemen. Allerdings sind diese eher für Laien gedacht, die ohne großen Kenntnisse Webplattformen aufbauen möchten. Diese Personengruppen haben die Möglichkeit, sogenannte Plug-ins zu nutzen und mit diesen eine Sitemap per Mausklick zu installieren. Dabei ergibt sich der Vorteil, dass man auch das genaue Design und die Inhalte, die in der Sitemap vorzufinden sind, ohne großen zusätzlichen Codeaufwand kreieren bzw. auswählen kann. Sowohl für WordPress als auch für Joomla, Drupal und andere Content Management Systeme findet man solche Plug-ins, die eine Sitemap bereitstellen können. In Hinsicht auf das Sitemap-Protokoll ist zudem anzumerken, dass die Plug-ins, die bei den Content Management Systemen in der Regel verwendet werden, eine automatische Begrenzung von 50.000 Urls aufweisen.

Zusammenfassung

Ein Sitemap ist ein essenzielles Instrument für die Suchmaschinenoptimierung (SEO), das alle Unterseiten einer Webseite in einer Liste anzeigt. Es gibt zwei Haupttypen: die XML-Sitemap, die sich an Suchmaschinen-Crawler richtet und die HTML-Sitemap, die für die Benutzerfreundlichkeit entwickelt wurde. Beide Typen haben spezifische Funktionen und Strukturen, wobei XML strikter ist und HTML mehr Gestaltungsfreiheit bietet.

Die Sitemap-Technologie wurde ursprünglich 2005 von Google eingeführt und ermöglicht es Webcrawlern, den Inhalt einer Webseite effizienter zu erfassen. Sie ist besonders nützlich für Webseiten mit vielen dynamischen Seiten und hilft Suchmaschinen, die Existenz und Aktualisierungen einer Webseite zu erkennen.

Es gibt jedoch Beschränkungen für Sitemaps, darunter eine maximale Anzahl von 50.000 URLs und eine Dateigröße von nicht mehr als 10 MB. Bei Bedarf können mehrere Sitemaps verwendet werden, die in einer Haupt-Sitemap verlinkt sind, um diese Beschränkungen zu umgehen.

Die Robots.txt-Datei spielt ebenfalls eine Rolle bei der Steuerung des Crawlens von Webseiten und kann dazu verwendet werden, bestimmte Inhalte von der Indexierung auszuschließen. In Kombination mit einer Sitemap bietet sie eine robuste Methode zur Steuerung der Sichtbarkeit einer Webseite in Suchmaschinen.

Sitemaps können manuell codiert oder durch Plug-ins in Content-Management-Systemen wie WordPress, Joomla und Drupal erstellt werden. Diese Plug-ins erleichtern den Prozess erheblich und bieten in der Regel eine automatische Begrenzung von 50.000 URLs.

Häufige Fragen und Antworten

Was ist eine Sitemap?

Eine Sitemap ist eine Liste aller Seiten einer Webseite, die für Suchmaschinen-Crawler oder Nutzer öffentlich einsehbar ist. Es gibt zwei Versionen: die XML-Sitemap, die nur von Crawlern gelesen wird, und die HTML-Sitemap, die für Benutzer erstellt wurde.

Welche Bedeutung hat eine Sitemap für die Suchmaschinenoptimierung?

Eine Sitemap dient der Suchmaschinenoptimierung (SEO), da sie den Suchmaschinen-Crawlern hilft, den Inhalt einer Webseite effizienter zu erfassen. Eine gut strukturierte und regelmäßig aktualisierte Sitemap kann dazu beitragen, dass mehr Seiten einer Webseite indexiert werden.

Welche Beschränkungen gibt es bei der Verwendung einer Sitemap?

Bei der Verwendung einer Sitemap gibt es einige Beschränkungen. Zum einen darf eine Sitemap nicht mehr als 50.000 URLs enthalten und die Dateigröße darf 10 MB nicht überschreiten. Um diese Beschränkungen zu umgehen, können mehrere Sitemaps verwendet werden, die in einer Haupt-Sitemap verlinkt sind.

Wie erstellt man eine Sitemap und bindet sie in eine Webseite ein?

Es gibt verschiedene Möglichkeiten, eine Sitemap zu erstellen und in eine Webseite einzubinden. Erfahrene Webentwickler können dies manuell tun, indem sie den entsprechenden Code schreiben und auf den Server hochladen. Für Benutzer ohne Codierungserfahrung stehen jedoch auch viele Plugins für Content Management Systeme wie WordPress, Joomla und Drupal zur Verfügung, mit denen eine Sitemap per Mausklick erstellt und eingebunden werden kann.

Wie kann ich die Sichtbarkeit meiner Webseite in Suchmaschinen steuern?

Die Sichtbarkeit einer Webseite in Suchmaschinen kann durch die Verwendung einer Sitemap und einer robots.txt-Datei gesteuert werden. Eine Sitemap hilft Suchmaschinen-Crawlern, den Inhalt einer Webseite besser zu erfassen, während die robots.txt-Datei Crawlern Anweisungen gibt, welche Seiten und Dateien sie indexieren können. Dadurch kann die Sichtbarkeit von bestimmten Inhalten gesteuert und beeinflusst werden.

Bildnachweis: iStock.com/3283197d_273


Zurück zur Hauptseite: s
Alle Marken, Warenzeichen, Unternehmens- und Produkt-Bezeichnungen sind mit, aber auch ohne definitive Kennzeichnung, Eigentum des Inhabers der Rechte. Alle aufgeführten Elemente dienen lediglich der informativen Beschreibung.