XML-Sitemap: Was sie ist, wie du sie erstellst und optimal nutzt
Eine XML-Sitemap ist eine strukturierte Datei, die alle wichtigen URLs deiner Website auflistet. Suchmaschinen wie Google nutzen sie, um deine Inhalte zu finden, zu crawlen und zu indexieren. Sie funktioniert wie ein Inhaltsverzeichnis für Googlebot: präzise, maschinenlesbar und aktuell. Wer Suchsichtbarkeit will, braucht eine.
Was ist eine XML-Sitemap?
Eine XML-Sitemap ist eine Datei im Format Extensible Markup Language. Sie führt alle indexierbaren Seiten deiner Website auf und hilft Suchmaschinen, diese Seiten schneller zu entdecken. Google selbst beschreibt Sitemaps als Dateien, die „Informationen über die Seiten, Videos und andere Dateien auf deiner Website sowie die Beziehungen zwischen ihnen bereitstellen.“ Das Protokoll stammt ursprünglich von Google (2005) und wurde 2006 zusammen mit Yahoo und Microsoft als gemeinsamer Standard auf sitemaps.org veröffentlicht.
Der wichtigste Unterschied: Eine XML-Sitemap richtet sich an Suchmaschinen, eine HTML-Sitemap an menschliche Besucher.
| Merkmal | XML-Sitemap | HTML-Sitemap |
|---|---|---|
| Zielgruppe | Suchmaschinen | Menschliche Besucher |
| Format | XML-Datei | Webseite (HTML) |
| SEO-Wert | Hoch (ermöglicht Indexierung) | Gering bis mittel (interne Links) |
| Pflicht? | Empfohlen für fast alle Websites | Optional |
Wofür Suchmaschinen Sitemaps nutzen:
- Neue oder aktualisierte Seiten schneller entdecken
- Seiten ohne interne Verlinkung (Orphan-Pages) finden
- Crawl-Budget auf wichtige URLs lenken
- Signale für den Zeitpunkt der letzten inhaltlichen Änderung erhalten
Gary Illyes von Google hat Sitemaps als „zweitwichtigste URL-Quelle für Googlebots nach Hyperlinks“ bezeichnet. Das zeigt, welchen Stellenwert eine gut gepflegte Sitemap im Crawling-Prozess hat.
Aufbau einer XML-Sitemap: Struktur und Tags erklärt
Eine XML-Sitemap besteht aus wenigen, klar definierten Tags. Das Grundprinzip ist simpel: ein Wurzelelement umschließt alle URL-Einträge. Jeder Eintrag enthält mindestens die URL selbst und idealerweise das Datum der letzten inhaltlichen Änderung.
Hier ein minimales Beispiel mit zwei URLs:
„`xml
<?xml version=“1.0″ encoding=“UTF-8″?>
<urlset xmlns=“http://www.sitemaps.org/schemas/sitemap/0.9″>
<url>
<loc>https://example.de/ratgeber/</loc>
<lastmod>2026-05-10</lastmod>
</url>
<url>
<loc>https://example.de/ueber-uns/</loc>
<lastmod>2026-03-22</lastmod>
</url>
</urlset>
„`
Die Datei muss in UTF-8 kodiert sein und den sitemaps.org-Namespace referenzieren. Sonderzeichen in URLs müssen maskiert werden: `&` wird zu `&`, `<` zu `<`, `>` zu `>`, `“` zu `"`.
| Tag | Pflicht? | Google-Nutzung |
|---|---|---|
| `<urlset>` | Ja | Wurzelelement, deklariert den XML-Namespace |
| `<url>` | Ja | Container für jeden einzelnen URL-Eintrag |
| `<loc>` | Ja | Die kanonische URL der Seite |
| `<lastmod>` | Empfohlen | Datum der letzten bedeutenden inhaltlichen Änderung |
| `<changefreq>` | Nein | Wird von Google ignoriert |
| `<priority>` | Nein | Wird von Google ignoriert |
Wichtig: `<changefreq>` und `<priority>` werden von Google offiziell ignoriert. Lass sie weg. Sie blähen die Sitemap auf, ohne irgendeinen SEO-Nutzen zu bringen.
Besondere Sorgfalt verdient das `lastmod`-Tag. Viele CMS-Plugins setzen `lastmod` bei jedem Crawl auf das heutige Datum, unabhängig davon, ob sich der Inhalt tatsächlich geändert hat. Google hat dieses Verhalten erkannt und gelernt, unehrliche `lastmod`-Werte zu ignorieren. Aktualisiere `lastmod` deshalb nur, wenn der Inhalt einer Seite wirklich bedeutsam verändert wurde: ein neuer Abschnitt, aktualisierte Zahlen, ein überarbeiteter Hauptteil. Ein Tippfehler korrigieren zählt nicht. Wer `lastmod` ehrlich pflegt, gibt Google ein echtes Signal darüber, welche Seiten frischen Content enthalten. Das beschleunigt den Recrawl-Zyklus für aktualisierte Artikel über Zeit.
Für große Websites mit mehr als 50.000 URLs oder einer Dateigröße über 50 MB musst du eine Sitemap-Index-Datei verwenden. Diese Master-Datei referenziert mehrere einzelne Sitemap-Dateien. Ein typischer Aufbau sieht so aus:
- `sitemap-index.xml` referenziert:
- `sitemap-beitraege.xml` (Blogbeiträge)
- `sitemap-produkte.xml` (Produktseiten)
- `sitemap-seiten.xml` (statische Seiten)
Das erleichtert auch die Fehlersuche in der Google Search Console, weil du Indexierungsprobleme nach Inhaltstyp aufschlüsseln kannst. Ein Shop, der merkt, dass Produktseiten kaum indexiert werden, erkennt das Problem sofort, wenn Produkte in einer eigenen Sitemap-Datei geführt werden.
Warum eine XML-Sitemap für SEO wichtig ist
Eine XML-Sitemap verbessert dein Ranking nicht direkt. Was sie tut: Sie stellt sicher, dass deine Seiten überhaupt indexiert werden. Eine nicht indexierte Seite kann nicht ranken. Das macht die Sitemap zur Grundvoraussetzung für Suchsichtbarkeit, nicht zum optionalen Extra.
Schnellere Indexierung
Wenn du neuen Content veröffentlichst, kann es Tage oder Wochen dauern, bis Google ihn über normale Link-Crawling-Pfade entdeckt. Ein korrektes `lastmod`-Datum in deiner Sitemap signalisiert Google, dass sich etwas geändert hat. Einen erneuten Crawl lohnt es sich dann. Das beschleunigt den Entdeckungszyklus erheblich, besonders auf Websites mit regelmäßigen Veröffentlichungen.
Google selbst hält in seiner Dokumentation fest, dass Sitemaps besonders wertvoll für neue Websites ohne viele externe Links sind. Googlebot hat dann schlicht weniger Signale, denen er beim Crawlen folgen kann. Eine Sitemap schließt diese Lücke. Selbst wenn noch kaum externe Seiten darauf verlinken, weiß Googlebot, welche URLs existieren.
Orphan-Pages entdecken
Eine Orphan-Page ist eine Seite ohne interne Verlinkungen. Googlebot kann sie über normales Link-Crawling nicht finden, weil schlicht keine Links dorthin führen. Eine Sitemap löst dieses Problem, indem sie solche Seiten explizit auflistet. Das ist besonders relevant nach Website-Migrationen, bei Bulk-Content-Uploads oder wenn die interne Verlinkung lückenhaft ist. Wer seine Orphan-Pages kennen will, vergleicht die Sitemap-URLs mit dem Crawl-Ergebnis eines Tools wie Screaming Frog. Seiten, die nur in der Sitemap auftauchen, aber nicht im internen Verlinkungsnetz, sind Kandidaten für bessere interne Verlinkung.
Crawl-Budget lenken
Crawl-Budget bezeichnet die Anzahl an Seiten, die Google bereit ist, deine Website innerhalb eines bestimmten Zeitraums zu crawlen. Auf großen Websites mit Zehntausenden von Seiten ist das eine echte Ressource. Sorgfalt zahlt sich hier aus.
Ein typisches Beispiel: Ein Online-Shop für Kleidung generiert durch Facetten-Navigation potenziell Millionen von URL-Kombinationen. Filter für Farbe, Größe und Preis multiplizieren sich schnell. Ohne saubere Sitemap-Verwaltung verbringt Googlebot sein gesamtes Crawl-Budget auf diesen nahezu identischen Filter-URLs und vernachlässigt die eigentlichen Produkt- und Kategorieseiten. Eine Sitemap, die ausschließlich kanonische Produkt- und Kategorieseiten aufführt, löst dieses Problem ohne zusätzliche Serverkonfiguration.
Sitemap ist besonders kritisch, wenn deine Website neu ist und kaum Backlinks hat, du mehr als einige Hundert Seiten betreibst, oder deine interne Verlinkung unvollständig ist.
AI Overviews und Indexierung
AI-gestützte Suchfunktionen wie Googles AI Overviews basieren auf indexierten Inhalten. Eine Seite, die nicht indexiert ist, kann in KI-generierten Antworten nicht erscheinen. Kurz gesagt: Wer nicht im Index ist, existiert für KI nicht. Sitemaps stellen sicher, dass deine Inhalte überhaupt in die Indexierung gelangen. Das macht sie zu einem indirekten, aber relevanten Faktor für die Sichtbarkeit in KI-Suchergebnissen.
Yoast hat darauf hingewiesen, dass AI-Suche zwar anders funktioniert als klassische Keyword-Suche, aber weiterhin auf dem zugrundeliegenden Index aufbaut. Für Content-Ersteller, die auf Sichtbarkeit in KI-Überblicken abzielen, ist eine saubere Sitemap kein Luxus, sondern Pflicht.
Was gehört in deine XML-Sitemap und was nicht
Nicht jede URL auf deiner Website gehört in die Sitemap. Schlechte Sitemap-Hygiene sendet widersprüchliche Signale an Google und verschwendet Crawl-Budget. Das Grundprinzip: In der Sitemap stehen nur Seiten, die du aktiv indexiert haben möchtest und die Google einen Mehrwert bieten. Alles andere schadet mehr als es nützt.
Immer einschließen:
- Kanonische, indexierbare Seiten mit HTTP-Status 200
- Seiten, für die du in den Suchergebnissen ranken möchtest
- Seiten mit einzigartigem, wertvollem Content
- Neu veröffentlichte Seiten, die schnell indexiert werden sollen
- Orphan-Pages ohne ausreichende interne Verlinkung
| Was ausschließen | Warum |
|---|---|
| Noindex-Seiten | Widerspruch: Sitemap sagt „indexier mich“, Noindex sagt „tu es nicht“ |
| Weiterleitungs-URLs | Google folgt der Weiterleitung ohnehin; die Quell-URL aufzuführen verschwendet Ressourcen |
| 404-Seiten | Defekte URLs schaden der Qualität deiner Sitemap |
| Duplikate | Nur die kanonische Version aufnehmen, nicht Duplikate |
| Parameter-URLs | Facetten-Navigation, Session-IDs und Tracking-Parameter erzeugen URL-Inflation |
| Tag- und Kategorie-Archive | Meist dünner Content mit geringem Ranking-Potenzial |
| Danke- und Login-Seiten | Nicht für die Suche gedacht |
| Staging- und Dev-URLs | Dürfen niemals in einer Produktions-Sitemap auftauchen |
Achtung bei Noindex-Seiten in der Sitemap: Das ist ein direkter Widerspruch. Die Sitemap sagt „bitte indexier diese Seite“, das Noindex-Tag sagt das Gegenteil. Google respektiert in der Regel das Noindex-Tag, aber der Widerspruch kann über Zeit das Vertrauen in deine gesamte Sitemap beschädigen. Jede Noindex-Seite in der Sitemap signalisiert schlechte Pflege. Es ist einer der häufigsten technischen SEO-Fehler überhaupt. Er entsteht meist, weil Seiten nachträglich auf Noindex gesetzt werden, ohne dass jemand die Sitemap entsprechend bereinigt.
XML-Sitemap erstellen: WordPress, andere CMS und programmatisch
Die einfachste Methode ist ein CMS-Plugin oder eine integrierte Funktion deiner Plattform. Diese Lösungen generieren Sitemaps dynamisch, also immer aktuell und nach Best Practices.
WordPress mit Yoast SEO
Gehe zu SEO > Allgemein > Funktionen > XML-Sitemaps aktivieren (Toggle einschalten). Deine Sitemap ist danach erreichbar unter: `yourdomain.com/sitemap_index.xml`. Yoast schließt Noindex-Inhalte automatisch aus und aktualisiert `lastmod`, wenn Beiträge gespeichert werden.
WordPress mit Rank Math
Gehe zu Rank Math > Sitemap-Einstellungen und konfiguriere, welche Beitragstypen enthalten sein sollen. Sitemap-URL: `yourdomain.com/sitemap_index.xml`. Auch Rank Math schließt Noindex-Content automatisch aus.
| CMS | Plugin / Integriert | Sitemap-URL |
|---|---|---|
| WordPress + Yoast SEO | Plugin (kostenlos) | `/sitemap_index.xml` |
| WordPress + Rank Math | Plugin (kostenlos) | `/sitemap_index.xml` |
| Shopify | Integriert (automatisch) | `/sitemap.xml` |
| Wix | Integriert (automatisch) | Verwaltet über SEO-Einstellungen |
| Squarespace | Integriert (automatisch) | `/sitemap.xml` |
Online-Generatoren
Für kleine statische Websites mit weniger als ca. 200 Seiten eignen sich Online-Tools wie XML-Sitemaps.com oder der kostenlose Crawl von Screaming Frog. Du gibst deine Domain ein, das Tool crawlt alle erreichbaren Seiten und generiert eine fertige XML-Datei. Diese lädst du dann manuell auf deinen Server hoch, typischerweise ins Stammverzeichnis unter `sitemap.xml`. Der Nachteil: Bei jeder Content-Änderung musst du sie manuell neu generieren und hochladen. Auf aktiven Websites mit regelmäßigen Veröffentlichungen ist das schnell fehleranfällig.
Programmatisch
Für individuelle oder Headless-Websites generierst du die Sitemap direkt aus deinem Framework. Achte darauf, `lastmod` aus echten Datenbank-Timestamps zu befüllen, nicht aus dem Build-Datum:
- Next.js: `next-sitemap`-Paket, konfigurierbar in `next-sitemap.config.js`
- Node.js: `sitemap`-npm-Paket, Sitemap als Server-Route oder Build-Artefakt
- Django: `django.contrib.sitemaps`, generiert Sitemap-Views direkt aus dem ORM
Tipp: Eine dynamische Sitemap ist einer statischen immer überlegen. Sie ist bei jedem Abruf aktuell, weil sie aus dem echten Zustand deiner Website generiert wird. Statische Sitemaps veralten sofort, sobald du neuen Content veröffentlichst oder alte Seiten löschst. Auf jeder Website mit regelmäßigem Content-Betrieb lohnt sich der Aufwand für eine statische Sitemap schlicht nicht.
XML-Sitemap bei Google einreichen und in robots.txt eintragen
Eine fertige Sitemap, die auf deinem Server liegt, aber nirgendwo eingereicht ist, funktioniert trotzdem. Googlebot findet sie über den robots.txt-Eintrag oder durch den Sitemap-Ping. Das Einreichen in der Google Search Console liefert dir aber zusätzlich laufende Monitoring-Daten zum Indexierungsstatus. Außerdem zeigt es dir Fehler, die du sonst nicht bemerken würdest. Es ist der eine extra Schritt, der sich immer lohnt. Deine Website muss bereits in der Search Console verifiziert sein, bevor du eine Sitemap einreichen kannst.
- Öffne die Google Search Console und wähle deine Property.
- Klicke im linken Menü unter „Indexierung“ auf „Sitemaps“.
- Gib im Feld „Neue Sitemap hinzufügen“ deine Sitemap-URL ein, zum Beispiel `sitemap_index.xml`.
- Klicke auf „Einreichen“.
- Warte einige Minuten bis Stunden, bis Google die Sitemap verarbeitet hat.
- Überprüfe die Statusspalte: „Erfolgreich“ bedeutet, Google hat die Sitemap eingelesen. Die Anzahl der „gefundenen URLs“ zeigt, wie viele URLs erkannt wurden.
Zusätzlich solltest du deine Sitemap-URL in der `robots.txt` deiner Website eintragen. Das stellt sicher, dass jeder Crawler sie findet, nicht nur Google:
„`
Sitemap: https://deinedomain.de/sitemap_index.xml
„`
Du kannst Google auch direkt anpingen, ohne die Search Console zu nutzen, indem du folgende URL in deinem Browser oder per Skript aufrufst:
„`
https://www.google.com/ping?sitemap=https://deinedomain.de/sitemap_index.xml
„`
Dieser Ping ist nützlich nach größeren Content-Updates. Das laufende Monitoring in der Search Console ersetzt er nicht.
Vergiss Bing nicht: Bing Webmaster Tools akzeptiert Sitemaps ebenfalls. Die Option findest du unter Einstellungen > Sitemaps. Der Schritt dauert zwei Minuten und erschließt dir zusätzlichen organischen Traffic, den viele Webmaster routinemäßig ignorieren.
Häufige XML-Sitemap-Fehler und wie du sie behebst
Eine nie auditierte Sitemap enthält fast immer Probleme. Auf Websites mit regelmäßigen Content-Änderungen addieren sich kleine Fehler über Zeit zu ernsthaften Indexierungsproblemen.
| Fehler | Ursache | Lösung |
|---|---|---|
| Noindex-Seiten in Sitemap | Plugin schließt Noindex-Seiten nicht aus | Alle Seiten mit `noindex`-Tag aus der Sitemap entfernen |
| Weiterleitungs-URLs | Alte URLs nach Umstrukturierungen nicht entfernt | Nur Ziel-URLs aufnehmen, Quell-URLs entfernen |
| 404-URLs | Gelöschte Seiten nie aus der Sitemap entfernt | Defekte URLs identifizieren und entfernen |
| HTTP statt HTTPS | Sitemap referenziert HTTP-URLs, Website läuft auf HTTPS | Alle URLs auf HTTPS aktualisieren |
| Falscher Namespace | Fehlerhaftes oder fehlendes `xmlns`-Attribut | Namespace auf `http://www.sitemaps.org/schemas/sitemap/0.9` setzen |
| Leere Sitemap | Plugin-Konfiguration zu restriktiv oder kein Content vorhanden | Plugin-Einstellungen prüfen, Beitragstypen aktivieren |
| Fehlende neue Seiten | Statische Sitemap nicht aktualisiert oder falsches Post-Type-Setting | Dynamische Sitemap verwenden oder nach jedem Publish aktualisieren |
Monitoring in der Google Search Console
Der Sitemaps-Bericht in der Google Search Console zeigt drei zentrale Kennzahlen:
- Eingereichte URLs: Gesamtanzahl der URLs, die Google in deiner Sitemap gefunden hat
- Indexierte URLs: Wie viele davon erfolgreich indexiert wurden
- Fehler: Konkrete Probleme beim Parsen oder Crawlen der Sitemap-URLs
Eine große Lücke zwischen eingereichten und indexierten URLs ist häufig. Sie zeigt nicht zwingend ein Sitemap-Problem, kann aber auf dünnen Content, Duplicate-Content, versehentliche Noindex-Tags oder robots.txt-Sperren hinweisen. Die Lücke ist ein guter Startpunkt für die Fehlersuche. Einzelne URLs lassen sich im URL-Prüftool der Search Console detailliert analysieren. Google zeigt an, ob die Seite gecrawlt wurde, wann das letzte Crawling stattfand und welche Indexierungsrichtlinie aktuell gilt.
Hast du deine Website kürzlich migriert oder deine URL-Struktur geändert, reiche die aktualisierte Sitemap sofort nach Abschluss der Migration neu ein. Beobachte den Sitemaps-Bericht in den ersten zwei Wochen täglich. Migrations-bedingte Sitemap-Probleme, etwa alte URLs, die noch neben ihren Weiterleitungszielen in der Sitemap auftauchen, lassen sich früh erkennen. Wer aktiv hinschaut, behebt sie einfach.
Zeichen, dass deine Sitemap funktioniert:
- Die Anzahl indexierter Seiten in der Search Console steigt nach neuen Veröffentlichungen
- Neue Seiten erscheinen innerhalb weniger Tage in den Suchergebnissen
- Geringe Fehleranzahl im Sitemaps-Bericht
- Die Lücke zwischen eingereichten und indexierten URLs liegt unter 10 bis 15 Prozent und ist stabil
Monatliche Sitemap-Checkliste:
- Sitemaps-Bericht in der Search Console auf Fehler prüfen
- Anzahl eingereichte vs. indexierte URLs mit dem Vormonat vergleichen
- Überprüfen, ob neu veröffentlichte Seiten in der Sitemap erscheinen
- Stichprobenhaft URLs aus der Sitemap im URL-Prüftool der Search Console testen
- Nach größeren Content-Löschungen oder URL-Umstrukturierungen Sitemap neu einreichen
—
Verbessert eine XML-Sitemap mein Ranking?
Nicht direkt. Eine Sitemap sendet keine Ranking-Signale an Google. Was sie tut: Sie ermöglicht die Indexierung von Seiten, die sonst möglicherweise übersehen würden. Eine nicht indexierte Seite kann grundsätzlich nicht ranken. In diesem Sinne ist die Sitemap eine Voraussetzung für Rankings, kein Verstärker. Die eigentliche Ranking-Arbeit leisten weiterhin Content-Qualität, Relevanz und Backlinks.
Brauche ich eine Sitemap für eine kleine Website?
Google empfiehlt Sitemaps besonders für Websites mit mehr als 500 Seiten, neue Domains mit wenigen externen Links und Websites mit reichhaltigem Media-Content. Hat deine Website weniger als 500 gut verlinkte Seiten, kommst du auch ohne aus. Da eine dynamische Sitemap mit den meisten CMS-Tools kostenlos und automatisch erstellt wird, gibt es aber kaum einen Grund, darauf zu verzichten.
Wie oft sollte ich meine Sitemap aktualisieren?
Bei einer dynamischen Sitemap, die dein CMS automatisch generiert, brauchst du nichts zu tun. Sie aktualisiert sich bei jeder Veröffentlichung und jedem Content-Update von selbst. Bei einer statischen Sitemap musst du sie manuell aktualisieren, sobald du eine neue Seite hinzufügst, eine Seite löschst oder eine URL änderst.
Wie groß darf eine XML-Sitemap sein?
Jede einzelne Sitemap-Datei darf maximal 50.000 URLs oder 50 MB umfassen, je nachdem, welche Grenze zuerst erreicht wird. Übersteigt deine Website diese Grenzen, erstellst du eine Sitemap-Index-Datei, die mehrere einzelne Sitemaps referenziert, die jeweils unter dem Limit bleiben.
Warum werden manche meiner Sitemap-Seiten nicht indexiert?
Die Indexierung liegt immer in Googles Ermessen. Eine URL in der Sitemap aufzuführen ist eine Anfrage, kein Befehl. Mögliche Gründe für fehlende Indexierung: dünner oder doppelter Content, Qualitätsprobleme, versehentlich gesetzter Noindex-Tag, robots.txt-Sperre oder schlicht Googles Entscheidung, die Seite für nicht indexierungswürdig zu halten. Das URL-Prüftool in der Search Console gibt dir Detailinformationen zu einzelnen Seiten.
Garantiert Google die Indexierung meiner Sitemap-URLs?
Nein. Googles eigene Dokumentation hält fest, dass das Einreichen einer Sitemap „nicht garantiert, dass alle Elemente in deiner Sitemap gecrawlt und indexiert werden.“ Eine Sitemap erhöht die Wahrscheinlichkeit und Geschwindigkeit der Entdeckung, aber Google behält immer das letzte Wort darüber, was indexiert wird.