Transparent ausgewertet Stand: 23.06.2026

Methodik der SEO-Benchmark-Studien

Diese Seite erklärt, wie die Seitenreport-Benchmark-Daten entstehen, welche Metriken in die Studien einfließen und wo die aktuelle V1 bewusst Grenzen setzt.

Wie ein Benchmark entsteht

1. Domain erfassen

Eine Domain wird mit Land, CMS und optionalem Segment in die Benchmark-Datenbank aufgenommen.

2. Sitemap-Stichprobe crawlen

Die V1 prüft bis zu 10 wichtige URLs aus der Sitemap. Falls keine Sitemap erreichbar ist, wird die Startseite als Fallback analysiert.

3. Metriken extrahieren

Aus HTML und HTTP-Headern entstehen technische Signale wie Canonical, H1, Security Header, strukturierte Daten und Bildwerte.

4. Baselines bilden

Die Werte werden aggregiert und nach Gesamtbasis, Land oder CMS als Vergleichswerte für Studien und Live-Benchmark genutzt.

Warum Sitemap-Stichproben?

Eine Sitemap-Stichprobe zeigt mehr als eine einzelne Startseite: Title, Description, Canonicals, H1, ALT-Abdeckung und strukturierte Daten werden über mehrere wichtige URL-Typen gemittelt. Dadurch entstehen belastbarere Website-Durchschnitte.

Die Einschränkung bleibt sichtbar: 10 URLs sind keine Vollanalyse. Produktseiten, Blogartikel, Kategorieseiten oder Landingpages können eigene Muster haben. Für den schnellen Benchmark ist die Stichprobe aber deutlich aussagekräftiger als eine reine Startseiten-Momentaufnahme.

Wie die URLs ausgewählt werden

Seitenreport liest Sitemap-Hinweise aus robots.txt und typischen Sitemap-Pfaden. Danach werden gleiche Hosts, HTML-nahe URLs und unterschiedliche Pfadbereiche bevorzugt, damit die Stichprobe nicht nur aus sehr ähnlichen URLs besteht.

Gerade bei ALT-Texten, Meta Descriptions, H1-Struktur, Canonicals und strukturierten Daten ist das wertvoll, weil diese Signale je URL stark variieren können.

Welche Metriken ausgewertet werden

Indexierung

Canonical, Meta Robots, X-Robots, HTTPS, Statussignale und Hinweise auf blockierte Zielseiten.

Snippets

Title, Meta Description, Open Graph, Twitter Cards und Längenbereiche für Suchergebnis-Kommunikation.

Content-Struktur

H1, H2, H3, Wortanzahl, Absätze, Listen, Tabellen und HTML-Struktur für bessere Lesbarkeit.

Bilder

Bildanzahl, fehlende ALT-Texte, ALT-Abdeckung und Lazy-Loading-Signale.

Strukturierte Daten

Schema.org-Vorkommen, Typanzahl und erkannte Markup-Klassen wie Organization, WebSite oder Breadcrumb.

Security Header

HSTS, CSP, Referrer-Policy, X-Frame-Options, X-Content-Type-Options und weitere technische Header.

Interpretation

Positive Signale wie Canonical oder HSTS werden anders gelesen als Risikosignale wie noindex. Die Studien nennen deshalb die Leserichtung direkt im Text.

Kleine Segmente

Wenn ein Land, CMS oder Cluster nur wenige Domains enthält, ist der Wert ein Richtungssignal. Die Stichprobe wird sichtbar ausgewiesen.

Praxisbezug

Der Benchmark priorisiert nicht automatisch. Im SEO-Audit wird daraus erst ein konkreter Befund mit URL, Kategorie, Schweregrad und Maßnahme.