Methodik der SEO-Benchmark-Studien
Diese Seite erklärt, wie die Seitenreport-Benchmark-Daten entstehen, welche Metriken in die Studien einfließen und wo die aktuelle V1 bewusst Grenzen setzt.
Wie ein Benchmark entsteht
Eine Domain wird mit Land, CMS und optionalem Segment in die Benchmark-Datenbank aufgenommen.
Die V1 prüft bis zu 10 wichtige URLs aus der Sitemap. Falls keine Sitemap erreichbar ist, wird die Startseite als Fallback analysiert.
Aus HTML und HTTP-Headern entstehen technische Signale wie Canonical, H1, Security Header, strukturierte Daten und Bildwerte.
Die Werte werden aggregiert und nach Gesamtbasis, Land oder CMS als Vergleichswerte für Studien und Live-Benchmark genutzt.
Warum Sitemap-Stichproben?
Eine Sitemap-Stichprobe zeigt mehr als eine einzelne Startseite: Title, Description, Canonicals, H1, ALT-Abdeckung und strukturierte Daten werden über mehrere wichtige URL-Typen gemittelt. Dadurch entstehen belastbarere Website-Durchschnitte.
Die Einschränkung bleibt sichtbar: 10 URLs sind keine Vollanalyse. Produktseiten, Blogartikel, Kategorieseiten oder Landingpages können eigene Muster haben. Für den schnellen Benchmark ist die Stichprobe aber deutlich aussagekräftiger als eine reine Startseiten-Momentaufnahme.
Wie die URLs ausgewählt werden
Seitenreport liest Sitemap-Hinweise aus robots.txt und typischen Sitemap-Pfaden. Danach werden gleiche Hosts, HTML-nahe URLs und unterschiedliche Pfadbereiche bevorzugt, damit die Stichprobe nicht nur aus sehr ähnlichen URLs besteht.
Gerade bei ALT-Texten, Meta Descriptions, H1-Struktur, Canonicals und strukturierten Daten ist das wertvoll, weil diese Signale je URL stark variieren können.
Welche Metriken ausgewertet werden
Indexierung
Canonical, Meta Robots, X-Robots, HTTPS, Statussignale und Hinweise auf blockierte Zielseiten.
Snippets
Title, Meta Description, Open Graph, Twitter Cards und Längenbereiche für Suchergebnis-Kommunikation.
Content-Struktur
H1, H2, H3, Wortanzahl, Absätze, Listen, Tabellen und HTML-Struktur für bessere Lesbarkeit.
Bilder
Bildanzahl, fehlende ALT-Texte, ALT-Abdeckung und Lazy-Loading-Signale.
Strukturierte Daten
Schema.org-Vorkommen, Typanzahl und erkannte Markup-Klassen wie Organization, WebSite oder Breadcrumb.
Security Header
HSTS, CSP, Referrer-Policy, X-Frame-Options, X-Content-Type-Options und weitere technische Header.
Interpretation
Positive Signale wie Canonical oder HSTS werden anders gelesen als Risikosignale wie noindex. Die Studien nennen deshalb die Leserichtung direkt im Text.
Kleine Segmente
Wenn ein Land, CMS oder Cluster nur wenige Domains enthält, ist der Wert ein Richtungssignal. Die Stichprobe wird sichtbar ausgewiesen.
Praxisbezug
Der Benchmark priorisiert nicht automatisch. Im SEO-Audit wird daraus erst ein konkreter Befund mit URL, Kategorie, Schweregrad und Maßnahme.