Hallo Jörg,
joerg schrieb:
Ich bin aber von der robots.txt ausgegangen. Aus dem Grunde da die sitemap.xml im Root Verzeichnis keine Standardadresse ist.
Da SR die sitemap Adresse aus der robots.txt liest und sich nicht auf den Namen verlässt, sollte dieser Punkt erledigt sein.
joerg schrieb:
Zuerst einmal die sitemap.xml im Rootverzeichnis kann auch ein Sitemapindex sein.
Das kann bereits mit "einem Blick" in das XML geklärt werden, also nicht weiter tragisch.
joerg schrieb:
Ich generiere dir auch mit PHP mit noch nicht mal 50 Zeilen Code einen Sitemapindex der Tausende von Sitemaps enthält. Dann müsste jede dieser Sitemaps wiederum aufgerufen werden um die Seitenanzahl gesamt zu ermitteln.
Am längsten hierbei dürfte das Laden vom Server dauern. Da aber die SR Analyse in weiten teilen asynchron läuft, sollte das auch kein Problem darstellen.
joerg schrieb:
Bei kleinen Portalen funktioniert das ganze ja noch.
Als ich damit dann mal ein grösseres Portal überprüft habe hat mein PHP Skript dann gestreikt.
Für solche Analysen sollten performante und typsicher Sprachen verwendet werden, und keine interpretierte Skriptsprache. Das ist nicht abwertend gemeint, sondern rein faktisch
joerg schrieb:
Wie würdest du denn den Fall bewerten wenn Seiten zwar im Index bein Yahoo sind aber keine Sitemap gefunden werden kann?
Eben genau so wie jetzt; mit einer fiktiven maximalen Anzahl möglicher indizierter Seiten.
Das sollte aber zweitrangig sein, da ein fehlen einer sitemap.xml bereits ein schlechtes Bewertungskriterium darstellt.
joerg schrieb:
Ausserdem wenn ich richtig informiert bin wird es den Yahoo Site Explorer bald nicht mehr geben. Ab heute wird er nicht mehr gepflegt wenn die Informationen stimmen.
Das habe ich auch schon genau so gehört/gelesen.
Ich will hier keine neue Diskussion lostreten, sondern lediglich aufzeigen, dass die von Thomas, AKA bhvmedia, angesprochene Lösung nicht so kompliziert wäre.
Servus,
Klaus
klaus_b@.NET über alles was an .NET und C# Spass macht.
Beitrag erstellen
EinloggenKostenlos registrieren