Hallo Fritz,
georg123 schrieb:
Deine Gegenfrage geht an meiner Frage vorbei. Du hast eine Vermutung als Erklärung, die nicht überzeugen kann:
Dann werde ich mir jetzt Mühe geben, deinen Anforderungen gerecht zu werden.
georg123 schrieb:
<snip>Meine beiden sitemaps haben seit vielen Monaten die gleichen Dateien als Inhalt. Die xml habe ich so bearbeitet, dass nur ganz wenige Dateien täglich besucht werden sollen, die Masse nur monatlich.
Was du in deiner sitemap als Besuchshäufigkeit angiebst, ist und bleibt ein Wunsch deinerseits an den Bot. Wie oft er tatsächlich vorbeischaut, bestimmt ein Algorithmus des SuMa-Betreibers.
georg123 schrieb:
Bis vor etwa 4 Wochen waren in beiden sitemaps gleichviel Dateien indexiert, dann fiel die Zahl bei der txt langsam, heute bis hinab auf noch 2. Bei xml stiegen die Indexierungen.
Da hat der Bot wahrscheinlich erkannt, dass beide Dateien den selben Inhalt bieten. ER benötigt die Aufzählung der enthaltenen Seiten allerdings nur einmal. Also entscheidet er sich für das zu validierenden Format. Das kann nur XML sein.
georg123 schrieb:
Warum soll die txt ein "Zugeständnis" sein? Warum ist sie dann überhaupt in den WMT?
Sie ist ein zugeständis an Seitenbetreiber, die nicht so ohne witeres in der Lage sind, ein valides XML-Dokument zu erzeugen. Genau aus diesem Grund wurde die Möglichkeit in den WMT geschaffen, auch txt Dateien anzugeben.
XML ist einfach der Standard zur Kommunikation für Maschinen, wenn der Mensch auch noch ein wenig mitlesen soll. XML wird über DTD, Namensräume und Styles einwandfrei definiert. txt kann irgend etwas sein. Eine XML Datei kann mit wenig Aufwand sauber geparst und der Inhalt typgerecht verarbeitet werden. Bei txt muss die Fehlertoleranz höher angesetzt werden, da hier je nach Format die Steuerzeichen anders aussehen können. XML wird in der Regel UTF-8 codiert. txt-Dateien können unter Verwendung der unterschiedlichsten Ländercodes erstellt worden sein.
Muss ich noch mehr Vergleiche anstellen?
Wenn jetzt ein Bot, der ja eine Maschine representiert, die Wahl zwischen txt und xml hat, wird er immer xml vorziehen. Jetzt stellt der Bot fest, dass sowohl txt als auch xml den selben Inhalt aufweisen. Also wird mit hoher Wahrscheinlichkeit die txt Datei in Zukunft nicht mehr verwendet, da die xml Datei ja standardkonformität gewährleistet und typsicher verarbeitet werden kann.
georg123 schrieb:
Bis vor etwa 4 Wochen waren...
Nichts ist so alt, wie der Status von gestern
Servus,
Klaus
klaus_b@.NET über alles was an .NET und C# Spass macht.
Beitrag erstellen
EinloggenKostenlos registrieren