gelöschter Benutzer

XML-Sitemap (Seite 4)


klaus_b
Avatar klaus_b
Er ernährt mich ;-)
Content Meister (328 Beiträge)
am 16.04.2010, 11:39 Uhr schrieb klaus_b

Hallo Fritz,

georg123 schrieb:
<snip>
Bei xml werden es mehr Indexierungen, bei txt weniger, heute z.B. nur noch 2 Indexierungen!

Das XML-Format für sitemap-Dateien ist exakt definiert und standardisiert. Das txt-Format lediglich ein Zugeständniss. Wenn deine Domain jetzt sowohl xml als auch txt anbietet, beide mit dem selben Inhalt, was wird dann wohl bevorzugt?

Servus,
Klaus


klaus_b@.NET über alles was an .NET und C# Spass macht.

georg123
Avatar georg123
Diplomökonom (Pensionär)
Content Halbgott (569 Beiträge)
am 16.04.2010, 12:55 Uhr schrieb georg123

klaus_b schrieb:

Hallo Fritz,

georg123 schrieb:
<snip>
Bei xml werden es mehr Indexierungen, bei txt weniger, heute z.B. nur noch 2 Indexierungen!

Das XML-Format für sitemap-Dateien ist exakt definiert und standardisiert. Das txt-Format lediglich ein Zugeständniss. Wenn deine Domain jetzt sowohl xml als auch txt anbietet, beide mit dem selben Inhalt, was wird dann wohl bevorzugt?

Servus,
Klaus



Hallo Klaus, Deine Gegenfrage geht an meiner Frage vorbei. Du hast eine Vermutung als Erklärung, die nicht überzeugen kann:
Meine beiden sitemaps haben seit vielen Monaten die gleichen Dateien als Inhalt. Die xml habe ich so bearbeitet, dass nur ganz wenige Dateien täglich besucht werden sollen, die Masse nur monatlich. Bis vor etwa 4 Wochen waren in beiden sitemaps gleichviel Dateien indexiert, dann fiel die Zahl bei der txt langsam, heute bis hinab auf noch 2. Bei xml stiegen die Indexierungen.
Warum soll die txt ein "Zugeständnis" sein? Warum ist sie dann überhaupt in den WMT?
Meine Frage bleibt also- sie mag akademisch klingen. Fritz


http://georg-hh.freimaurerei.de

Freiheit-Gleichheit-Brüderlichkeit, Toleranz und Humanität:
Dafür stehen und danach streben Freimaurer

klaus_b
Avatar klaus_b
Er ernährt mich ;-)
Content Meister (328 Beiträge)
am 16.04.2010, 13:36 Uhr schrieb klaus_b

Hallo Fritz,

georg123 schrieb:
Deine Gegenfrage geht an meiner Frage vorbei. Du hast eine Vermutung als Erklärung, die nicht überzeugen kann:

Dann werde ich mir jetzt Mühe geben, deinen Anforderungen gerecht zu werden.

georg123 schrieb:
<snip>Meine beiden sitemaps haben seit vielen Monaten die gleichen Dateien als Inhalt. Die xml habe ich so bearbeitet, dass nur ganz wenige Dateien täglich besucht werden sollen, die Masse nur monatlich.

Was du in deiner sitemap als Besuchshäufigkeit angiebst, ist und bleibt ein Wunsch deinerseits an den Bot. Wie oft er tatsächlich vorbeischaut, bestimmt ein Algorithmus des SuMa-Betreibers.

georg123 schrieb:
Bis vor etwa 4 Wochen waren in beiden sitemaps gleichviel Dateien indexiert, dann fiel die Zahl bei der txt langsam, heute bis hinab auf noch 2. Bei xml stiegen die Indexierungen.

Da hat der Bot wahrscheinlich erkannt, dass beide Dateien den selben Inhalt bieten. ER benötigt die Aufzählung der enthaltenen Seiten allerdings nur einmal. Also entscheidet er sich für das zu validierenden Format. Das kann nur XML sein.

georg123 schrieb:
Warum soll die txt ein "Zugeständnis" sein? Warum ist sie dann überhaupt in den WMT?

Sie ist ein zugeständis an Seitenbetreiber, die nicht so ohne witeres in der Lage sind, ein valides XML-Dokument zu erzeugen. Genau aus diesem Grund wurde die Möglichkeit in den WMT geschaffen, auch txt Dateien anzugeben.

XML ist einfach der Standard zur Kommunikation für Maschinen, wenn der Mensch auch noch ein wenig mitlesen soll. XML wird über DTD, Namensräume und Styles einwandfrei definiert. txt kann irgend etwas sein. Eine XML Datei kann mit wenig Aufwand sauber geparst und der Inhalt typgerecht verarbeitet werden. Bei txt muss die Fehlertoleranz höher angesetzt werden, da hier je nach Format die Steuerzeichen anders aussehen können. XML wird in der Regel UTF-8 codiert. txt-Dateien können unter Verwendung der unterschiedlichsten Ländercodes erstellt worden sein.
Muss ich noch mehr Vergleiche anstellen?

Wenn jetzt ein Bot, der ja eine Maschine representiert, die Wahl zwischen txt und xml hat, wird er immer xml vorziehen. Jetzt stellt der Bot fest, dass sowohl txt als auch xml den selben Inhalt aufweisen. Also wird mit hoher Wahrscheinlichkeit die txt Datei in Zukunft nicht mehr verwendet, da die xml Datei ja standardkonformität gewährleistet und typsicher verarbeitet werden kann.

georg123 schrieb:
Bis vor etwa 4 Wochen waren...

Nichts ist so alt, wie der Status von gestern

Servus,
Klaus


klaus_b@.NET über alles was an .NET und C# Spass macht.

georg123
Avatar georg123
Diplomökonom (Pensionär)
Content Halbgott (569 Beiträge)
am 16.04.2010, 14:45 Uhr schrieb georg123

klaus_b schrieb:


Wenn jetzt ein Bot, der ja eine Maschine representiert, die Wahl zwischen txt und xml hat, wird er immer xml vorziehen. Jetzt stellt der Bot fest, dass sowohl txt als auch xml den selben Inhalt aufweisen. Also wird mit hoher Wahrscheinlichkeit die txt Datei in Zukunft nicht mehr verwendet, da die xml Datei ja standardkonformität gewährleistet und typsicher verarbeitet werden kann.


Hallo Klaus, das Fazit Deiner Informationen/Ãœberlegungen, danke, von mir noch ein wenig extrapoliert:
Der Bot wird vermutlich künftig den Inhalt meiner sitemap.txt überhaupt nicht mehr indexieren, sie sogar gar nicht mehr untersuchen- bis vor wenigen Tagen war er noch fleißig dabei...
Eben diese Tendenz vermutete auch ich.
Meine "akademische" Frage läuft darauf hinaus, weil es ja FaGoogle ist, die dem Bot sagt, was er machen soll: Wollen die Googler Bot-Kapazitäten, SEIT WENIGEN TAGEN, schonen??
Vielleicht weil sie in den WMT jetzt so aufwendige Neuheiten anbieten???
???
Ãœbrigens: Wenn ich in der xml monatlichen Besuch eintrage, weiß ich, dass der Bot sich daran nicht halten muss, dass dies ein Wunsch ist. Ich vermute aber, er nimmt das gerne zur Kenntnis, ist für ihn einfach ökonomischer. Sich daily-Besuche zu wünschen ist wohl wirklich Wunschdenken- Googlebot hustet mir was...

Ich warte, ob im Forum überhaupt Interesse an dieser Neuerung besteht, ob Andere Ähnliches beobachten. Sobald meine sitemap.txt überhaupt nicht mehr besucht wird melde ich mich wieder zum Thema. Fritz


http://georg-hh.freimaurerei.de

Freiheit-Gleichheit-Brüderlichkeit, Toleranz und Humanität:
Dafür stehen und danach streben Freimaurer

joerg
Avatar joerg
Fachinformatiker Anwendungsentwicklung
Content Gott (1941 Beiträge)
am 16.04.2010, 18:11 Uhr schrieb joerg

Hallo Fritz

Die letzte Änderung an deinen Seiten hat laut Sitemap am 25.03. stattgefunden.

Die Sitemap hat also keine neuen Informationen für den Googlebot greifbar!

Wahrscheinlich würde die Sitemap abgefragt. Es liegen keine neue Daten vor war dann das Ergebnis!

Das würde ich eher als die Ursache ansehen!

Also meiner Ansicht nach kein Grund besorgt zu sein!

Gruß
Jörg


Zufällige Umleitung zu der Startseite einer meiner Domains
Meine ungewöhnlichen Tools

georg123
Avatar georg123
Diplomökonom (Pensionär)
Content Halbgott (569 Beiträge)
am 16.04.2010, 18:44 Uhr schrieb georg123

joerg schrieb:

Hallo Fritz
Also meiner Ansicht nach kein Grund besorgt zu sein!

Gruß
Jörg


Danke, Jörg- aber ich bin doch unbesorgt, so begann ich:
"Seit etwa 4 Wochen habe ich meine sitemap.xml UND die sitemap.txt nicht angefasst. Seit der neuen Anzeige in den WMT beobachte ich, dass sich die Zahl der angezeigten indizierten Seiten, die für beide sitemaps bislang, wie die Zahl der Dateien im Inhalt, identisch waren, auseinander entwickeln:
Bei xml werden es mehr Indexierungen, bei txt weniger, heute z.B. nur noch 2 Indexierungen!
Ich habe keine Sorgen, da der Kontrollbefehl site:meine.subdomain.de inzwischen alle Unterseiten zeigt, relativ aktuell gecached.
Dennoch: Wer kann das Phänomen interpretieren?"
Diese absolut neue Masche von GOO hinterfrage ich- wohlwissend, dass keiner von uns Matt Cutts ist. Also muss ich darauf warten, dass ein Anderer im SR-Forum sich auch wundert, auch neugierig nachfragt, oder bis meine sitemap.txt aus den WMT verschwindet. Fritz



http://georg-hh.freimaurerei.de

Freiheit-Gleichheit-Brüderlichkeit, Toleranz und Humanität:
Dafür stehen und danach streben Freimaurer



« zurück zu: Sonstige

Das Seitenreport Forum hat aktuell 5276 Themen und 36111 Beiträge.
Insgesamt sind 48364 Mitglieder registriert.