Kann mir das einer Erklären!?!
Startbeitrag
Archivierter Thread aus dem Seitenreport-Forum.
Hey @all,
ich hab nach langen mal wieder in meinen WMT geschaut und dabei in den Crawling Statistiken fast einen kleinen schock bekommen!
Siehe hier : www.hopezi.de/google/crawler_statistik.png
Ein völliger Einbruch! Der Crawler besucht meine Seite nicht mehr! Jetzt hab ich wochenlang meine Seite versucht zu optimieren und als ergebnis kommt der crawler nicht mehr!?
Hat da jemand vielleicht eine Erklärung zu?
gruss
werner
Antworten
10 BeiträgeHallo,
ich bin kein Profi in sowas, aber mir stellen sich drei Fragen:
1.) Sind die Besucherzahlen ebenso eingebrochen?
2.) Hat sich etwas gendert im Bezug auf die nderung / Updates / Hinzufgung von neuem Content auf der Seite?
3.) Wird die xml-Datei regelmäßig aktualisiert?
Was mir aufgefallen ist: ber ein halbes MB an Bildern ist zu viel! Ich wrde auf jeden Fall die Datenmenge reduzieren. Obwohl.... nur Seitenreport zeigt die Datenmenge der Lnderflaggen so gro an - in Wirklichkeit sind die winzig. Merkwrdig...
Die Head-Grafik würde ich qualitativ verbessern, auch wenn es ein paar KB mehr werden.
Stimmt, das habe ich auch gesehen - einige sogar mit mehreren Kommata direkt hintereinander:
Die www.hopezi.de/mapde,bauernhof,bayern.xml
ist defakto keine xml datei sondern hat nur die xml extension.
Mal nach g-Crawler goggeln, der macht sitemaps
lillebor schrieb:
hast du schon immer urls mit komma in deiner sitmap?
Das sollte nicht das Problem sein.
"Thus, only alphanumerics, the special characters "$-_.+!*\'(),", and reserved characters used for their reserved purposes may be used unencoded within a URL."
www.w3.org/Addressing/rfc1738.txt
Gérard
Hallo Werner,
in Deiner sitemap.xml steht <lastmod>2009-12-01</lastmod>, was bedeutet, das die Seiten im Dezember das letzte Mal angefasst wurden.
Google legt viel Wert auf Aktualität. Erstelle doch mal eine neue Sitemap und schau, ob der Crawler wieder kommt. Die anderen Sitemaps haben teils ein noch älteres Datum und manche ein Neueres.
Sonst noch als Frage. In den WMT steht ja, wann der Crawler das letzte Mal da war und wieviele Seiten er gescannt hat. Kannst Du uns bitte die Werte mitteilen? Bitte auch, welche Sitemap er laut der robot.txt gezogen hat.
Die Kommas sind außergewöhnlich aber legitim.
Du hast ja ziemlich viele Seiten google zum crawlen angeboten - haben die denn den gleichen Content?
Wenn ja würde es das Desinteresse von google erklären.
Ich denke nicht, dass es mit der xml-sitemap etwas zu tun hat - google crawlt eine Site in den WMT auch ohne xml-sitemap.
Aber eine gut-strukturierte Sitemap kann nur von Vorteil sein.
Gruß,
Claudio.
hallo @all,
dann will ich mal vorne anfangen zu antworten. Also!
@ Infidel
1. Besucherzahlen sind genauso eingebrochen.
2. Ich habe in den letzten wochen das ganze halt versucht zu optimieren also, tabellen raus, nudeln raus,und und und. am Content ändert sich fast täglich was!
3. Die Sitemaps sind dynamisch.
Die Bilder kommen später dran. bin schon am werkeln mit Sprite-Grafiken für die Länder z.b.
@lillebor
Kommas in der URL sind völlig in Ordnung. Die werden sich allerdings noch ändern und kürzer. Die brauche ich zurzeit noch wegen Mod-Rewrite.
@romacron
was ist an der Sitemap falsch??
www.hopezi.de/mapde,bauernhof,bayern.xml Die wird halt dynamisch erstellt. Schau mal in den Quellltext. Oder schaust du die mit FF an. Dann versuch mal mit IE der stellt die richtig dar.
@der_booker
wie meinest du das! Sollte ich das aktuelle Datum einfügen! da die ja dynamisch sind also quasie vom aktuellen tag oder so!?! Wo genau finde ich denn die angaben welche seiten er gescannt hat? Oder meinst du welche sitemap er wann das letzte mal aufgerufen hat.
Also die sitemap.xml Sitemap-Index 05.04.2010
@Passe
Im prinzip hab sehr sehr viele seiten noch fast den gleichen content. Aber wie schon gesagt ich arbeite dran.
Das komische an der geschichte ist ja auch, das mein PR am letzten we gestiegen ist auf 2. Allerdings nur für die Startseite. Also kann es ja so gannz uninterresant nicht sein oder sehe ich das falsch. Dazu kommt das im moment nur Indizierte URLs: 6.697 angezeigt werden. ich kann mich erinnern das es im Dezember letzten Jahres noch weit über 30.000 waren.
Ganz viele fragezeichen in meinem Gesicht!! Sowas soll man verstehen.
gruss
werner
Hallo Werner
www.hopezi.de/suche,bauernhof,europa,deutschland,bayern,Abenberg,91183.htm
hat in deiner Seitemap vor dem Abenberg 2 Kommas! Ich denke damit hat es auch zu tun!
Und dann muss ich Roman beipflichten irgendwas ist an deiner Sitemap nicht in Ordnung!
Warum der Internet Explorer trotz des Fehlers die Sitemap richtig darstellt weiss ich nicht!
Firefox und Opera kommen damit nicht klar!
Meine Sitemap zum Vergleich! prskspedia.de/sitemap.xml
Und Safari und Google Chrome sollte man wohl nicht benutzen um sich eine Sitemap an zu schauen!
Nachtrag: Ausser die Sitemap verfügt über ein Design auf CSS oder XSLT.
2. Nachtrag: Die beiden Tools brachten mich vermutlich auf die Lösung!
http://floern.com/tools/getheader
http://schneegans.de/sv/
ndere bitte mal den Content Type von text/html auf application/xml !
Gruß
Jörg
joerg schrieb:
www.hopezi.de/suche,bauernhof,europa,deutschland,bayern,Abenberg,91183.htm
hat in deiner Seitemap vor dem Abenberg 2 Kommas!
www.hopezi.de/suche,bauernhof,europa,deutschland,bayern,Abenberg,91183.htm
und
www.hopezi.de/suche,bauernhof,europa,deutschland,bayern,,Abenberg,91183.htm
liefern unterschiedliche Seiten. Das sollte insoweit auch so sein, als es zwei unterschiedliche URLs sind. Die mögliche Anzahl von Kommata hintereinander ist nicht beschränkt - aber jeweils eine andere URL.
Gérard