Ultima schrieb:
Wie viel Prozent sind das den?
Bei meinen Seiten schwankt der Anteil an Indizierten Seiten immer zwischen 30% und rund 95%.
Und wie Prüfst du das, über die WMT oder die Option link: bei der Suche wenn man jetzt von Google ausgeht.
Ãœber die Prozente kann ich pauschal nix sagen, denn dafür gibt es keinen Vergleichswert. Das kann bei jedem unterschiedlich sein. Wenn Du bei Google suchen willst, dann bitte nicht mit link: sondern mit site:, wobei beide Suchergebnisse nicht stimmig sind. Warum? Da kommt noch der Faktor Aktualität und noch ein paar weitere dazu.
In den WMT steht oben sehr ausführlich, wie viel Seiten übergeben wurden und wie viel davon im Web-Index stehen. Darauf kann man sich verlassen.
Bei Yahoo ist es ähnlich und da funktioniert die Abfrage mit site: besser. Wichtig ist aber, zur com-Seite zu wechseln, da in der deutschen Version nicht alle Seiten angezeigt werden und auch nicht alle Links.
Aber nochmals zu einem gut funktionierenden System. Unterteile die Sitemaps in einzelne Bereiche und lade diese hoch. Somit kommt der bot mehrfach vorbei und man erhöht die Chance auf die zu indizierenden Seiten bei allen Suchmaschinen. Kommt es vor, dass eine Seite in beiden Sitemaps enthalten ist, ist das nicht schlimm.
Es wird berichtet, dass der BOT bei einem Durchlauf nicht alle Seiten scannt und es deshalb besser wäre eine Unterteilung von jeweils 400 oder 1.000 Seiten zu machen. Das kann ich bis dato nicht bestätigen. Vielmehr ist es so, zumindest meiner Beobachtung nach, dass die einzelnen Sitemaps stetig anwachsen.
Ich fing mit einer sitemap.xml an, die dennoch, obwohl ich sie aus den WMT gelöschte hatte, Bestand hat und weiter anwächst. Danach nahm ich die sitemap.xml.gz als komprimierte Version. Auch die wächst an. Nun erstellte ich mir für jeden einzelnen Ordner eine eigene sitemap.xml.gz und siehe da, die indizierten Seiten wurden mit einem Schlag mehr.
Die www.phw-jendreck.de/sitemap.xml.gz liegt im Rootverzeichnis und beinhaltet alle Seiten
Die www.phw-jendreck.de/news/sitemap.xml.gz liegt nur im News-Ordner und beinhaltet alle News-Seiten, aber keine anderen.
Die www.phw-jendreck.de/seo_suchmaschinenoptimierung/sitemap.xml.gz liegt nur im SEO-Ordner und beinhaltet alle SEO-Seiten, aber keine anderen.
usw.usw.usw.
Heiko Jendreck
personal helpdesk
http://www.phw-jendreck.de
http://www.seo-labor.com
Beitrag erstellen
EinloggenKostenlos registrieren