gelöschter Benutzer

Sitemap / Index Sitemaps

am 08.12.2010, 23:00 Uhr eröffnete folgenden Thread
Erfahrungsaustausch und gegenseitige Hilfe    4512 mal gelesen    14 Antwort(en).

Liebes SR - Team,

könntet Ihr die Homepage - Analyse um das Erkennen einer Index Sitemaps erweiteren?

Auf unseren Servern liegen nur Index sitemaps (sitemaps.xml.gz) und viele 100 normale Sitemaps.
Es wäre toll, wenn man des bei der Analyse vielleicht mit berücksichtigen könnte und uns so keine Punkte verloren gehen. Ansonsten finden wir die Möglichkeit der Webseiten - Analyse gut gelungen!


Raptor
Avatar Raptor
IT-Student
Content Gott (1013 Beiträge)
am 09.12.2010, 16:04 Uhr schrieb Raptor

Stimmt, wir sollten eine Glaskugel in die Analyse einbauen, die uns direkt sagt, wie die Sitemap heisst und wo sie zu finden ist, wenn nirgends ein Verweis vermerkt ist und der Dateiname nicht dem Standard entspricht.


Meine Developer-Website mit den Web-Entwickler-Tools.
Meine Web-Entwicklungs-Dienstleistungen

[url="http://www.seitenreport.de/forum/beitraege/seitenreport_verlosungen/wichtig_neue_regel


gelöschter Benutzer
am 09.12.2010, 21:18 Uhr schrieb

Des wäre ne Möglichkeit, würde mir das Auswählen, bzw. Angeben eines Dateinames ersparen.
Sorry, aber für Sitemaps, bzw. für Index Sitemaps gibt es keinen Standard der vorschreibt wie diese heissen müssen. Die Dateien müssen nur dem Standard entsprechen und werden von allen großen Suchemaschinen automatisch gefunden, sofern sie nicht geblockt werden und in der Root liegen. Sitemaps Dateinamen sind auch teilweise mit zufälligen Namen unterwegs.

Aber wenn´s bei Euch nicht geht, dass man diese angeben kann, auch keine Problem. Es gibt wichtigere Dinge als Statistiken.


Raptor schrieb:

Stimmt, wir sollten eine Glaskugel in die Analyse einbauen, die uns direkt sagt, wie die Sitemap heisst und wo sie zu finden ist, wenn nirgends ein Verweis vermerkt ist und der Dateiname nicht dem Standard entspricht.


Raptor
Avatar Raptor
IT-Student
Content Gott (1013 Beiträge)
am 09.12.2010, 21:44 Uhr schrieb Raptor

sitemaps.org/protocol.php


sitemaps.org/protocol.php


Meine Developer-Website mit den Web-Entwickler-Tools.
Meine Web-Entwicklungs-Dienstleistungen

[url="http://www.seitenreport.de/forum/beitraege/seitenreport_verlosungen/wichtig_neue_regel

joerg
Avatar joerg
Fachinformatiker Anwendungsentwicklung
Content Gott (1941 Beiträge)
am 09.12.2010, 21:46 Uhr schrieb joerg

Hallo Holger

Also die Standardadresse für eine Sitemap ist ja wohl sitemap.xml.

Es hindert dich auch nichts in dieser Standardadresse einen Sitemapindex zu verwenden.

Die zweite Möglichkeit die bei Seitenreport meines Wissens aber auch abgefragt wird ist die Angabe einer abweichenden Adresse der Sitemap in der robots.txt. Obwohl ich die Standardadresse verwende verweise ich bei meinen Domains halt auch über die robots.txt auf meine Sitemaps ob Index oder halt eben normal.

Keine der beiden Möglichkeiten nutzt du und die eine Zeile noch in die robots.txt hinzufügen tut echt nicht weh.

Gruß
Jörg


Zufällige Umleitung zu der Startseite einer meiner Domains
Meine ungewöhnlichen Tools


gelöschter Benutzer
am 09.12.2010, 22:51 Uhr schrieb

Es gibt keine Standard Adresse oder Name für die Sitemap.
Die meisten nennen Sie einfach sitemap.xml weil es am aussage kräftigsten ist. Aber eine Norm für die Namensgebung gibt es nicht, da hat Holger völlig recht.
Deshalb muss man auch den Umweg über die robots.txt gehen oder man sendet sie direkt zu dem Anbieter.


joerg
Avatar joerg
Fachinformatiker Anwendungsentwicklung
Content Gott (1941 Beiträge)
am 09.12.2010, 23:45 Uhr schrieb joerg

Hallo Thomas

Danke für die Info. Warum gibst du dann den Verweis nicht in deiner robots.txt an?

Was bedeutet das denn nun konkret für den Analysepunkt hier bei Seitenreport.

Ich meine diese von mir genannte Adresse wird abgefragt. Dürfte man dann ja eigentlich nicht machen.

Bedeutet dann aber auch das eine Angabe eines RSS Feeds in den Metas zumindest für aktuelle Seiten als gleichrangig zu bewerten wäre. Sowie eine urllist.txt wäre dann auch noch eine bessere Alternative als eine sitemap.xml die nicht in der robots.txt steht.

So und was machen wir jetzt aus dieser Situation?

Gruß
Jörg

PS Okay ich hatte dann mal gerade meine robots.txt entfernt und meine sitemap.xml wurde erkannt. nachdem ich die auch entfernt hatte wurde eine urllist.txt erkannt.


Zufällige Umleitung zu der Startseite einer meiner Domains
Meine ungewöhnlichen Tools


gelöschter Benutzer
am 10.12.2010, 00:45 Uhr schrieb

Ultima schrieb:

Es gibt keine Standard Adresse oder Name für die Sitemap.
Die meisten nennen Sie einfach sitemap.xml weil es am aussage kräftigsten ist. Aber eine Norm für die Namensgebung gibt es nicht, da hat Holger völlig recht.
Deshalb muss man auch den Umweg über die robots.txt gehen oder man sendet sie direkt zu dem Anbieter.



Ja also wirklich, es gibt keinen Standard für die Namensgebung. Es hat sich so bei den Webmastern eingespielt, diese wohl immer sitemap.xml zu nennen. Aber wer seine Sitemap packt, also sitemap.xml.gz hat wohl schon ein Problem, weil Seitenreport dies wohl nicht erkennt. Und wenn man dann noch den Namen anderst hat, gehts gleich gar nicht.

Ich habe noch einmal nachgelesen:

Specifying the Sitemap location in your robots.txt file
You can specify the location of the Sitemap using a robots.txt file. To do this, simply add the following line including the full URL to the sitemap:

Sitemap: www.example.com/sitemap.xml



Dieser Weg mag funktionieren, nur leider wird eine sitemaps.xml.gz von SR auch nicht erkannt.

Deshalb mein Vorschlag, man müsste die Position und den Namen einfach angeben können.
Bei den meisten Suchemaschinen kann man diese angeben, bzw. werden auch automatisch erkannt. Die G-Suchmaschine bevorzugt sogar gepackte index sitemaps, weil diese eben nach einem indizes prinzip gelesen werden können. mit anderen worten, g-suchmaschine kann sich diese stückweise lesen.

und noch ein tipp von mir: legt euch index sitemaps an, denn dann habt ihr genau eine kontrolle was z.b. eine g-suchmaschine im webindex hat. Man splittet einfach seine urls in gruppen auf und speichert diese in normal sitemap dateien und legt danach eine index sitemal datei an. am besten diese noch packen (gz). diese verfahren funktioniert super bei allen 3 großen suchmaschinen und ist auch mit domains getestet wurden, die 10.000.000 Seiten im Index haben.



hansen
Foren Moderator
Content Gott (1886 Beiträge)
am 10.12.2010, 09:11 Uhr schrieb hansen

composse schrieb:

Aber wer seine Sitemap packt, also sitemap.xml.gz hat wohl schon ein Problem, weil Seitenreport dies wohl nicht erkennt. Und wenn man dann noch den Namen anderst hat, gehts gleich gar nicht.

.... nur leider wird eine sitemaps.xml.gz von SR auch nicht erkannt.


Was oder wer hindert Dich daran, eine sitemap.xml online zu stellen, wenn Du schon eine sitemap.xml.gz hast?
Dann hast Du halt 2 in Deinem Verzeichnis, eine komprimierte und eine normale. Wo ist da das Problem?


Nepal Rundreisen


gelöschter Benutzer
am 10.12.2010, 09:36 Uhr schrieb

joerg schrieb:
Hallo Thomas

Danke für die Info. Warum gibst du dann den Verweis nicht in deiner robots.txt an?

Was bedeutet das denn nun konkret für den Analysepunkt hier bei Seitenreport.

Ich meine diese von mir genannte Adresse wird abgefragt. Dürfte man dann ja eigentlich nicht machen.
...


Hi Joerg,

der Eintrag wurde beim letzten Joomla Update unglücklicherweise überschrieben
Eigentlich müsste erst die robots.txt ausgewertet werden bevor geraten wird.
Das löst mehrere Fehlermeldungen aus, das wiederum die errorlogs und Statistiken verfälscht.

[infobox]
[Fri Dec 10 09:00:47 2010] [error] [client 195.42.120.163] File does not exist: /usr/www/users/vorrau/sitemap.xml
[Fri Dec 10 09:00:47 2010] [error] [client 195.42.120.163] File does not exist: /usr/www/users/vorrau/sitemap.txt
[Fri Dec 10 09:00:47 2010] [error] [client 195.42.120.163] File does not exist: /usr/www/users/vorrau/urllist.txt
[Fri Dec 10 09:00:56 2010] [error] [client 195.42.120.163] File does not exist: /usr/www/users/vorrau/galerie/thump_pic
[Fri Dec 10 09:00:56 2010] [error] [client 195.42.120.163] File does not exist: /usr/www/users/vorrau/pe4xWcsFFvfz2zkk.errorpage.html[/infobox]

An den Logs sieht man auch das Suchmaschinen nicht raten.


@Holger: Eine automatische Erkennung gibt es nicht bei Suchmaschinen, eine Sitemap muss angegeben oder eingereicht werden.

@Seitenreport: Die Analyse erkennt Individuelle Fehlerseiten die nicht existieren.


Viele Grüße Thomas



gelöschter Benutzer
am 10.12.2010, 09:47 Uhr schrieb

Seitenreport erkennt auch eine ungleich sitemap.xml (der sogenannten "Standard-Sitemap" benannte Sitemap (z.B.: sitemap_pipapo.xml), wenn alle andere Bedingungen zum Auffinden einer Seitemap (siehe sitemap.org, darauf bezieht sich z.B. Google) eingehalten sind.
Diese sitemap_pipapo.xml wird sogar bei der Analyse namentlich angegeben - wenn sie gefunden wurde.
Sinnvoll ist es möglicherweise, die eigene Sitemap nach sitemap.org zu erstellen.....statt Fremdprogramme zu nutzen.

Andere Seitenanalyse-Websiten haben da wesentlich mehr Schwierigkeiten und erwarten eine sitemap.xml.

Allerdings wird nur das Vorhandensein einer Sitemap-Datei bewertet, egal, ob sie leer ist oder mit dem Webauftritt übereinstimmt (ebenso wie beim Favicon).

Gruß
kjm_50




« zurück zu: Erfahrungsaustausch und gegenseitige Hilfe

Das Seitenreport Forum hat aktuell 5275 Themen und 36110 Beiträge.
Insgesamt sind 48360 Mitglieder registriert.