gelöschter Benutzer

Crawling-Fehler in den WMT

am 20.05.2011, 15:14 Uhr eröffnete folgenden Thread
Erfahrungsaustausch und gegenseitige Hilfe    2507 mal gelesen    9 Antwort(en).

Hallo Forum, seit Wochen ärgert mich eine Fehlermeldung in den WMT


URLs anzeigen:
htp://georg-hh.freimaurerei.de/links-zu logen.html

Erkannt
404(Nicht gefunden)

Details
nicht verfügbar

18.05.2011


Das Problem liegt offensichtlich an der Leerstelle zwischen "zu" und "logen". Wie die so geschriebene Adresse jemals entstand und auf welchem Server sie schlummert ist nicht mehr nachvollziehbar, ihre richtige und funktionierende Schreibweise hat zwischen "zu" und "logen" einen Bindestrich, "-".
Wenn ich in die .htaccess einen redirect permanent einfüge, falsche Schreibweise umgeleitet zu richtige Schreibweise, startet die Seite nicht mehr, Fehler 500. Auch der Versuch, mit alt255 zu arbeiten oder nbsp schlug fehl. Experimente in der robots.txt brachten auch nix, kann dort nachvollzogen werden.:bang:
Der Fehler ist, zugegeben, nur marginal. Mein Hang zur Perfektion läßt mich fragen: Wer kennt solch einen Fehler? Wie kann er abgestellt werden? Grüße Fritz



gelöschter Benutzer
am 20.05.2011, 15:21 Uhr schrieb

Du publizierst die URL selbst, z.B. hier im Forum und in dem von Google.

Ein Leerzeichen und   gibt es in URLs nicht, du könntest es mal mit %20 versuchen.


Gruß Thomas


winelady
Kauffrau
Content Halbgott (862 Beiträge)
am 20.05.2011, 15:31 Uhr schrieb winelady

georg123 schrieb:

Hallo Forum, seit Wochen ärgert mich eine Fehlermeldung in den WMT


URLs anzeigen:
htp://georg-hh.freimaurerei.de/links-zu logen.html

Erkannt
404(Nicht gefunden)

Details
nicht verfügbar

18.05.2011


Das Problem liegt offensichtlich an der Leerstelle zwischen "zu" und "logen". Wie die so geschriebene Adresse jemals entstand und auf welchem Server sie schlummert ist nicht mehr nachvollziehbar, ihre richtige und funktionierende Schreibweise hat zwischen "zu" und "logen" einen Bindestrich, "-".
Wenn ich in die .htaccess einen redirect permanent einfüge, falsche Schreibweise umgeleitet zu richtige Schreibweise, startet die Seite nicht mehr, Fehler 500. Auch der Versuch, mit alt255 zu arbeiten oder nbsp schlug fehl. Experimente in der robots.txt brachten auch nix, kann dort nachvollzogen werden.:bang:
Der Fehler ist, zugegeben, nur marginal. Mein Hang zur Perfektion läßt mich fragen: Wer kennt solch einen Fehler? Wie kann er abgestellt werden? Grüße Fritz



Hallo Fritz,

Du bist in bester Gesellschaft… ich finde in den WMT auch öfters mal Crawlingfehler. Manchmal werden dort sogar Seiten genannt, die es gar nicht gibt. Sie bleiben wochenlang mahnend stehen, dann sind sie wie von Zauberhand wieder verschwunden.
Daß das einen Perfektionisten nervt, kann ich bestens nachvollziehen. Aber: nobody is perfect, nicht einmal Tante G. – ist das nicht beruhigend?

Gruß
winelady


Weinvielfalt aus dem Weingut Fuchs
Fremdsprachensatz


gelöschter Benutzer
am 20.05.2011, 16:17 Uhr schrieb

Hallo Fritz,

georg123 schrieb:
Wer kennt solch einen Fehler? Wie kann er abgestellt werden?

Ich kenne solche Fehler zur genüge und lass dir gesagt sein:
"Du kannst absolut nichts dafür!"
Solche Fehler entstehen, wenn:
- irgend ein Benutzer einen Link in ein Formular einer Webseite kopiert und die Logik hinter diesem Formular den Link nicht sauber kodiert.
- irgendeine Link-Sammel-Seite den Link interessant findet, aber ebenfalls falsch kodiert in einer DB speichert
- ein Web-Dienst versucht den URL zu normalisieren und der URL dabei "in die Hose geht"
- ....

Ich habe andauern mindestens 100 solcher Links in den WMT. Wenn einer dieser Links eine größere Anzahl an verlinkten Seiten zeigt, beantrage ich eine Löschung der Verknüpfung, da mein Server hierfür sowieso ein 404 sendet.

Also lass dich nicht verrückt machen, du kannst nichts daran ändern

Servus,
Klaus



gelöschter Benutzer
am 20.05.2011, 22:38 Uhr schrieb

Ich reihe mich da mit ein. Auch bei mir werden gern mal solche Fehler angezeigt und oftmals sind sie nicht wirklich nachvollziehar.

Google schläft auch gern mal. Beispielweise hatte ich mal eine Rubrik Projekte zu Testzwecke und dort waren einige Kundenbeispielseiten hinterlegt. Google hält noch immer daran fest und gibt sie nicht mehr her, obwohl sie weder in der Sitemap verankert sind, noch intern durch Links.

Wie Klaus schon sagte: Du kannst nichts dafür und daran ändern kannst Du auch nicht viel.


matthes
Avatar matthes
Foren Moderator
Evil Genius
Content Halbgott (973 Beiträge)
am 20.05.2011, 22:48 Uhr schrieb matthes

Hallo Fritz,

füge in dem Redirect innerhalb der .htaccess mal einen umgekehrten Schrägstrich (Backslash) ein, das sollte funktionieren.
[html]http://georg-hh.freimaurerei.de/links-zu\\ logen.html[/html]

Schöne Grüße

Matthias


Make Seitenreport great again!


gelöschter Benutzer
am 20.05.2011, 23:35 Uhr schrieb

Es scheint doch auch an Google zu liegen.

Bei mir mischt Google z.Z. auch einige Subdomains zusammen, obwohl dahinter völig verschiedene Systeme liegen.

Da es sich jeweils um technisch unterschiedliche Systeme handelt, einmal ein Preisvergleich, und auf der andsren Seite ein WordPrees Blog, ist das nicht nachvollziehbar.

Vermutlich steckt ein Ein Panda-Bär in Lena\'s Höschen

Gruß Matthias



gelöschter Benutzer
am 21.05.2011, 19:04 Uhr schrieb

Matthes schrieb:

Hallo Fritz, füge in dem Redirect innerhalb der .htaccess mal einen umgekehrten Schrägstrich (Backslash) ein, das sollte funktionieren.
[html]http://georg-hh.freimaurerei.de/links-zu\\ logen.html[/html]
Schöne Grüße Matthias


Hallo Matthias, ich hab Dein Rezept ausprobiert. Mit der von Dir vorgegebenen Leerstelle nach dem Backslash kam wieder der "Fehler 500". Aber: Mit ...-zu\\logen.html startet die Seite ohne meckern.
Jetzt warte ich gespannt darauf, ob und insbesondere WANN der Crawling-Fehler beseitigt ist.
@ultima: Hallo Thomas, die %20 hab ich in der robots.txt eingefügt und die Datei "verboten".
Ich baue beide Änderungsvorschläge ein- wenns klappt weiss ich dann nicht, welches Rezept gegriffen hat. Aber zunächst einmal Euch Beiden ganz herzlichen Dank! Grüße Fritz


matthes
Avatar matthes
Foren Moderator
Evil Genius
Content Halbgott (973 Beiträge)
am 21.05.2011, 23:55 Uhr schrieb matthes

Ich denke, dass es ohne das Leerzeichen nicht klappen wird.
In mod_rewrite funktioniert diese Form, ein Leerzeichen zu escapen, problemlos, vielleicht kannst Du es darüber ausprobieren, falls es bei Dir verfügbar ist?


Make Seitenreport great again!


gelöschter Benutzer
am 27.05.2011, 19:52 Uhr schrieb

georg123 schrieb:

Matthes schrieb:

Hallo Fritz, füge in dem Redirect innerhalb der .htaccess mal einen umgekehrten Schrägstrich (Backslash) ein, das sollte funktionieren.
[html]http://georg-hh.freimaurerei.de/links-zu\\ logen.html[/html]
Schöne Grüße Matthias


Hallo Matthias, ich hab Dein Rezept ausprobiert. Mit der von Dir vorgegebenen Leerstelle nach dem Backslash kam wieder der "Fehler 500". Aber: Mit ...-zu\\logen.html startet die Seite ohne meckern.
Jetzt warte ich gespannt darauf, ob und insbesondere WANN der Crawling-Fehler beseitigt ist.
@ultima: Hallo Thomas, die %20 hab ich in der robots.txt eingefügt und die Datei "verboten".
Ich baue beide Änderungsvorschläge ein- wenns klappt weiss ich dann nicht, welches Rezept gegriffen hat. Aber zunächst einmal Euch Beiden ganz herzlichen Dank! Grüße Fritz


Hallo Matthias, es hat einige Tage gedauert: Jetzt ist die Fehlermeldung weg, danke! @Thomas: Die %20 in der robots.txt hab`ich wieder rausgenommen. Abendgrüße Fritz


  • 1


« zurück zu: Erfahrungsaustausch und gegenseitige Hilfe

Das Seitenreport Forum hat aktuell 5272 Themen und 36104 Beiträge.
Insgesamt sind 496 Mitglieder registriert.