Crawling-Fehler in den WMT
Redaktionelle Einordnung
Diese archivierte Diskussion behandelt Crawling-Fehler in den WMT aus Sicht der Rubrik Erfahrungsaustausch.
Für Indexierungsfragen sind heute Search Console, saubere Robots-Signale, Canonicals und XML-Sitemaps die wichtigsten Stellschrauben.
Sinnvoll nutzbar bleibt der Thread vor allem als historischer Kontext, für typische Fragestellungen und zur Einordnung älterer Empfehlungen.
Einige im historischen Thread genannte Tools, Dienste oder externe Links könnten heute nicht mehr verfügbar oder inhaltlich überholt sein. Nutzen Sie sie bitte nur mit zusätzlicher Prüfung.
Startbeitrag
Originaler Foreninhalt in modernisierter Darstellung.
Hallo Forum, seit Wochen ärgert mich eine Fehlermeldung in den WMT
URLs anzeigen:
htp://georg-hh.freimaurerei.de/links-zu logen.html
Erkannt
404(Nicht gefunden)
Details
nicht verfügbar
18.05.2011
Das Problem liegt offensichtlich an der Leerstelle zwischen "zu" und "logen". Wie die so geschriebene Adresse jemals entstand und auf welchem Server sie schlummert ist nicht mehr nachvollziehbar, ihre richtige und funktionierende Schreibweise hat zwischen "zu" und "logen" einen Bindestrich, "-".
Wenn ich in die .htaccess einen redirect permanent einfüge, falsche Schreibweise umgeleitet zu richtige Schreibweise, startet die Seite nicht mehr, Fehler 500. Auch der Versuch, mit alt255 zu arbeiten oder nbsp schlug fehl. Experimente in der robots.txt brachten auch nix, kann dort nachvollzogen werden.:bang:
Der Fehler ist, zugegeben, nur marginal. Mein Hang zur Perfektion läßt mich fragen: Wer kennt solch einen Fehler? Wie kann er abgestellt werden? Grüße Fritz
Antworten
9 BeiträgeDu publizierst die URL selbst, z.B. hier im Forum und in dem von Google.
Ein Leerzeichen und gibt es in URLs nicht, du könntest es mal mit %20 versuchen.
Gruß Thomas
georg123 schrieb:
Hallo Forum, seit Wochen ärgert mich eine Fehlermeldung in den WMT
URLs anzeigen:
htp://georg-hh.freimaurerei.de/links-zu logen.html
Erkannt
404(Nicht gefunden)
Details
nicht verfügbar
18.05.2011
Das Problem liegt offensichtlich an der Leerstelle zwischen "zu" und "logen". Wie die so geschriebene Adresse jemals entstand und auf welchem Server sie schlummert ist nicht mehr nachvollziehbar, ihre richtige und funktionierende Schreibweise hat zwischen "zu" und "logen" einen Bindestrich, "-".
Wenn ich in die .htaccess einen redirect permanent einfüge, falsche Schreibweise umgeleitet zu richtige Schreibweise, startet die Seite nicht mehr, Fehler 500. Auch der Versuch, mit alt255 zu arbeiten oder nbsp schlug fehl. Experimente in der robots.txt brachten auch nix, kann dort nachvollzogen werden.:bang:
Der Fehler ist, zugegeben, nur marginal. Mein Hang zur Perfektion läßt mich fragen: Wer kennt solch einen Fehler? Wie kann er abgestellt werden? Grüße Fritz
Hallo Fritz,
Du bist in bester Gesellschaft ich finde in den WMT auch öfters mal Crawlingfehler. Manchmal werden dort sogar Seiten genannt, die es gar nicht gibt. Sie bleiben wochenlang mahnend stehen, dann sind sie wie von Zauberhand wieder verschwunden.
Da das einen Perfektionisten nervt, kann ich bestens nachvollziehen. Aber: nobody is perfect, nicht einmal Tante G. ist das nicht beruhigend?
Gruß
winelady
Weinvielfalt aus dem Weingut Fuchs
Fremdsprachensatz
Hallo Fritz,
georg123 schrieb:
Wer kennt solch einen Fehler? Wie kann er abgestellt werden?
Ich kenne solche Fehler zur genüge und lass dir gesagt sein:
"Du kannst absolut nichts dafür!"
Solche Fehler entstehen, wenn:
- irgend ein Benutzer einen Link in ein Formular einer Webseite kopiert und die Logik hinter diesem Formular den Link nicht sauber kodiert.
- irgendeine Link-Sammel-Seite den Link interessant findet, aber ebenfalls falsch kodiert in einer DB speichert
- ein Web-Dienst versucht den URL zu normalisieren und der URL dabei "in die Hose geht"
- ....
Ich habe andauern mindestens 100 solcher Links in den WMT. Wenn einer dieser Links eine größere Anzahl an verlinkten Seiten zeigt, beantrage ich eine Löschung der Verknüpfung, da mein Server hierfür sowieso ein 404 sendet.
Also lass dich nicht verrückt machen, du kannst nichts daran ändern
Servus,
Klaus
Ich reihe mich da mit ein. Auch bei mir werden gern mal solche Fehler angezeigt und oftmals sind sie nicht wirklich nachvollziehar.
Google schläft auch gern mal. Beispielweise hatte ich mal eine Rubrik Projekte zu Testzwecke und dort waren einige Kundenbeispielseiten hinterlegt. Google hält noch immer daran fest und gibt sie nicht mehr her, obwohl sie weder in der Sitemap verankert sind, noch intern durch Links.
Wie Klaus schon sagte: Du kannst nichts dafür und daran ändern kannst Du auch nicht viel.
Hallo Fritz,
füge in dem Redirect innerhalb der .htaccess mal einen umgekehrten Schrägstrich (Backslash) ein, das sollte funktionieren.
[html]http://georg-hh.freimaurerei.de/links-zu\\ logen.html[/html]
Schöne Grüße
Matthias
Make Seitenreport great again!
Es scheint doch auch an Google zu liegen.
Bei mir mischt Google z.Z. auch einige Subdomains zusammen, obwohl dahinter völig verschiedene Systeme liegen.
Da es sich jeweils um technisch unterschiedliche Systeme handelt, einmal ein Preisvergleich, und auf der andsren Seite ein WordPrees Blog, ist das nicht nachvollziehbar.
Vermutlich steckt ein Ein Panda-Bär in Lena\'s Höschen
Gruß Matthias
Matthes schrieb:
Hallo Fritz, füge in dem Redirect innerhalb der .htaccess mal einen umgekehrten Schrägstrich (Backslash) ein, das sollte funktionieren.
[html]http://georg-hh.freimaurerei.de/links-zu\\ logen.html[/html]
Schöne Grüße Matthias
Hallo Matthias, ich hab Dein Rezept ausprobiert. Mit der von Dir vorgegebenen Leerstelle nach dem Backslash kam wieder der "Fehler 500". Aber: Mit ...-zu\\logen.html startet die Seite ohne meckern.
Jetzt warte ich gespannt darauf, ob und insbesondere WANN der Crawling-Fehler beseitigt ist.
@ultima: Hallo Thomas, die %20 hab ich in der robots.txt eingefügt und die Datei "verboten".
Ich baue beide nderungsvorschlge ein- wenns klappt weiss ich dann nicht, welches Rezept gegriffen hat. Aber zunchst einmal Euch Beiden ganz herzlichen Dank! Gre Fritz
Ich denke, dass es ohne das Leerzeichen nicht klappen wird.
In mod_rewrite funktioniert diese Form, ein Leerzeichen zu escapen, problemlos, vielleicht kannst Du es darüber ausprobieren, falls es bei Dir verfügbar ist?
Make Seitenreport great again!
georg123 schrieb:
Matthes schrieb:
Hallo Fritz, füge in dem Redirect innerhalb der .htaccess mal einen umgekehrten Schrägstrich (Backslash) ein, das sollte funktionieren.
[html]http://georg-hh.freimaurerei.de/links-zu\\ logen.html[/html]
Schöne Grüße Matthias
Hallo Matthias, ich hab Dein Rezept ausprobiert. Mit der von Dir vorgegebenen Leerstelle nach dem Backslash kam wieder der "Fehler 500". Aber: Mit ...-zu\\logen.html startet die Seite ohne meckern.
Jetzt warte ich gespannt darauf, ob und insbesondere WANN der Crawling-Fehler beseitigt ist.
@ultima: Hallo Thomas, die %20 hab ich in der robots.txt eingefügt und die Datei "verboten".
Ich baue beide nderungsvorschlge ein- wenns klappt weiss ich dann nicht, welches Rezept gegriffen hat. Aber zunchst einmal Euch Beiden ganz herzlichen Dank! Gre Fritz
Hallo Matthias, es hat einige Tage gedauert: Jetzt ist die Fehlermeldung weg, danke! @Thomas: Die %20 in der robots.txt hab`ich wieder rausgenommen. Abendgrüße Fritz