Zum Inhalt springen
ThreadErfahrungsaustausch und gegenseitige Hilfe

Crawling-Fehler in den WMT

Kategorie
Erfahrungsaustausch und gegenseitige Hilfe
Gelesen
2507
Antworten
9
Erstellt von: gelöschter BenutzerDatum: 20.05.2011, 15:14 Uhr
Archiv-KommentarArchiviert, nicht priorisiertIndexierung & Crawling

Redaktionelle Einordnung

Diese archivierte Diskussion behandelt Crawling-Fehler in den WMT aus Sicht der Rubrik Erfahrungsaustausch.

Für Indexierungsfragen sind heute Search Console, saubere Robots-Signale, Canonicals und XML-Sitemaps die wichtigsten Stellschrauben.

Sinnvoll nutzbar bleibt der Thread vor allem als historischer Kontext, für typische Fragestellungen und zur Einordnung älterer Empfehlungen.

Einige im historischen Thread genannte Tools, Dienste oder externe Links könnten heute nicht mehr verfügbar oder inhaltlich überholt sein. Nutzen Sie sie bitte nur mit zusätzlicher Prüfung.

Startbeitrag

Originaler Foreninhalt in modernisierter Darstellung.

Zur Kategorie
gelöschter Benutzer
Threadstart · Erfahrungsaustausch und gegenseitige Hilfe 2507 mal gelesen · 20.05.2011, 15:14 Uhr

Hallo Forum, seit Wochen ärgert mich eine Fehlermeldung in den WMT


URLs anzeigen:
htp://georg-hh.freimaurerei.de/links-zu logen.html

Erkannt
404(Nicht gefunden)

Details
nicht verfügbar

18.05.2011


Das Problem liegt offensichtlich an der Leerstelle zwischen "zu" und "logen". Wie die so geschriebene Adresse jemals entstand und auf welchem Server sie schlummert ist nicht mehr nachvollziehbar, ihre richtige und funktionierende Schreibweise hat zwischen "zu" und "logen" einen Bindestrich, "-".
Wenn ich in die .htaccess einen redirect permanent einfüge, falsche Schreibweise umgeleitet zu richtige Schreibweise, startet die Seite nicht mehr, Fehler 500. Auch der Versuch, mit alt255 zu arbeiten oder nbsp schlug fehl. Experimente in der robots.txt brachten auch nix, kann dort nachvollzogen werden.:bang:
Der Fehler ist, zugegeben, nur marginal. Mein Hang zur Perfektion läßt mich fragen: Wer kennt solch einen Fehler? Wie kann er abgestellt werden? Grüße Fritz

Antworten

9 Beiträge
gelöschter Benutzer
am 20.05.2011, 15:21 Uhr schrieb
Antwort

Du publizierst die URL selbst, z.B. hier im Forum und in dem von Google.

Ein Leerzeichen und   gibt es in URLs nicht, du könntest es mal mit %20 versuchen.


Gruß Thomas

Kauffrau Content Halbgott (862 Beiträge)
am 20.05.2011, 15:31 Uhr schrieb winelady
Antwort

georg123 schrieb:

Hallo Forum, seit Wochen ärgert mich eine Fehlermeldung in den WMT


URLs anzeigen:
htp://georg-hh.freimaurerei.de/links-zu logen.html

Erkannt
404(Nicht gefunden)

Details
nicht verfügbar

18.05.2011


Das Problem liegt offensichtlich an der Leerstelle zwischen "zu" und "logen". Wie die so geschriebene Adresse jemals entstand und auf welchem Server sie schlummert ist nicht mehr nachvollziehbar, ihre richtige und funktionierende Schreibweise hat zwischen "zu" und "logen" einen Bindestrich, "-".
Wenn ich in die .htaccess einen redirect permanent einfüge, falsche Schreibweise umgeleitet zu richtige Schreibweise, startet die Seite nicht mehr, Fehler 500. Auch der Versuch, mit alt255 zu arbeiten oder nbsp schlug fehl. Experimente in der robots.txt brachten auch nix, kann dort nachvollzogen werden.:bang:
Der Fehler ist, zugegeben, nur marginal. Mein Hang zur Perfektion läßt mich fragen: Wer kennt solch einen Fehler? Wie kann er abgestellt werden? Grüße Fritz



Hallo Fritz,

Du bist in bester Gesellschaft ich finde in den WMT auch öfters mal Crawlingfehler. Manchmal werden dort sogar Seiten genannt, die es gar nicht gibt. Sie bleiben wochenlang mahnend stehen, dann sind sie wie von Zauberhand wieder verschwunden.
Da das einen Perfektionisten nervt, kann ich bestens nachvollziehen. Aber: nobody is perfect, nicht einmal Tante G. ist das nicht beruhigend?

Gruß
winelady


Weinvielfalt aus dem Weingut Fuchs
Fremdsprachensatz
gelöschter Benutzer
am 20.05.2011, 16:17 Uhr schrieb
Antwort

Hallo Fritz,

georg123 schrieb:
Wer kennt solch einen Fehler? Wie kann er abgestellt werden?

Ich kenne solche Fehler zur genüge und lass dir gesagt sein:
"Du kannst absolut nichts dafür!"
Solche Fehler entstehen, wenn:
- irgend ein Benutzer einen Link in ein Formular einer Webseite kopiert und die Logik hinter diesem Formular den Link nicht sauber kodiert.
- irgendeine Link-Sammel-Seite den Link interessant findet, aber ebenfalls falsch kodiert in einer DB speichert
- ein Web-Dienst versucht den URL zu normalisieren und der URL dabei "in die Hose geht"
- ....

Ich habe andauern mindestens 100 solcher Links in den WMT. Wenn einer dieser Links eine größere Anzahl an verlinkten Seiten zeigt, beantrage ich eine Löschung der Verknüpfung, da mein Server hierfür sowieso ein 404 sendet.

Also lass dich nicht verrückt machen, du kannst nichts daran ändern

Servus,
Klaus

gelöschter Benutzer
am 20.05.2011, 22:38 Uhr schrieb
Antwort

Ich reihe mich da mit ein. Auch bei mir werden gern mal solche Fehler angezeigt und oftmals sind sie nicht wirklich nachvollziehar.

Google schläft auch gern mal. Beispielweise hatte ich mal eine Rubrik Projekte zu Testzwecke und dort waren einige Kundenbeispielseiten hinterlegt. Google hält noch immer daran fest und gibt sie nicht mehr her, obwohl sie weder in der Sitemap verankert sind, noch intern durch Links.

Wie Klaus schon sagte: Du kannst nichts dafür und daran ändern kannst Du auch nicht viel.

Foren Moderator Evil Genius Content Halbgott (973 Beiträge)
am 20.05.2011, 22:48 Uhr schrieb matthes
Antwort

Hallo Fritz,

füge in dem Redirect innerhalb der .htaccess mal einen umgekehrten Schrägstrich (Backslash) ein, das sollte funktionieren.
[html]http://georg-hh.freimaurerei.de/links-zu\\ logen.html[/html]

Schöne Grüße

Matthias


Make Seitenreport great again!
gelöschter Benutzer
am 20.05.2011, 23:35 Uhr schrieb
Antwort

Es scheint doch auch an Google zu liegen.

Bei mir mischt Google z.Z. auch einige Subdomains zusammen, obwohl dahinter völig verschiedene Systeme liegen.

Da es sich jeweils um technisch unterschiedliche Systeme handelt, einmal ein Preisvergleich, und auf der andsren Seite ein WordPrees Blog, ist das nicht nachvollziehbar.

Vermutlich steckt ein Ein Panda-Bär in Lena\'s Höschen

Gruß Matthias

gelöschter Benutzer
am 21.05.2011, 19:04 Uhr schrieb
Antwort

Matthes schrieb:

Hallo Fritz, füge in dem Redirect innerhalb der .htaccess mal einen umgekehrten Schrägstrich (Backslash) ein, das sollte funktionieren.
[html]http://georg-hh.freimaurerei.de/links-zu\\ logen.html[/html]
Schöne Grüße Matthias


Hallo Matthias, ich hab Dein Rezept ausprobiert. Mit der von Dir vorgegebenen Leerstelle nach dem Backslash kam wieder der "Fehler 500". Aber: Mit ...-zu\\logen.html startet die Seite ohne meckern.
Jetzt warte ich gespannt darauf, ob und insbesondere WANN der Crawling-Fehler beseitigt ist.
@ultima: Hallo Thomas, die %20 hab ich in der robots.txt eingefügt und die Datei "verboten".
Ich baue beide nderungsvorschlge ein- wenns klappt weiss ich dann nicht, welches Rezept gegriffen hat. Aber zunchst einmal Euch Beiden ganz herzlichen Dank! Gre Fritz

Foren Moderator Evil Genius Content Halbgott (973 Beiträge)
am 21.05.2011, 23:55 Uhr schrieb matthes
Antwort

Ich denke, dass es ohne das Leerzeichen nicht klappen wird.
In mod_rewrite funktioniert diese Form, ein Leerzeichen zu escapen, problemlos, vielleicht kannst Du es darüber ausprobieren, falls es bei Dir verfügbar ist?


Make Seitenreport great again!
gelöschter Benutzer
am 27.05.2011, 19:52 Uhr schrieb
Antwort

georg123 schrieb:

Matthes schrieb:

Hallo Fritz, füge in dem Redirect innerhalb der .htaccess mal einen umgekehrten Schrägstrich (Backslash) ein, das sollte funktionieren.
[html]http://georg-hh.freimaurerei.de/links-zu\\ logen.html[/html]
Schöne Grüße Matthias


Hallo Matthias, ich hab Dein Rezept ausprobiert. Mit der von Dir vorgegebenen Leerstelle nach dem Backslash kam wieder der "Fehler 500". Aber: Mit ...-zu\\logen.html startet die Seite ohne meckern.
Jetzt warte ich gespannt darauf, ob und insbesondere WANN der Crawling-Fehler beseitigt ist.
@ultima: Hallo Thomas, die %20 hab ich in der robots.txt eingefügt und die Datei "verboten".
Ich baue beide nderungsvorschlge ein- wenns klappt weiss ich dann nicht, welches Rezept gegriffen hat. Aber zunchst einmal Euch Beiden ganz herzlichen Dank! Gre Fritz


Hallo Matthias, es hat einige Tage gedauert: Jetzt ist die Fehlermeldung weg, danke! @Thomas: Die %20 in der robots.txt hab`ich wieder rausgenommen. Abendgrüße Fritz