Azuu
Themenersteller
Beginner (26 Beiträge)

robots.txt-Datei fehlerhaft?

am 14.01.2010, 22:28 Uhr eröffnete Azuu folgenden Thread
Google    5149 mal gelesen    11 Antwort(en).

Hallo,

ich kriege im Google Webmaster-Tools folgende Meldung:

Wert Ergebnis
Zeile 1: ?User-agent: * Syntax wurde nicht verstanden
Zeile 2: Allow: / Kein User-Agent angegeben.


Zu dieser robots-Datei: www.pc-luchs.de/robots.txt



In der Datei ist kein "?" vor User-Agent. Was läuft da falsch?


http://www.pc-luchs.de
http://www.spiele-luchs.de

Raptor
Avatar Raptor
IT-Student
Content Gott (1013 Beiträge)
am 14.01.2010, 22:42 Uhr schrieb Raptor

Azuu schrieb:

In der Datei ist kein "?" vor User-Agent. Was läuft da falsch?


Doch, da ist eins, allerdings sieht man es im Browser nicht.
Das sieht irgendwie nach einem BOM aus, obwohl da kein  vorkommt.

Mach mal \'nen Zeilenumbruch (am besten zwei) an den Anfang der Datei.
Oder falls du das beim Speichern einstellen kannst, kannst du die Datei als ASCII speichern.


Meine Developer-Website mit den Web-Entwickler-Tools.
Meine Web-Entwicklungs-Dienstleistungen

[url="http://www.seitenreport.de/forum/beitraege/seitenreport_verlosungen/wichtig_neue_regel


gelöschter Benutzer
am 14.01.2010, 22:44 Uhr schrieb

Azuu schrieb:

Hallo,

ich kriege im Google Webmaster-Tools folgende Meldung:

Wert Ergebnis
Zeile 1: ?User-agent: * Syntax wurde nicht verstanden
Zeile 2: Allow: / Kein User-Agent angegeben.


Zu dieser robots-Datei: www.pc-luchs.de/robots.txt



In der Datei ist kein "?" vor User-Agent. Was läuft da falsch?



Ist Allow, wenn es nicht in Verbindung mit Disallow steht überhaupt erlaubt?

Wenn man alles erlauben will soltte es so drinne stehen:
User-agent: *
Disallow:


Gruß,
Claudio


lwulfe
Avatar lwulfe
Consultant
Content Halbgott (743 Beiträge)
am 14.01.2010, 22:50 Uhr schrieb lwulfe

Noch ein kleiner Tipp: für Dateien die nach Unix gehen, setze ich den Notepad++ ein
und konvertiere die Dateien ins Unix-Format.
So ganz nebenbei kannst du dir auch alle nicht druckbaren Zeichen anzeigen lassen.
Sonst sieht deine robots.txt genau so aus wie meine.



gelöschter Benutzer
am 14.01.2010, 22:55 Uhr schrieb

Hier noch ein Link zum Thema:

www.at-web.de/grundlagen/robots-txt.htm




Gruß,
Claudio.


joerg
Avatar joerg
Fachinformatiker Anwendungsentwicklung
Content Gott (1941 Beiträge)
am 14.01.2010, 23:04 Uhr schrieb joerg

Hallo

Werft nicht alles durcheinander!

@ Flo das sieht man nicht ausser mit einigen Editoren wie weaverslave wenn die Datei im UTF8 mit BOM (Byte Order Mark) abgespeichert worden ist!

Das mit den Zeilen wird dann auch nicht weiterhelfen! Die beiden Zeichen bleiben stehen!

Das mit dem Abspeichern in einem anderem Format sollte schon helfen!

@ Lutz notepad ++ ist zwar ein guter Ratschlag aber da reicht auch das UTF-8 ohne BOM Format aus! Oder halt eben Ascii für die Robots.txt!

www.w3.org/International/questions/qa-utf8-bom.de.php



Gruß
Jörg


Zufällige Umleitung zu der Startseite einer meiner Domains
Meine ungewöhnlichen Tools

lwulfe
Avatar lwulfe
Consultant
Content Halbgott (743 Beiträge)
am 14.01.2010, 23:17 Uhr schrieb lwulfe

joerg schrieb:

@ Lutz notepad ++ ist zwar ein guter Ratschlag aber da reicht auch das UTF-8 ohne BOM Format aus! Oder halt eben Ascii für die Robots.txt!


Hallo Jörg,
wo ich oft schon ein Problem hatte, sind <CR LF> bei Windows und <LF> bei Unix. Ist ja nun beides ASCII.


Raptor
Avatar Raptor
IT-Student
Content Gott (1013 Beiträge)
am 14.01.2010, 23:25 Uhr schrieb Raptor

joerg schrieb:

@ Flo das sieht man nicht ausser mit einigen Editoren wie weaverslave wenn die Datei im UTF8 mit BOM (Byte Order Mark) abgespeichert worden ist!


Da war tatsächlich ein UTF-8-BOM. Ich hab\'s nur falsch konvertiert, deshalb hab\' ich es nicht erkannt.
Jetzt ist es auf alle Fälle weg.

Aber ich habe mir dazu gleich noch die Freiheit genommen, eine BOM-Erkennung beim ContentAnalyzer einzubauen.


Meine Developer-Website mit den Web-Entwickler-Tools.
Meine Web-Entwicklungs-Dienstleistungen

[url="http://www.seitenreport.de/forum/beitraege/seitenreport_verlosungen/wichtig_neue_regel

joerg
Avatar joerg
Fachinformatiker Anwendungsentwicklung
Content Gott (1941 Beiträge)
am 14.01.2010, 23:48 Uhr schrieb joerg

Hallo Lutz

Ich habe nicht gerade viel verstanden von der Problematik mit den Zeilenumbrüchen!
Vielleicht hilft dir das ja weiter!

de.wikipedia.org/wiki/Zeilenumbruch


www.oreilly.de/catalog/mcosxhksger/chapter/hack05.html



Ich weiss jetzt auch nicht welche Probleme du damit bis jetzt hattest!

Für die UTF-8 mit Bom bin ich mir aber sicher das ich da nicht Unix brauche!

@Flo Hörst du bald mal auf? Ich bin jetzt schon Stammgast auf deiner Seite ! So ab und zu möchte ich noch einen Blick auf meine eigenen werfen!

Gruß
Jörg


Zufällige Umleitung zu der Startseite einer meiner Domains
Meine ungewöhnlichen Tools

lwulfe
Avatar lwulfe
Consultant
Content Halbgott (743 Beiträge)
am 15.01.2010, 00:02 Uhr schrieb lwulfe

Hallo Jörg,
die Erfahrung kommt aus dem Oracle und Informix-Umfeld.
Häufigste Ursache für Fehler: falsche Berechtigung, dann Sonderzeichen im Skript, dann erst syntaktische Fehler. Ich versuche halt, meine bisherigen Erfahrungen auf dieses für mich neue Gebiet des WEB zu projizieren.
Grüße Lutz


Raptor
Avatar Raptor
IT-Student
Content Gott (1013 Beiträge)
am 15.01.2010, 00:05 Uhr schrieb Raptor

joerg schrieb:

@Flo Hörst du bald mal auf? Ich bin jetzt schon Stammgast auf deiner Seite ! So ab und zu möchte ich noch einen Blick auf meine eigenen werfen!


Ja, am Samstag bin ich ausser Haus. Dann kann ich dich also nicht von deiner Arbeit abbringen Es sei denn meine Anwesenheit ist nachwirkend, dann hast du ein Problem. lol Oder du geduldest dich bis zu den Frühlingsferien, dann bin ich für 2 Wochen auf dem Mittelmeer.


Meine Developer-Website mit den Web-Entwickler-Tools.
Meine Web-Entwicklungs-Dienstleistungen

[url="http://www.seitenreport.de/forum/beitraege/seitenreport_verlosungen/wichtig_neue_regel



« zurück zu: Google

Das Seitenreport Forum hat aktuell 5274 Themen und 36108 Beiträge.
Insgesamt sind 48346 Mitglieder registriert.