ISO-8859-1 zu UTF-8
Redaktionelle Einordnung
Diese archivierte Diskussion behandelt ISO-8859-1 zu UTF-8 aus Sicht der Rubrik HTML5 & CSS.
Die Diskussion bleibt als Archiv nutzbar. Für die aktuelle Bewertung empfehlen sich ergänzend neuere Artikel, Tools oder eine konkrete Analyse.
Sinnvoll nutzbar bleibt der Thread vor allem als historischer Kontext, für typische Fragestellungen und zur Einordnung älterer Empfehlungen.
Einige im historischen Thread genannte Tools, Dienste oder externe Links könnten heute nicht mehr verfügbar oder inhaltlich überholt sein. Nutzen Sie sie bitte nur mit zusätzlicher Prüfung.
Startbeitrag
Archivierter Thread aus dem Seitenreport-Forum.
Ist es kompliziert eine Webseit von ISO-8859-1 zu UTF-8 umzuschreiben? Und wie ist der einfachste Weg?
Antworten
10 BeiträgeHallo Sonnenwelt,
das ist nicht weiter kompliziert; hab es selbst im Frühjahr auch gemacht.
Im Header muß das Characterset geändert werden:
Dann alle Umlaute, ß und alle sonstigen iso-Zeichen, die als Codekombination geschrieben wurden, am besten mit einer dateiübergreifenden Suche/Ersetze-Funktion austauschen Z.B.
ä --> ä
-->
usw.
Viel Erfolg,
Gruß
winelady
Weinvielfalt aus dem Weingut Fuchs
Fremdsprachensatz
Danke. Und das hört sich machbar an.
Das wird aber nicht funktionieren.
Die ganze Datei muss in UTF-8 codiert und abgespeichert werden, wenn Teile des Inhaltes aus einer Datenbank kommen müssen die auch neu codiert werden.
Die Servereinstellung muss man gegeben falls auch prüfen, da bei manchen das Charset iso-8859-1 als default eingestellt ist und die Header Daten würden die Metadaten überschreiben.
@Ultima....schade schade
und kannst du mir mal etwas detaillierter auf den Weg dorthin helfen?
Hallo Sonnenwelt
Das sollte dir erstmal weiterhelfen um den Server zu konfigurieren.
www.w3.org/International/O-HTTP-charset
Leider denken viele das es ausreicht utf-8 als Zeichencodierung im Meta Element anzugeben, wie Thomas schon anmerkte.
So an dem Punkt kann man zur berprfung des Servers Florians Tool empfehlen.
Oder halt eben auch dieses Tool. Am wichtigsten ist das HTTP Content-Type auf UTF-8 steht.
validator.w3.org/i18n-checker/
Okay ich habe auch ein Tool mal entwickelt das kontrolliert ob der Server utf-8 sendet.
joerghuelsermann.de/tool/xhtml/
Und danach kommt noch das Wissen hinzu welche benannte Entitäten in XML erlaubt sind. Es sind nur 5 Stück. Diesen Punkt sollte man dann beachten, wenn man XHTML anstatt HTML verwendet.
Okay an der Stelle sollte meine Seite zu dem Thema dir weiterhelfen können.
joerghuelsermann.de/tool/entitaeten/
Den Unterschied zwischen XHTML und HTML macht aber auch nicht eine Angabe in einem Meta Element aus sondern auch wieder die Serverkonfiguration.
Ich habe schon lange aufgehört mich darüber zu ärgern das der Großteil der XHTML Dokumente laut Doctype Angabe nur als HTML gesendet wird.
Dann soll man doch bitte HTML5 und nicht XHTML einsetzen.
Wenn es dir nur um die Analyse hier geht reichen momentan die Angaben aus die Hildegard vorgenommen hat.
Gruß
Jörg
sonnenwelt schrieb:
@Ultima....schade schade
und kannst du mir mal etwas detaillierter auf den Weg dorthin helfen?
@Ultima: bei mir hat es prima geklappt.
@Sonnenwelt: warum erstellst Du nicht einfach mal eine Testseite mit einem Stückchen Deines Contents, gibst ihr den richtigen charset, wandelst alle ISOzeichen in utf8 um und probierst es aus? Dann kanns Du gleich sehen, ob der W3C meckert, und ob Dein Server mit dem utf zurechtkommt.
Gutes Gelingen!
Gruß
winelady
Weinvielfalt aus dem Weingut Fuchs
Fremdsprachensatz
winelady schrieb:
@Ultima: bei mir hat es prima geklappt.
Da hast du wohl Glück gehabt, wobei ich mehr vermute das du die Daten zuvor schon in utf-8 codiert hattest. Deshalb hast du auch in deinem ersten Post ä erwähnt, denn so etwas braucht man normal nicht.
Hallo Thomas
Ich denke Hildegard interpretiert es falsch. Entscheidend ist das was der Server sendet und nicht das was in den Meta Elementen steht. Nochmal die Analyse hier wertet momentan nur die Metaangaben oder etwas ähnliches aus und nicht den Server.
Wenn ich den vorher schon erwähnten Validator des W3C aufrufe und beide Seiten in ihrer Signatur eingebe kommt das hier.
HTTP Content-Type No encoding information found Content-Type: text/html
So und mal als Vergleich die Seite von Thomas in seiner Signatur. Das sieht jetzt nach UTF-8 aus.
HTTP Content-Type utf-8 Content-Type: text/html; charset=utf-8
Gruß
Jörg
Ultima schrieb:
winelady schrieb:
@Ultima: bei mir hat es prima geklappt.
Da hast du wohl Glück gehabt, wobei ich mehr vermute das du die Daten zuvor schon in utf-8 codiert hattest. Deshalb hast du auch in deinem ersten Post ä erwähnt, denn so etwas braucht man normal nicht.
Ich hatte im Dreamweaver alle Seiten umgestellt, und dabei wurde aus dem Code ä das ä. Genauso wurden ß, franz. Akzente, Gedankenstrich und andere Sonderzeichen verändert.
Im Dreamweaver war vorher "Iso" angegeben, jetzt utf.
Wenn ich Glück hatte, auch gut. Wünsche ich Sonnenwelt auch. Ihr wißt doch:
"Theorie ist, wenn man alles weiß, und nichts funktioniert.
Praxis ist, wenn alles funktioniert, und keiner weiß, wieso."
Gruß
winelady
Weinvielfalt aus dem Weingut Fuchs
Fremdsprachensatz
Der Dreamweaver hat also alles erledigt wie ich sagte, Glück gehabt.
Das erklärt auch warum der Shop noch im ISO Format ist, wenn es um die Domain in deiner Signatur geht.