gelöschter Benutzer

ISO-8859-1 zu UTF-8

am 26.09.2011, 18:19 Uhr eröffnete folgenden Thread
HTML5 & CSS    3109 mal gelesen    14 Antwort(en).

Ist es kompliziert eine Webseit von ISO-8859-1 zu UTF-8 umzuschreiben? Und wie ist der einfachste Weg?


winelady
Kauffrau
Content Halbgott (862 Beiträge)
am 26.09.2011, 19:30 Uhr schrieb winelady

Hallo Sonnenwelt,

das ist nicht weiter kompliziert; hab es selbst im Frühjahr auch gemacht.

Im Header muß das Characterset geändert werden:


Dann alle Umlaute, ß und alle sonstigen iso-Zeichen, die als Codekombination geschrieben wurden, am besten mit einer dateiübergreifenden Suche/Ersetze-Funktion austauschen Z.B.
ä --> ä
Ä --> Ä
usw.

Viel Erfolg,
Gruß
winelady


Weinvielfalt aus dem Weingut Fuchs
Fremdsprachensatz


gelöschter Benutzer
am 26.09.2011, 20:14 Uhr schrieb

Danke. Und das hört sich machbar an.



gelöschter Benutzer
am 27.09.2011, 01:17 Uhr schrieb

Das wird aber nicht funktionieren.

Die ganze Datei muss in UTF-8 codiert und abgespeichert werden, wenn Teile des Inhaltes aus einer Datenbank kommen müssen die auch neu codiert werden.

Die Servereinstellung muss man gegeben falls auch prüfen, da bei manchen das Charset iso-8859-1 als default eingestellt ist und die Header Daten würden die Metadaten überschreiben.



gelöschter Benutzer
am 28.09.2011, 08:09 Uhr schrieb

@Ultima....schade schade

und kannst du mir mal etwas detaillierter auf den Weg dorthin helfen?


joerg
Avatar joerg
Fachinformatiker Anwendungsentwicklung
Content Gott (1941 Beiträge)
am 28.09.2011, 11:17 Uhr schrieb joerg

Hallo Sonnenwelt

Das sollte dir erstmal weiterhelfen um den Server zu konfigurieren.

www.w3.org/International/O-HTTP-charset



Leider denken viele das es ausreicht utf-8 als Zeichencodierung im Meta Element anzugeben, wie Thomas schon anmerkte.

So an dem Punkt kann man zur Ãœberprüfung des Servers Florians Tool empfehlen.

floern.com/tools/getheader


Oder halt eben auch dieses Tool. Am wichtigsten ist das HTTP Content-Type auf UTF-8 steht.

validator.w3.org/i18n-checker/



Okay ich habe auch ein Tool mal entwickelt das kontrolliert ob der Server utf-8 sendet.

joerghuelsermann.de/tool/xhtml/



Und danach kommt noch das Wissen hinzu welche benannte Entitäten in XML erlaubt sind. Es sind nur 5 Stück. Diesen Punkt sollte man dann beachten, wenn man XHTML anstatt HTML verwendet.
Okay an der Stelle sollte meine Seite zu dem Thema dir weiterhelfen können.

joerghuelsermann.de/tool/entitaeten/



Den Unterschied zwischen XHTML und HTML macht aber auch nicht eine Angabe in einem Meta Element aus sondern auch wieder die Serverkonfiguration.

Ich habe schon lange aufgehört mich darüber zu ärgern das der Großteil der XHTML Dokumente laut Doctype Angabe nur als HTML gesendet wird.
Dann soll man doch bitte HTML5 und nicht XHTML einsetzen.

Wenn es dir nur um die Analyse hier geht reichen momentan die Angaben aus die Hildegard vorgenommen hat.

Gruß
Jörg


Zufällige Umleitung zu der Startseite einer meiner Domains
Meine ungewöhnlichen Tools

winelady
Kauffrau
Content Halbgott (862 Beiträge)
am 28.09.2011, 12:03 Uhr schrieb winelady

sonnenwelt schrieb:

@Ultima....schade schade

und kannst du mir mal etwas detaillierter auf den Weg dorthin helfen?



@Ultima: bei mir hat es prima geklappt.

@Sonnenwelt: warum erstellst Du nicht einfach mal eine Testseite mit einem Stückchen Deines Contents, gibst ihr den richtigen charset, wandelst alle ISOzeichen in utf8 um und probierst es aus? Dann kanns Du gleich sehen, ob der W3C meckert, und ob Dein Server mit dem utf zurechtkommt.

Gutes Gelingen!
Gruß
winelady


Weinvielfalt aus dem Weingut Fuchs
Fremdsprachensatz


gelöschter Benutzer
am 28.09.2011, 13:56 Uhr schrieb

winelady schrieb:
@Ultima: bei mir hat es prima geklappt.



Da hast du wohl Glück gehabt, wobei ich mehr vermute das du die Daten zuvor schon in utf-8 codiert hattest. Deshalb hast du auch in deinem ersten Post ä erwähnt, denn so etwas braucht man normal nicht.


joerg
Avatar joerg
Fachinformatiker Anwendungsentwicklung
Content Gott (1941 Beiträge)
am 28.09.2011, 15:26 Uhr schrieb joerg

Hallo Thomas

Ich denke Hildegard interpretiert es falsch. Entscheidend ist das was der Server sendet und nicht das was in den Meta Elementen steht. Nochmal die Analyse hier wertet momentan nur die Metaangaben oder etwas ähnliches aus und nicht den Server.

Wenn ich den vorher schon erwähnten Validator des W3C aufrufe und beide Seiten in ihrer Signatur eingebe kommt das hier.

HTTP Content-Type No encoding information found Content-Type: text/html

So und mal als Vergleich die Seite von Thomas in seiner Signatur. Das sieht jetzt nach UTF-8 aus.

HTTP Content-Type utf-8 Content-Type: text/html; charset=utf-8

Gruß
Jörg


Zufällige Umleitung zu der Startseite einer meiner Domains
Meine ungewöhnlichen Tools

winelady
Kauffrau
Content Halbgott (862 Beiträge)
am 28.09.2011, 16:10 Uhr schrieb winelady

Ultima schrieb:

winelady schrieb:
@Ultima: bei mir hat es prima geklappt.



Da hast du wohl Glück gehabt, wobei ich mehr vermute das du die Daten zuvor schon in utf-8 codiert hattest. Deshalb hast du auch in deinem ersten Post ä erwähnt, denn so etwas braucht man normal nicht.



Ich hatte im Dreamweaver alle Seiten umgestellt, und dabei wurde aus dem Code ä das ä. Genauso wurden ß, franz. Akzente, Gedankenstrich und andere Sonderzeichen verändert.
Im Dreamweaver war vorher "Iso" angegeben, jetzt utf.

Wenn ich Glück hatte, auch gut. Wünsche ich Sonnenwelt auch. Ihr wißt doch:
"Theorie ist, wenn man alles weiß, und nichts funktioniert.
Praxis ist, wenn alles funktioniert, und keiner weiß, wieso."

Gruß
winelady


Weinvielfalt aus dem Weingut Fuchs
Fremdsprachensatz


gelöschter Benutzer
am 28.09.2011, 17:20 Uhr schrieb

Der Dreamweaver hat also alles erledigt wie ich sagte, Glück gehabt.
Das erklärt auch warum der Shop noch im ISO Format ist, wenn es um die Domain in deiner Signatur geht.




« zurück zu: HTML5 & CSS

Das Seitenreport Forum hat aktuell 5275 Themen und 36110 Beiträge.
Insgesamt sind 48360 Mitglieder registriert.