Sprachencodings und UTF-8 interpretieren (besondere) Schriftzeichen

sprachencodings
sprachencodings

Die Darstellung von Schriften und Sonderzeichen im Web führt Programmierer immer wieder vor Umsetzungsschwierigkeiten, weil Schriftzeichen unterschiedlich aufgebaut sind und entsprechend unterschiedlich interpretiert werden müssen.

Warum funktioniert Kyrillisch nicht wie Deutsch?

Das Problem der Darstellung hat einen historischen Hintergrund: Das Web war in seiner Entwicklung schon immer ein amerikanischer Markt und die Schriftzeichen-Übersetzung wurde zuerst lediglich mit einem die amerikanischen Schriftzeichen erfassenden Sprachcode encodiert: mit ISO 8859-1.

Mit der Verbreitung und dem stetig steigenden Zugriff auf das World Wide Web stieg die Dringlichkeit nach weiteren Encodings.

So wurde für Kyrillisch (unter anderem) ISO 8859-5 entwickelt; dies muss auf Meta-Ebene programmiert werden, damit der kyrillische Zeichensatz richtig abgebildet wird: Kyrillisch auf HTML.

Die sprachspezifischen Encodings wurden unübersichtlich und fanden aufgrund ihrer uneinheitlichen Vielzahl nur wenig Unterstützung, um von jedem Browser und jedem Server interpretiert zu werden: Es wurde die UTF-8-Kodierung entwickelt.

UTF-8

Die UTF-8-Kodierung – Universal Transformation Format – ist, wie ihr Name sagt, eine universelle Encoding-Sprache. Damit können alle Schriftzeichen und Sonderzeichen unabhängig von Browsern und Servern angezeigt werden.

Wenn zum Beispiel die Zeichen nicht sauber gepflegt sind oder Text nicht als bereinigter Text im CMS gepflegt ist, kann es zu dieser häufig auftretenden Fehlinterpretation der Sonderzeichen kommen:

Das kaufmännische & aus dem Sonderzeichen А (kyrillisch für A) wird als & interpretiert und die Zeichen #1040; als Fließtext angehängt.

ZOOLU kann Kyrillisch

Kyrillisch ist ein Beispiel von vielen; das Prinzip der Encodierung ist immer das gleiche: Kyrillisch, Japanisch oder ein anderer Sprachcode werden mit UTF-8 interpretiert.

Auf diese Weise hat MASSIVE ART mit dem Open Source CMS ZOOLU ein weltweites Webportal für die Ivoclar Vivadent AG umgesetzt.

MASSIVE ART Newsletter: Sprachencodings und UTF-8
MASSIVE ART Newsletter: Sprachencodings und UTF-8

Diskutieren Sie mit uns auf Facebook und Twitter . Natürlich freuen wir uns auch über ein E-Mail von Ihnen.

Mehr Artikel zum Thema:

loading
Nach oben