Immer wieder rauchen die Köpfe vor Ärger, wenn es einem die Datenbank mit lauter unnützen kyrillischen Sonderzeichen zerschossen hat - und dummerweise ist schon alles gemacht, als der Fehler auffällt. Das gibt meist sehr viel Arbeit für nichts und wieder nichts. Und wer ist nun Schuld? Nun darüber lässt sich streiten, wo aber das Problem liegt, wissen wir ganz genau:
Vielen, auch erfahrerenern Programmierern, fehlt eine ausreichende Kenntnis über Zeichensatz. Zu allererst muss ein gewählter Zeichensatz überall durchgängig verwendet werden, auf der ganzen Webseite bzw. dem ganzen Projekt. Der Zeichensatz wird bei Webprojekten 2x ausschlaggebend gekennzeichnet.
Damit Eingaben aus Formularen o.ä. im richtigen Zeichensatz übermittelt werden, muss man klar definieren, welcher Zeichensatz genutzt werden soll. Das geschieht wie folgt:
1 2 | <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> |
Da UTF-8 eine extrem große Anzahl von möglichen Zeichen im Zeichensatz beinhaltet und keine Nachteile mit sich bringt, ist dies der einzig sinnvolle Zeichensatz für das globale Web und seine Applikationen.
An alle Entwickler: Nutzt UTF-8! Bei strikter Durchführung erfährt man niemals wieder Zeichensatzprobleme, versprochen.
Hinweis:
Allen zeichensatzgeschädigten PHP-Entwickler kann ich utf8_encode() und utf8_decode() ans Herz legen.