Unicode

Der Unicode ist ein internationaler Standard für Zeichensätze. Diese Zeichensätze kommen bei vielsprachigen Textverarbeitungen im Computerbereich, sowie im Internet für die HTML-Codierung zur Anwendung.

Der Hintergrund für die Entwicklung und die letztendlich internationale Einführung des Unicodes war der Wunsch die weltweit unterschiedlichen und untereinander nicht kompatiblen, länder- und kulturspezifischen Codierungen zu beseitigen.

Schriftzeichen und Symbole unterschiedlichster Kulturen sind in diesem Code zusammen gefasst. Dazu gehören zum Beispiel auch skandinavische, chinesische, japanische, arabische, kyrillische und hebräische Schriftsätze. Allein aus dem Bereich der exotischen Länder stammen über fünfzig Schriftsätze. Die gesamte Datenbank für den Unicode beinhaltet über 230.000 Zeichen, sowie fast eine Millionen Zeichen in Reserve.

Die Zeichenpalette wurde 2003 um Symbole aus den technischen, kaufmännischen und mathematischen Bereichen erweitert. Auch historische Schriften wie zum Beispiel indianische wurden eingefügt.

Die ersten 128 Zeichen sind mit dem ASCII-Code identisch.

Die Formate mit denen die Zeichensätze des Unicode für eine Verarbeitung transformiert werden können (UTF - Unicode-Transformation-Formats) sind UTF-8, UTF-16 sowie UTF-32.

Quelle: Wikipedia, IT-Wissen