el Zeratulo
Threadersteller
Dabei seit: 04.04.2002
Ort: Bent Badheim
Alter: -
Geschlecht:
|
Verfasst Do 12.06.2003 21:51
Titel [FAQ] Zeichenkodierung |
|
|
Zeichenkodierung
Zeichensätze beruhen auf einer 8bit Speicherung und können daher im Normalfall 256 verschiedene Zeichen darstellen. Die ersten Zeichensätze beruhten noch auf 7bit (Anfangs gab es sorgar 5 oder 6bit Zeichensätze). Zwischen den verschiedenen Zeichensätzen setzen sich einige besonders durch:
ASCII: American Standard Code for Information Interchange http://www.faqs.org/rfcs/rfc20.html
ASCII ist einer der wenigen international anerkannten alphanumerischen Codes. Er wurde in Amerika entwickelt und konnte sich durch seine Verwendung im UNIX Betriebssystem sowie in den aufkommenden Personal Computern durchsetzen. ASCII beruht auf einem 7bit Zeichensatz, doch inzwischen wird das 8. Bit zum Anzeigen zusätzlicher Buchstaben (Umlaute, Sonderzeichen) und mathematischer Zeichen genutzt. Ein Bit dient immer als Fehlererkennungsbit. Die ersten 32 Zeichen des ASCII Zeichensatzes bestehen aus Steuerzeichen, sie dienen dem Betriebssystem zum kommunizieren mit Peripheriegeräten wie z.B. Druckern. So befindet sich unter den Steuerzeichen etwa Der Zeilenvorschub oder der Carriage Return (Rückkehr des Druckkopfes). Aus ASCII heraus entwickelten sich verschiedenste erweiterte Schriftsätze. Ein weiterer International anerkannter ist hierunter der ANSI Zeichensatz, der ASCII um die oben angesprochenen Zeichen erweitert.
EBCDIC: Extended Binary Coded Decimal Interchange Code
EBCDIC ist ein propietärer Zeichensatz der in IBM Mainframe Computern eingesetzt wurde. Erstmals fand er in den 60er Jahren Verwendung in verschiedenen Lochkartensystemen. Die verwendeten Character/Zeichen gleichen ungefähr denen des ASCII Zeichensatzes, sind aber anders Kodiert.
EBCDIC war von jeher ein 8bit Code und wird auch heute noch auf IBM Mainframes eingesetzt.
ANSI: American National Standards Institute
Der ANSI-Code ist eine auf 256 Zeichen erweiterte Version des ASCII Codes. Heutzutage wird aufgrund der Globalisierung und der wachsenden Wichtigkeit des Internets immer mehr ein Zeichensatz gefordert der nicht nur die Grundsätzlichen Zeichen des Westlichen Schriftsystems sondern neben all den Verfügbaren Sonderzeichen und Mathematischen/ Physikalischen Spezialcharackteren auf die Verschiedenen Zeichensätze anderer Kulturen wie etwa Chinesich, Japanisch oder Kyrilisch unterstützt. Dieser Notwendigkeit ist mit dem UNICODE Zeichensatz Rechnung getragen worden.
UNICODE: http://www.unicode.org/
UNICODE verwendet in der Version 2.0 eine 2byte Zahl für jedes Zeichen. Somit lassen sich 65536 verschiedene Zeichen darstellen. In einer erweiterten Version kann UNICODE sogar bis zu 2 Millionen Zeichen darstellen. UNICODE schließt die Verschiedenen Zeichensätze Verschiedener Kulturen mitein und unterstützt in den ersten 255 Zeichen den ANSI (und somit auch ASCII) Zeichensatz. In den meisten gängigen Betriebssystemen wird ein UNICODE Zeichensatz mitgeliefert.
Zuletzt bearbeitet von tacker am Fr 13.06.2003 08:13, insgesamt 1-mal bearbeitet
|
|