查ASC碼/ASCII碼和EBCDIC碼
使用得最多的、最普遍的是ASCII字元編碼, 即American Standard Code for Information Interchange, 如表2.8所示。
從表中可以看到:
每個字元是用7位元基2碼表示的, 其排列次序為b6b5b4b3b2b1b0, 在表中的b6b5b4為高位部分, b3b2b31b0為低位元部分。而一個字元在電腦內實際上用8位元表示。正常情況下, 最高一位b7為 "0"。在需要奇偶校驗時, 這一位可用於存放奇偶校驗的值, 此時稱這一位為校驗位。
表2.8 ASCII字元編碼表
b6b5b4 |
000 001 010 011 100 101 110 111 |
b3b2b1b0 |
- |
0 0 0 0 0 0 0 1 0 0 1 0 0 0 1 1 0 1 0 0 0 1 0 1 0 1 1 0 0 1 1 1 1 0 0 0 1 0 0 1 1 0 1 0 1 0 1 1 1 1 0 0 1 1 0 1 1 1 1 0 1 1 1 1 |
NUL DLE SP 0 @ P 、 p SOH DC1 ! 1 A Q a q STX DC2 " 2 B R b r ETX DC3 # 3 C S c s EOT DC4 $ 4 D T d t ENQ NAK % 5 E U e u ACK SYN & 6 F V f v BEL ETB ' 7 G W g w BS CAN ( 8 H X h x HT EM ) 9 I Y I y LF SUB * : J Z j z VT ESC + ; K [ k { FF FS , < L \ l | CR GS - = M ] m } SO RS . > N ↑ m ~ SI US / ? O - o DEL |
ASCII是128個字元組成的字元集。其中編碼值0-31不對應任何可印刷(或稱有字形)字元, 通常稱它們為控制字元, 用於通信中的通信控制或對電腦設備的功能控制。編碼值為32的是空格(或間隔)字元SP。編碼值為127的是刪除控制DEL碼。其餘的94個字元稱為可印刷字元,有人把空格也計入可印刷字元時,則稱有95個可印刷字元。請注意, 這種字元編碼中有如下兩個規律:
(1)字元0-9這10個數字元的高3位元編碼為011, 低4 位為000-1001。當去掉高3位的值時, 低4位元正好是二進位形式的0-9。這既滿足正常的排序關係, 又有利於完成ASCII碼與二進位碼之間的類型轉換。
(2)英文字母的編碼值滿足正常的字母排序關係, 且大、小寫英文字母編碼的對應關係相當簡便, 差別僅表現在b5一位的值為0或1, 有利於大、小寫字母之間的編碼變換。
另有一種字元編碼,是主要用在IBM電腦中的EBCDIC代碼(Extended Binary Coded Decimal Interchange Code)。它採用8位元碼, 有256個編碼狀態, 但只選用其中一部分。0-9十個數字元的高4位元編碼為1111, 低4位仍為0000-1001。大、小寫英文字母的編碼同樣滿足正常的排序要求, 而且有簡單的對應關係, 即同一個字母的大小寫的編碼值僅最高的第二位的值不同, 易於識別與變換。