編碼有哪些


編碼有哪些

文章插圖
常用的編碼有以下方式:
1、ASCII碼 。
ASCII碼,總共有128個,用一個字節的低7位表示,0到31是控制字符如換行回車刪除等 。32到126是打印字符,可以通過鍵盤輸入并且能夠顯示出來 。
2、ISO-8859-1 。
128個字符顯然是不夠用的,于是ISO組織在ASCII碼基礎上又制定了一些列標準用來擴展ASCII編碼,它們是ISO-8859-1到ISO-8859-15,其中ISO-8859-1涵蓋了大多數西歐語言字符,所有應用的最廣泛 。ISO-8859-1仍然是單字節編碼,它總共能表示256個字符 。
3、GB2312 。
它的全稱是《信息交換用漢字編碼字符集基本集》,它是雙字節編碼,總的編碼范圍是A1到F7,其中從A到A9是符號區,總共包含682個符號,從B0到F7是漢字區,包含6763個漢字 。
4、GBK 。
全稱叫《漢字內碼擴展規范》,是國家技術監督局為windows95所制定的新的漢字內碼規范,它的出現是為了擴展GB2312,加入更多的漢字,它的編碼范圍是8140到FEFE(去掉XX7F)總共有23940個碼位,它能表示21003個漢字,它的編碼是和GB2312兼容的,也就是說用GB2312編碼的漢字可以用GBK來解碼,并且不會有亂碼 。
5、GB18030 。
全稱是《信息交換用漢字編碼字符集》,是我國的強制標準,它可能是單字節、雙字節或者四字節編碼,它的編碼與GB2312編碼兼容,這個雖然是國家標準,但是實際應用系統中使用的并不廣泛 。
【編碼有哪些】6、UTF-16 。
UTF-16具體定義了Unicode字符在計算機中存取方法 。UTF-16用兩個字節來表示Unicode轉化格式,這個是定長的表示方法,不論什么字符都可以用兩個字節表示,兩個字節是16個bit,所以叫UTF-16 。UTF-16表示字符非常方便,每兩個字節表示一個字符,這個在字符串操作時就大大簡化了操作,這也是Java以UTF-16作為內存的字符存儲格式的一個很重要的原因 。
7、UTF-8 。