文章插圖

文章插圖
最早的字符串編碼是美國標準信息交換碼,即ASCII碼,他僅對10個數字,26個大寫英文字母、26個小寫英文字母及一些其他符號進行了編碼 。ASCII碼最多只能表示256個符號,每個符號占一個字節 。隨著信息技術的發展,各國文字都需要進行編碼,于是出現了GBK、GB2312、UTF-8編碼等 。其中GBk和GB2312是我國制定的中文編碼標準,使用一個字節表示英文字母,2個字節表示中文字符 。而UTF-8是我國通用的編碼,對全世界所有國家用到的字符都進行了編碼 。UTF-8采用一個字節表示英文字符、3個字節表示中文 。在Python3.X中 。默認采用的編碼格式為UTF-8,采用這種編碼有效地解決了中文亂碼的問題 。
注:bytes類型的數據時帶有b前綴的字符串(用單引號或者雙引號表示)例如 b’xd2xb0’和’bmr’都是bytes類型的數據 。
str類型和bytes類型之間可以通過encode()和decode()方法進行轉換,這兩個方法是互逆的過程 。
encode()方法為str對象方法,用于將字符串轉換為二進制數據(即bytes)也稱為編碼,其語法格式如下:
str.encode([encoding="utf-8"][,errors="strict"])參數說明:str:表示要進行轉換的字符串encoding="utf-8":可選參數,用于指定進行轉碼時采用的字符編碼,默認為UTF-8,如果想使用簡體中文,也可以設置為gb2312 。當只有一個參數時,也可省略前面的encoding=,直接寫編碼 。errors="strict":可選參數,用于指定錯誤處理方式,其可選址值strict(遇到非法字符就拋出異常)ignore(忽略非法字符)、replace(用?替換非法字符)或 xmlcharrefreplace(使用xml的字符引用)等,默認為strict 。注:在使用encode()方法時,不會修改原字符串,如果需要修改原字符串,需要對其進行重新賦值 。例如:
verse='野渡無人舟自橫'byte=verse.encode('GBK')print('原字符串:',verse)print('轉換后:',byte)decode()方法為bytes對象的方法,用于將二進制轉換為字符串,即將使用encode()方法轉換的結果再轉換為字符串,也稱為“解碼”,語法格式如下:
bytes.decode([encoding="utf-8"][,errors="strict"])參數說明:bytes:表示要進行轉為二進制數據,通過是encode()方法轉換后的結果 。encoding="utf-8":可選參數,用于指定進行解碼時采用的字符編碼默認為utf-8,如果想使用簡體中文,可以設置為gb2312 。當只有一個參數時,可以省略前面的encoding=,直接寫編碼 。errors="strict":可選參數,用于指定錯誤處理方式,其可選址值strict(遇到非法字符就拋出異常)ignore(忽略非法字符)、replace(用?替換非法字符)或 xmlcharrefreplace(使用xml的字符引用)等,默認為strict 。注:在使用decode()方法時,不會修改原字符串,如果需要修改原字符串,需要對其進行重新賦值 。例如:上面示例中編碼后得到的結果,在這里進行解碼:
【gbk編碼轉換在線 漢字gbk編碼查詢網】
print('解碼后:',byte.decode('GBK'))
- 如何將flv轉換成mp4 flv怎么轉換成mp4
- VOB格式轉換 vob格式轉換成什么格式清晰度最高
- ppt怎么轉換成word文檔文字 ppt怎么轉換成word文檔打印
- pdf怎么轉換成word免費的軟件有哪些 有沒有pdf免費轉換word的軟件
- 手機簡體字繁體字轉換安卓 手機簡體字繁體字轉換器
- txt格式轉換pdf pdf轉txt免費軟件
- 視頻轉換avi格式用什么軟件 avi視頻下載格式轉換器
- mov轉mp4在線轉換 mov格式轉mp4格式手機轉換器
- pdf可以轉換cad pdf怎么轉換成cad
- 手機ppt轉換word文檔怎么操作 電腦ppt轉換word文檔怎么操作
