亚洲视频精品_木耳av在线_成年人免费看_久久精品香蕉_激情国产精品_亚洲第一se情网站

您現在所在的位置:首頁 >關于奇酷 > 行業動態 > python快速入門-字符編碼

python快速入門-字符編碼

來源:奇酷教育 發表于:

python快速入門-字符編碼。

  計算機中顯示的文字都需要編碼格式的支持,否則你只能看到0、1組成的神秘序列
 
  什么是編碼:
 
  計算機出生之初僅僅為了計算,所以只有數字0、1
 
  后來,計算機有了更多的訴求,希望能記錄更多的文字信息,但是計算機還是只認識0、1怎么辦?
 
  有人出了主意:讓數字0代表一個字,數字1代表一個字以此類推:
 
  0--文字1
 
  1--文字2
 
  2--文字3
 
  3--文字4
 
  4--文字5
 
  ......
 
  于是這樣的對照表就稱為編碼格式
 
  編碼的變遷史:
 
  早期計算機表示的數字很少:8位機時代 0-255 所以只能表示256個文字 ascii編碼格式/iso8859-1
 
  chr(數字)可以將數字變為碼表中的文字
 
  print(chr(97))
 
  計算機迅速傳入各個國家:中國出現了gbk(國標碼) gb2312(簡體碼) big5(繁體碼)
 
  亂碼時代:各個國家都有各自的編碼格式,那么計算機在傳輸后,就會亂碼:
 
  例:
 
  可以使用內置函數ord(‘文字’)獲取文字的底層數據:
 
  print(ord('中'))
 
  “中”:底層數字是20013
 
  但是可能韓文編碼下可能未對20013進行映射,那么就會顯示? 這就是亂碼!
 
  大一統時代:unicode
 
  unicode的出現讓亂碼亂象得到控制
 
  unicode碼將幾乎所有文字都約束在它的編碼之下,世界使用一種碼,自然沒有亂碼
 
  中文范圍:"\u4e00"--"\u9fa5"
 
  print("\u4e2d")
 
  現狀:utf-8
 
  unicode作為國際統一碼,也叫雙字節編碼,不利于網絡傳輸,網絡大多流轉英文字符居多
 
  so就出現了變種的unicode:utf-8:英文單字節,其他文字三字節。
 
  為了世界不再亂碼,請用utf-8!!!
 
  組碼:會得到一個bytes序列
 
  字符串.encode(encoding='UTF-8', errors='strict')
 
  解碼:會得到一個按編碼解析的字符串
 
  字節序列.decode(encoding='UTF-8', errors='strict')
 
  如果設置為strict,代表遇到非法字符時拋出異常; 
 
  如果設置為ignore,則會忽略非法字符; 
 
  如果設置為replace,則會用?取代非法字符; 
 
  如果設置為xmlcharrefreplace,則使用XML的字符引用
主站蜘蛛池模板: 久久综合久久自在自线精品自 | 麻豆人妻少妇精品无码专区 | 全免费a级毛片免费看不卡 全免费a级毛片免费看视频 | 国产美女一级做a视频免费 国产美女一级做视频爱 | 亚洲一区在线视频观看 | 国外亚洲成av人片在线观看 | 中文国产成人精品久久96 | 欧美高清在线视频一区二区 | 久久成人免费观看草草影院 | 国产看黄网站又黄又爽又色 | 老湿机一区午夜精品免费福利 | 三级a视频 | 国产精品人妻一区夜夜爱 | 国产欧美成人不卡视频 | 亚洲精品无码成人片久久 | 国产精品视频在线播放 | 欧美成人一品道免费视频 | 国产日韩欧美精品在线 | 亚洲欧洲国产精品香蕉网 | 夜间福利网站 | 午夜一级毛片 | 国产在线视频一区二区三区 | 亚洲国产毛片aaaaa无费看 | 亚洲 欧美 小说 国产 图片 | a在线视频v视频 | 午夜在线观看福利 | 精品人妻va出轨中文字幕 | 午夜福利视频 | 免费久久精品视频 | 欧美日韩另类在线观看视频 | 欧美在线综合 | 91视频在线观看网址 | 久久精品99国产精品日本 | 欧美 激情 另类 自拍 | 亚洲国产精品久久久天堂 | 日韩精品欧美一区二区三区 | 国产激情视频 | 久久美女| 成 人 亚洲 综合天堂 | 女m羞辱调教视频网站 | 92精品国产自产在线观看 |