• 技术文章 >常见问题 >Python常见问题

    Python字符串中一个汉字占几个字节?

     Ly Ly2020-05-16 15:46:30原创10878

    Python中字符汉字在utf-8编码下占三个字节,在gbk编码下占两个字节。

    1、Python中汉字在utf-8编码下示例:

    p2.jpg

    2、Python中汉字在gbk编码下示例:

    p2.jpg

    UTF-8是Unicode的一种实现方式,也就是它的字节结构有特殊要求,所以我们说一个汉字的范围是0X4E00到0x9FA5,是指unicode值,至于放在utf-8的编码里去就是由三个字节来组织,所以可以看出unicode是给出一个字符的范围,定义了这个字是码值是多少,至于具体的实现方式可以有多种多样来实现。

    GBK全称《汉字内码扩展规范》,GBK编码,是在GB2312-80标准基础上的内码扩展规范,使用了双字节编码方案,其编码范围从8140至FEFE(剔除xx7F),共23940个码位,共收录了21003个汉字,完全兼容GB2312-80标准。

    专题推荐:python
    上一篇:python中脚本怎么执行sql语句? 下一篇:Python中字典为什么比列表快?

    相关文章推荐

    • python3如何提取汉字• wingide中汉字乱码解决方法• wingide输出汉字乱码解决方法• python如何判断是不是汉字?• 为什么python2输入不了汉字• python汉字不能编译怎么解决• python注释不能用汉字怎么解决

    全部评论我要评论

    © 2021 Python学习网 苏ICP备2021003149号-1

  • 取消发布评论
  • 

    Python学习网