python编码和解码区别是什么？-Python常见问题-Python学习网

python编码和解码区别是什么？

yang2020-05-20 13:10:19原创

python中的编码与解码的区别：

编码 / encode：将 Unicode 字符串转换为特定编码格式对应的字节码的过程

解码 / decode：将特定编码格式的字节码转换为对应的 Unicode 字符串的过程

示例：

In [43]: '美丽人生'.encode('gbk')
Out[43]: b'\xc3\xc0\xc0\xf6\xc8\xcb\xc9\xfa'

In [44]: b'\xc3\xc0\xc0\xf6\xc8\xcb\xc9\xfa'.decode('gbk')
Out[44]: '美丽人生'

In [45]: '美丽人生'.encode('utf-8')
Out[45]: b'\xe7\xbe\x8e\xe4\xb8\xbd\xe4\xba\xba\xe7\x94\x9f'

In [46]: b'\xe7\xbe\x8e\xe4\xb8\xbd\xe4\xba\xba\xe7\x94\x9f'.decode('utf-8')
Out[46]: '美丽人生'

In [47]: b'\xc3\xc0\xc0\xf6\xc8\xcb\xc9\xfa'.decode('gbk').encode('utf-8')
Out[47]: b'\xe7\xbe\x8e\xe4\xb8\xbd\xe4\xba\xba\xe7\x94\x9f'

上面这种以 b 开头的就是字节码，一个斜杠就是一个字节。可见，一个常用汉字用 GBK 格式编码后占 2 个字节，用 UTF-8 格式编码后占 3 个字节。因为存储或传输时，也用 UTF-8 编码，所以一个汉字占的空间就是 3 个字节。

字符串长度和字节码长度：

In [61]: len('美丽人生')
Out[61]: 4

In [62]: len(b'\xe7\xbe\x8e\xe4\xb8\xbd\xe4\xba\xba\xe7\x94\x9f')
Out[62]: 12

更多Python知识请关注Python自学网。

专题推荐：python

Python高级进阶视频教程

Python全栈+人工智能VIP课程，手把手带领大家从零基础学习Python语言以及人工智能应用开发。结合实际项目案例，由浅入深、全面系统地培养大家的独立开发能力，以从容应对企业开发任务，应对智能时代的新需求。

Python3 Selenium3 自动化测试开发实战

本套Python自动化测试教程零基础讲解自动化测试， selenium 安装到八种元素定位，用户事件处理，等待时间处理，到单元测试框架 Unitest 整合实战，整合自动化测试项目实战，新版本HTML TestRnner 生成测试报告，自动化发送测试报告邮件等核心知识点

python编码和解码区别是什么？

相关文章推荐

相关课程推荐

Python高级进阶视频教程

Python3 Selenium3 自动化测试开发实战

《Develop with Python on Windows》（微软官方-中文版）

全部评论我要评论

Python学习网