Python中中文字符串怎么处理?-Python常见问题-Python学习网

Python中中文字符串怎么处理?

 Ly2020-05-14 14:03:46原创

如果处理的字符串中出现中文表示的字符，要想不出错，就得转成unicode编码了。具体的方法有：

1、decode()，将其他边编码的字符串转换成unicode编码，如str1.decode('gb2312')，表示将gb2312编码的字符串str1转换成unicode编码；

2、encode()，将unicode编码转换成其他编码的字符串，如str2.encode('gb2312')，表示将unicode编码的字符串str2转换成gb2312编码；

3、unicode()，同decode()，将其他编码的字符串转换成unicode编码，如unicode(str3, 'gb2312')，表示将gb2312编码的字符串str3转换成unicode编码。

转码的时候一定要先搞明白字符串str是什么编码，然后decode成unicode，最后再encode成其他编码。

另外，对一个unicode编码的字符串在进行解码会出错，所以在编码未知的情况下要先判断其编码方式是否为unicode，可以用isinstance(str, unicode)。

不仅是中文，以后处理含非ascii编码的字符串时，都可以遵循以下步骤：

1、确定源字符的编码格式，假设是utf8；

2、使用unicode()或decode()转换成unicode编码，如str1.decode('utf8')，或者unicode(str1, 'utf8');

3、把处理后字符串用encode()编码成指定格式。

专题推荐：中文字符串

Python进阶视频教程

《Python进阶视频教程》本节课程是由极客学院录制的，Python是完全面向对象的语言。函数、模块、数字、字符串都是对象。并且完全支持继承、重载、派生、多继承，有益于增强源代码的复用性。Python支持重载运算符和动态类型。相对于Lisp这种传统的函数式编程语言，Python对函数式设计只提供了有限的支持。有两个标准库(functools, itertools)提供了Haskell和Standard ML中久经考验的函数式程序设计工具。

Python基础视频教程( Django)

Python全栈+人工智能VIP课程，手把手带领大家从零基础学习Python语言以及人工智能应用开发。结合实际项目案例，由浅入深、全面系统地培养大家的独立开发能力，以从容应对企业开发任务，应对智能时代的新需求。

Python基础视频教程( Tornado)

Python高级视频教程

Python高级进阶视频教程

Python中中文字符串怎么处理?

相关文章推荐

相关课程推荐

Python进阶视频教程

Python基础视频教程( Django)

Python基础视频教程( Tornado)

Python高级视频教程

Python高级进阶视频教程

全部评论我要评论

Python学习网