• 技术文章 >Python技术 >Python基础教程

    python3如何提取汉字

    爱喝马黛茶的安东尼爱喝马黛茶的安东尼2019-09-21 17:46:21原创5670

    采用正则表达式的方法对字符串进行处理。

    str1 = "{我%$是,《速$@.度\发》中 /国、人"

    相关推荐:《Python教程

    (1)提取汉字

    汉字的范围为”\u4e00-\u9fa5“,这个是用Unicode表示的。

    import re
    res1 = ''.join(re.findall('[\u4e00-\u9fa5]',str1))
    print(res1)

    输出为:

    ‘我是速度发中国人’

    (2)去除所有符号。采用清理数据,仅保留字母、数字、中文的方法。

    import re
    res1 = re.sub("[^a-zA-Z0-9\u4e00-\u9fa5]", '', str1) 
    print(res1)

    输出为:

    ‘我是速度发中国人’
    专题推荐:python 提取 汉字
    上一篇:python连接数据库失败怎么解决 下一篇:python中乘号怎么写

    相关文章推荐

    • python中如何输入字符串• python 如何保密源代码

    全部评论我要评论

    © 2021 Python学习网 苏ICP备2021003149号-1

  • 取消发布评论
  • 

    Python学习网