• 技术文章 >常见问题 >Python常见问题

    python如何进行文本切割

    silencementsilencement2019-12-13 11:13:14原创4439

    python的split() 方法可以实现将一个字符串按照指定的分隔符切分成多个子串,这些子串会被保存到列表中(不包含分隔符),作为方法的返回值反馈回来。该方法的基本语法格式如下:

    str.split(sep,maxsplit)

    此方法中各部分参数的含义分别是:

    str:表示要进行分割的字符串;

    sep:用于指定分隔符,可以包含多个字符。此参数默认为 None,表示所有空字符,包括空格、换行符“\n”、制表符“\t”等。

    maxsplit:可选参数,用于指定分割的次数,最后列表中子串的个数最多为 maxsplit+1。如果不指定或者指定为 -1,则表示分割次数没有限制。

    在 split 方法中,如果不指定 sep 参数,那么也不能指定 maxsplit 参数。

    推荐学习《python教程

    同内建函数(如 len)的使用方式不同,字符串变量所拥有的方法,只能采用“字符串.方法名()”的方式调用。这里不用纠结为什么,学完类和对象之后,自然会明白。

    例如,定义一个保存php中文网网址的字符串,然后用 split() 方法根据不同的分隔符进行分隔,执行过程如下:

    >>> str = "php中文网 >>> c.biancheng.net"
    >>> str
    'php中文网 >>> c.biancheng.net'
    >>> list1 = str.split() #采用默认分隔符进行分割
    >>> list1
    ['php中文网', '>>>', 'c.biancheng.net']
    >>> list2 = str.split('>>>') #采用多个字符进行分割
    >>> list2
    ['php中文网 ', ' c.biancheng.net']
    >>> list3 = str.split('.') #采用 . 号进行分割
    >>> list3
    ['php中文网 >>> c', 'biancheng', 'net']
    >>> list4 = str.split(' ',4) #采用空格进行分割,并规定最多只能分割成 4 个子串
    >>> list4
    ['php中文网', '>>>', 'c.biancheng.net']
    >>> list5 = str.split('>') #采用 > 字符进行分割
    >>> list5
    ['php中文网 ', '', '', ' c.biancheng.net']
    >>>

    需要注意的是,在未指定 sep 参数时,split() 方法默认采用空字符进行分割,但当字符串中有连续的空格或其他空字符时,都会被视为一个分隔符对字符串进行分割,例如:

    >>> str = "php中文网   >>>   c.biancheng.net"  #包含 3 个连续的空格
    >>> list6 = str.split()
    >>> list6
    ['php中文网', '>>>', 'c.biancheng.net']
    >>>
    专题推荐:split
    上一篇:python适合建网站吗 下一篇:python print函数如何不换行

    相关文章推荐

    • python如何转换进制字符串• python3字符串怎么替换• python怎么获得字符串长度• Python字符串操作指南

    全部评论我要评论

    © 2021 Python学习网 苏ICP备2021003149号-1

  • 取消发布评论
  • 

    Python学习网