• 技术文章 >Python技术 >Python基础教程

    python特征生成中字符类型有哪些?

    宋雪维宋雪维2021-02-24 15:43:14原创2466

    python特征生成中字符类型有截取、字符长度和频次。

    一、python特征生成中字符类型

    1、截取

    当字符类型的值过多,通常可对字符类型变量做截取,以减少模型过拟合。如具体的家庭住址,可以截取字符串到城市级的粒度。

    2、字符长度

    统计字符串长度。如转账场景中,转账留言的字数某些程度可以刻画这笔转账的类型。

    3、频次

    二、python特征类型中字符使用

    1、截取第一位字符串

    df['I1_0'] = df['I1'].map(lambda x:str(x)[:1])

    2、字符长度

    df['I1_len'] = df['I1'].apply(lambda x:len(str(x)))
    
    display(df.head())

    3、字符串频次

    df['I1'].value_counts()
    专题推荐:python基础
    上一篇:python中二叉树有哪些类型 下一篇:python用生成器实现协程

    相关文章推荐

    • Queue在python的实例化• python封装中的私有如何理解?• python继承是什么?• python os模块有几种用法?• python单继承和多继承如何定义?• python中dict有哪些删除的方式• python特征生成是什么?

    全部评论我要评论

    © 2021 Python学习网 苏ICP备2021003149号-1

  • 取消发布评论
  • 

    Python学习网