• 技术文章 >Python技术 >Python基础教程

    python中Fearturetools三个基本概念

    宋雪维宋雪维2021-02-24 16:07:06原创2422

    常规特征工程学方法通过人工构造特征,是一个繁琐、费时且易出错的过程。自动化特征工程是一个通过诸如Fearturetools之类的工具,从一组相关数据表中自动产生有用特征的过程。与手工生成的特征相比,该方法效率更高,重复性更高,并能更快的建立模型。

    一、Featuretools是什么?

    Featuretools是一个用于执行自动化特征工程的开源库。

    二、Featuretools基本的三个概念

    1、Feature Primitives(特征基元):

    生成特征的常用方法,分为聚合、转换的方式。

    特征加工方法

    import featuretools as ft
    
    ft.list_primitives()

    2、Entity(实体)

    可以被看作类似Pandas DataFrame, 多个实体的集合称为Entityset。

    实体间可以根据关联键添加关联关系Relationship。

    3、dfs(深度特征合成)

    是从多个数据集创建新特征的过程,可以通过设置搜索的深度(max_depth)来控制所特征生成的复杂性。

    专题推荐:python基础
    上一篇:python greenlet如何交替运行 下一篇:defaultdict在python中接收调用对象

    相关文章推荐

    • python os模块有几种用法?• python单继承和多继承如何定义?• python中dict有哪些删除的方式• python中二叉树有哪些类型• python特征生成中字符类型有哪些?• python用生成器实现协程

    全部评论我要评论

    © 2021 Python学习网 苏ICP备2021003149号-1

  • 取消发布评论
  • 

    Python学习网