• 技术文章 >Python技术 >Python基础教程

    python数据变换如何实现

    小妮浅浅小妮浅浅2021-06-10 16:02:21原创3245

    1、数据规范化,即归一化的方法

    常见方法:最小-规范化、z-score规范化、小数定标规范化

    import pandas as pd
    df=pd.DataFrame(A.data[:,3:6])
    df.columns=A.feature_names[3:6]
    #最小-规范化,支持矢量运算
    (df-df.min())/(df.max()-df.min())
     
    #使用sklearn中的preprocessing模块
    from sklearn import preprocessing
    preprocessing.minmax_scale(df)
     
    #z-score规范化:结果=(数值-均值)/标准差,处理后数据的均值为0,标准差为1
    (df-df.mean())/df.std()
     
    #使用sklearn中的preprocessing模块
    from sklearn import preprocessing
    preprocessing.scale(df)
     
    #小数定标规范化:常见落在[-1,1]区间,通过移动小数点的位数实现,移动位数取决于属性绝对值的值的位数
    #ceil向上取整
    import numpy as np
    df/10**np.ceil(np.log10(df.abs().max()))

    2、连续属性离散化

    常见方法:分箱法(等宽法、等频法)、聚类

    import pandas as pd
    #等宽法,5个箱子,标签为0-4
    pd.cut(df.AGE,5,label=range(5))
    #等频法
    pd.qcut(df.AGE,5,label=range(5))

    以上就是python数据变换的实现,希望对大家有所帮助。更多Python学习指路:python基础教程

    本文教程操作环境:windows7系统、Python 3.9.1,DELL G3电脑。

    专题推荐:python数据变换
    上一篇:python如何创建GUI程序 下一篇:python可迭代对象的本质探究

    相关文章推荐

    • 如何对Python数据表进行检查• python数据分析是什么• python数据形式有哪些• 招聘月:Python数据分析岗位迎来机遇• python strftime获取当前时间• python mktime()如何计算时间• python数据模块类如何定义• python如何定义索引模块类• python搜索模块如何查询• python PyQt5如何实现窗口功能• python阻塞调度如何使用• python标记清除的过程• python单向链表如何实现• python有几种排序的方法• python顺序搜索的两种形式• python二分查找的原理• python哈希散列的映射• python装饰器如何保留原函数信息• python装饰器有哪些作用• python序列操作的整理• python字符串中有哪些方法• python格式字符串是什么• python字符串方法format()如何使用• python列表的创建和存放• python列表添加和删除的方法• python默认索引是什么• python列表操作符有哪些

    全部评论我要评论

    © 2021 Python学习网 苏ICP备2021003149号-1

  • 取消发布评论
  • 

    Python学习网