• 技术文章 >常见问题 >Python常见问题

    python如何画直方图

    (*-*)浩(*-*)浩2019-08-29 15:49:10原创14140
    matplotlib.pyplot直方图画起来还是非常方便的,思路还是准备好数据,然后设置参数即可。

    直方图(Histogram)又称质量分布图。是一种统计报告图,由一系列高度不等的纵向条纹或线段表示数据分布的情况。 一般用横轴表示数据类型,纵轴表示分布情况。

    直方图是数值数据分布的精确图形表示。 这是一个连续变量(定量变量)的概率分布的估计,并且被卡尔·皮尔逊(Karl Pearson)首先引入。它是一种条形图。 为了构建直方图,第一步是将值的范围分段,即将整个值的范围分成一系列间隔,然后计算每个间隔中有多少值。 这些值通常被指定为连续的,不重叠的变量间隔。 间隔必须相邻,并且通常是(但不是必须的)相等的大小。

    直方图是调用的matplotlib.pyplot.hist模块

    matplotlib.pyplot.hist的参数:

    matplotlib.pyplot.hist(x,bins = None,range = None,density = None,weights = None,cumulative = False,bottom = None,
    histtype =’bar’,align =’mid’,orientation =’vertical’,rwidth = None,log = False,color = None,label = None,
    stacked = False,normed = None,hold = None,data = None,** kwargs )

    hist的参数详解

    x : (n,)数组或序列(n,)数组

    输入值,这需要单个数组或不需要具有相同长度的数组序列

    bins : 整数或序列或’auto’可选,默认是没有

    如果一个整数,bins +1,则计算并返回bin边缘,与之一致numpy.histogram()

    range : 元组或没有可选的,默认是没有

    箱子的上下范围。上下异常值将被忽略。如果没有提供,范围是(x.min(),x.max())。如果箱子是一个序列没有影响范围 
    如果指定箱是一个序列或范围,自动定量是基于指定本范围而不是x的范围。

    density :可选布尔类型

    如果这是真的,返回第一个元素的元组将计数归一化形成一个概率密度,即。,面积(或积分)根据直方图将之和为1。这是通过将整个计算
    观测的数量乘以本宽度,而不是除以总数量的观察。如果堆也是真的,直方图之和是标准化为1。 
    默认是没有赋范和密度。如果设置,那么将使用这个值。如果没有设置,那么参数将被视为错误的

    weights:可选择相同的数据或者没有

    数组的重量、形状相同的x。每个值x只贡献相关重量对箱数(而不是1)。如果赋范或密度是真的,权重归一化,这样的积分密度范围是1。

    cumulative:可选布尔类型

    如果True,则计算直方图,其中每个bin给出该bin中的计数加上较小值的所有bin。最后一个bin给出了数据点的总数。如果赋范或密度 
    也True然后直方图归一化,使得最后仓等于1。如果累计计算结果为小于0(例如,-1),累积的方向被反转。在这种情况下,如果赋范
    和/或密度也是True,则直方图归一化,使得第一仓等于1。 
    默认是 False

    bottom:相同数组,标量或者没有

    每个仓的底部基线的位置。如果是标量,则每个bin的基线移动相同的量。如果是一个数组,每个bin都是独立移动的,底部的长度必须
    与bin的数量相匹配。如果为None,则默认为0。默认是 None

    histtype : {‘bar’,’barstacked’,’step’,’stepfilled’},可选

    要绘制的直方图的类型 
    ‘bar’是传统的条形直方图。如果给出多个数据,则条并排排列。 
    ‘barstacked’是一种条形直方图,其中多个数据堆叠在一起。 
    ‘step’生成一个默认未填充的线图。 
    ‘stepfilled’生成一个默认填充的线图。 
    默认为’bar’

    align : {‘left’,’mid’,’right’},可选

    控制直方图的绘制方式。 
    ‘left’:条形图位于左边框边缘的中心。 
    ‘mid’:条在bin边缘之间居中。 
    ‘right’:条形图位于右侧边框的中心。 
    默认为’mid’

    orientation : {‘horizontal’,’vertical’},可选

    如果是’horizontal’,barh将用于条形直方图,底部 kwarg将用于左边缘

    log : 布尔值,可选

    如果True,直方图轴将设置为对数刻度。如果 log是True且x是1D数组,则将过滤掉空箱,并且仅 返回非空。(n, bins, patches).
    默认是 False

    color :颜色

    颜色规格或颜色规格序列,每个数据集一个。Default(None)使用标准线颜色序列.默认是 None

    实例:

    import numpy as np
    import matplotlib.pyplot as plt
    
    np.random.seed(19680801)
    mu, sigma = 100, 15
    x = mu + sigma * np.random.randn(10000)
    n, bins, patches = plt.hist(x, 50, density=True, facecolor='g', alpha=0.75)
    
    plt.xlabel('Smarts')
    plt.ylabel('Probability')
    plt.title('Histogram of IQ')
    plt.text(60, .025, r'$\mu=100,\ \sigma=15$')
    plt.axis([40, 160, 0, 0.03])
    plt.grid(True)
    plt.show()

    效果图:

    专题推荐:python
    上一篇:python中如何读取csv 下一篇:python能重写方法吗

    相关文章推荐

    • python如何确定是否为可迭代对象• python如何查看模块

    全部评论我要评论

    © 2021 Python学习网 苏ICP备2021003149号-1

  • 取消发布评论
  • 

    Python学习网