一、标准差的概念
标准差也被称为标准偏差,在中文环境中又常称均方差,是数据偏离均值的平方和平均后的方根,用σ \sigmaσ表示
标准差是方差的算术平方根。
标准差能反映一个数据集的离散程度。
二、方差的概念
方差是在概率论和统计方差衡量随机变量或一组数据时离散程度的度量,方差越大,说明随机变量取值越离散。
方差在统计描述和概率分布中有不同的定义和计算公式。
三、方差和标准差的区别
因为方差有平方项,导致维度倍数变化,与我们要处理的数据的维度不一致,还有额外的平方。虽然它能很好地描述数据与均值之间的偏离程度,但处理结果并不符合我们的直观思维。比如身高(cm)的方差变成了身高的平方,不能直接反映身高(cm)的偏离程度。标准差的根号偏移了平方,这样描述数据和均值之间的偏离程度就可以相对直观。在描述波动范围时,标准差比方差更方便。标准差越小,这些值与平均值的偏差越小,反之亦然。
python代码
# -*- coding: utf-8 -*- import math def get_standard_deviation(records): """ 标准差 == 均方差 """ variance = get_variance(records) return math.sqrt(variance)