方差和标准差都是用于描述数据分布的统计学量。
方差是指每个数据点与数据集平均值的离差的平方和的平均值。可以用公式表达为:
标准差是方差的平方根,其计算方法是将方差求平方根。可以用公式表达为:
从定义和计算公式来看,标准差是方差的一种测量方法。它们都是衡量数据集的分散程度的指标。在实际应用中,标准差的单位与数据集相同(例如,长度的标准差为米),而方差的单位是数据集单位的平方(例如,长度的方差为平方米)。
在数据分析中,标准差通常被认为是更有解释力和可读性的指标,因为它具有与原始数据相同的度量单位,并且通常更容易理解。方差通常用于一些理论推导,但在实际应用中并不经常使用。
二者是有区别的。
1、离散型是取值乘以对应概率求和,连续型是在积分区间上x乘以密度函数的积分。方差是E(x-Ex)^2=E(x^2)-(Ex)^2,也就是平方的期望减去期望的平方。
2、平方的期望是x^2乘以密度函数求积分,期望的平方是求完期望在算平方。离散型的方差也很明白了。也就是各个取值减去期望后平方在乘以对应的概率。
3、方差是E(x-Ex)^2=E(x^2)-(Ex)^2,也就是平方的期望减去期望的平方。二者不能混为一谈,平方的期望是x^2乘以密度函数求积分。
扩展资料
当数据分布比较分散(即数据在平均数附近波动较大)时,各个数据与平均数的差的平方和较大,方差就较大;当数据分布比较集中时,各个数据与平均数的差的平方和较小。因此方差越大,数据的波动越大;方差越小,数据的波动就越小。 [6]
样本中各数据与样本平均数的差的平方和的平均数叫做样本方差;样本方差的算术平方根叫做样本标准差。样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或样本标准差越大,样本数据的波动就越大。
方差和标准差是测算离散趋势最重要、最常用的指标。方差是各变量值与其均值离差平方的平均数,它是测算数值型数据离散程度的最重要的方法。标准差为方差的算术平方根,用S表示。方差相应的计算公式为:
标准差与方差不同的是,标准差和变量的计算单位相同,比方差清楚,因此很多时候我们分析的时候更多的使用的是标准差。
参考资料来源:百度百科-方差