标准偏差,标准差,标准误以及Excel中的STDEV函数们
标准偏差:标准偏差(StdDev, Standard Deviation) 等于标准差。
标准差的名称有10余种,如总体标准差、母体标准差、均方根误差、均方根偏差、均方误差、均方差、单次测量标准差和理论标准差等。标准差是方差的算术平方根。
总体标准差的定义式为:
其中u为总体算数平均值,N为总体数。
由于总体算数平均值和总体数是不能实际得到的。所以通常我们用样本标准差来估计总体标准差。或者说是把样本标准差作为总体标准差直接使用。样本标准差的计算公式如下:
其中x bar为样本算数平均值,n为样本数。
s反映了整个样本变量的分散程度。样本标准差小,说明样本变量的分布比较密集在平均数附近,否则,表明样本的分布比较离散。当n→∞时,样本标准差无穷接近总体标准差。
标准误
抽样调查用样本指标代表总体指标不可避免会产生误差,抽样推断虽然会有抽样误差(不包括登记误差和系统性误差),但只要严格遵守随机原则,所选的样本结构与总体结构相同,或者两者分布一致,就可以运用数学公式计算抽样误差。如果分割后的影像对象平均大小为m 个像素,即从总体中抽取样本容量为m的样本并求 均值,根据式(1),数据集的类内方差与训练样本数 量成正比例关系,对所有均值组成的数据集进行分 类,由于其类内方差为总体方差的I/m,所要求训练 样本的数量大大减小了。由于它忽略高阶项,往往会使误差被过高地预估,为了提供误 差估计的精度,需要把高阶项的影响也考虑进’去标准误差 excel,为此文【8】提出一个对式、 12 的修正因子: 、c 葛1,牖一 、 13 7 其中的p吲是对高阶项指数的估计。
σ.x=(1/根号n)σ
与总体标准差σ类似,样本平均数的标准误σ.x也无法求出,只能估计。即用样本平均数的标准误:s.x=(1/根号n)s(也称平均数的标准偏差)
也就是说,只有知道了样本统计量的分布规律和样本统计量分布的标准误才能计算总体参数可能落入的区间长度,才能对区间估计的概率进行解释,可见标准误及样本分布对于总体参数的区间估计是十分重要的。越接近0就表明收入分配越是趋向平等,反之,收入分配越是趋向不平等。williamkruskal (1919-2005) allenwallis (1912-1998) 从总体中抽取的样本必须是独立的用于检验多个总体是否相同(对应的参数方 法—方差分析) kruskal-wallis检验不需要总体服从正态 分布且方差相等这些假设 该检验可用于顺序数据,也可用于数值型 数据 :并非所有总体都相同或等价于 不全相同1、合并所有的样本 2、将合并后的样本值从低到高排序 3、将排序后的值用秩代替,从最小值1开始 4、统计量 样本k的秩和样本k的样本容量 6、如果样本至少包含5个观测值,样本统计量h的分布就非常近似于自由度为k-1的卡方分布 n:观察值个数。
Excel2010中有STDEV,STDEV.P, STDEV.S, STDEVA,STDEVPA等6个函数,如下图:
· 其中函数STDEV等同于STDEV.S,计算公式均为样本标准差的计算公式。S代表Sample
函数STDEVP与STDEV.P的计算公式一样,代表意义也一致,只不过STDEV.P是代替STDEVP的新函数。计算公式为总体标准差的计算公式。
具体差别是:STDEV代表standarddeviation,翻译成标准差或者标准偏差,反映数值相对于平均值(mean) 的离散程度。.S代表Sample(样本),.P代表Population(总体)。STDEV.S就是样本标准差。STDEV.P则是总体标准差。两者的差别就是方差计算时前者用(样本数-1)而后者用(样本数)作为分母。在使用时标准误差 excel,我们大量接触的是样本,所以普遍使用根号内除以(n-1)来计算标准差,如在抽样统计中。而总体标准差则用到总体平均数已知的情况,比如在统计一个班学生的成绩时。
STDEVA也是样本标准差,它与STDEV函数的区别是文本值和逻辑值(TRUE或FALSE)也将参与计算。所以在不包含逻辑值或文本值时,两者结果是一样的。STDEVPA则是计算时包含文本值和逻辑值的总体标准差。
从当年替八国联军运输