您现在的位置:首页 > 教案怎么写 > 正文

偏差公式注:在统计学的应用中,参数估计和假设检验是最重要的两(3)

2018-02-03 03:03 网络整理 教案网

由上面的内容,可以得到统计量的一些特点:

统计量可以用于对总体中的未知参数进行点估计;

有些统计量的分布是明确的,例如“三大统计分布”所代表的统计量;

“三大抽样分布”都是统计量的分布,这些统计量的分布形式是明确的(有具体的数学公式,不包含未知参数),这也是为什么这三类分布在统计学中如此重要的原因之一。因为事实上大部分的统计量要么很难确定其分布,要么含有未知参数。

除此之外,统计量还有以下特点(参考wiki):

可观察性:事实上也就是说统计量不含有未知参数,一旦观察的样本确定了,统计量的值也就确定了(例如样本均值、样本方差、样本矩等);

便捷性:也就是具有某种概括性,只用一个量就描述了大量样本的某些重要特性(例如样本均值);

统计特性:完整性、一致性等;

偏差的公式_偏差公式_重生之偏差txt百度云

分布已知且用于假设检验的统计量(例如三大分布所表示的统计量)也被称为检验统计量。

如果一个总体中的参数未知,例如全国人口的平均身高$\mu$,一般受限于时间或是人力物力我们不可能测量整个总体来确定这个参数的准确值。通常的做法是随机抽取一定量的样本(例如每个省抽取总人口的1%),然后求这些样本的平均升高(一个统计量),最后利用该统计量来估计总体中的未知参数。下面是wiki中的一个例子:

一个统计参数用于计算北美所有 25 岁的男性人口的平均身高。作为采样,我们随机地选择了 100 名符合条件的人测量了身高;这 100 人的平均身高是比较容易被统计出来的,而全部符合条件的人的平均身高是很难统计的,除非把每个人都拿来测量一遍身高。当然,如果普查了所有人,那么计算得到的数据则是统计参数(总体参数),而非统计量。

定义:设总体$X$有概率密度(或分布律)$f(x; \theta)$,其中$\theta$是待估的未知参数。设$X_1, ..., X_n$是一个样本,记:

$$G = G(X_1, ..., X_n; \theta)$$

为样本和待估参数$\theta$的函数,如果$G$的分布已知,不依赖与任何参数,就称$G$为枢轴量。

由上述定义可以看出枢轴量的几个特点:

与某个待估参数有关(事实上枢轴量法主要被用于未知参数的区间估计);

本身含有未知参数(待估参数),因此不具有“可观察性”,也就是说即使选定了样本也无法计算出确定的值;

其分布是明确的(有具体的数学公式,不包含未知参数)。

一个比较常见的例子:正态分布转换成标准正态分布时,随机变量中还是包含未知参数,但是其分布中却不包含任何未知参数。因此标准化之后的随机变量是一个枢轴量。

再次比较一下这两个量的异同:

枢轴量和统计量都是样本的函数,但是枢轴量中还包含未知参数(待估计参数);

枢轴量和统计量的分布都是某种抽样分布,与样本本身所属的总体分布不同;

枢轴量的分布不依赖于任何未知参数,统计量的分布常依赖于未知参数;

如果将枢轴量中的未知参数用某个已知的估计量替代,那么枢轴量就变成统计量了;

统计量常用于点估计和假设检验;

枢轴量常用于区间估计。

问题:

总体$X \sim N(\mu, \sigma^2)$,$\mu, \sigma$是未知参数. 要估计参数$\mu$. 设$X_1, ..., X_n$是一样本,请问下面三个量,

$$\bar{X}, \frac{\bar{X} - \mu}{\sigma/\sqrt{ n } }, \frac{\bar{X} - \mu}{S/\sqrt{ n } }$$

哪些是统计量?哪些是枢轴量?

答:

(1) 只有$\bar{X}$是统计量,另两个含有未知参数,所以不是统计量;

(2) $\bar{X} \sim N(\mu, \sigma^2/n)$,分布含有未知参数;

(3) 第二项中除了$\mu$之外,还含有其他未知参数$\sigma$(不是枢轴量);

(4) 第三项只是$\mu$和样本的函数,服从$t(n - 1)$分布(是枢轴量)。

从这个例子可以看出来,我们之前熟知的样本均值$\bar{X}$是一个统计量,但是它的分布是不明确的(含有未知参数);第三项是一个枢轴量,本身含有未知参数,但是分布是明确的。