您现在的位置:首页 > 教案格式 > 正文

抽样分布与参数估计

2019-05-01 04:25 网络整理 教案网

分布规律与参数_世界洋流的分布规律_分布规律与参数

原标题:抽样分布与参数估计

18161412108642050-6070-80

35%30%25%20%

`

15%5%0%90-100

统计学导论

曾五一肖红叶主编

第五章抽样分布与参数估计

第一节抽样的基本概念与数学原理

第二节抽样分布

第三节参数估计

第四节样本容量的确定

第五节EXCEL在参数估计中的应用

5-2

第一节抽样的基本概念与数学原理

一、有关抽样的基本概念二、大数定理与中心极限定理

5-3

一、有关抽样的基本概念

(一)样本容量与样本个数1.样本容量。样本是从总体中抽出的部分单位的集合,这个集合的大小称为样本容量,一般用n表示,它表明一个样本中所包含的单位数。一般地,样本单位数大于30个的样本称为大样本,不超过30个的样本称为小样本。2.样本个数。样本个数又称样本可能数目,它是指从一个总体中可能抽取多少个样本。

5-4

总体 个体 简单随机样本 统计量 样本均值 样本方差和样本矩 分布 分布 分布 分位数 正态总体的常用抽样分布。也就是说,只有知道了样本统计量的分布规律和样本统计量分布的标准误才能计算总体参数可能落入的区间长度,才能对区间估计的概率进行解释,可见标准误及样本分布对于总体参数的区间估计是十分重要的。这时就需要使用不必依赖于总体分布形式的统计推断方法此类推断方法通常称为非参数方法。

5-5

2.样本统计量。样本统计量是样本的一个函数。它们是随机变量。我们利用统计量来估计和推断总体的有关参数。常见的样本统计量有:样本平均数,样本比例,样本的方差、标准差。

5-6

(三)概率抽样及其组织形式所谓概率抽样,就是要求对总体的每一次观察(每一次抽取)都是一次随机试验,并且有和总体相同的分布。按这样的要求对总体观测(抽取)n次,可得到容量为n的样本。

5-7

40、 箱子中有编号1—10的10个小球,每次从中抽出一个记下编号后放回,如果重复3次,则3次记下的小球编号乘积是5的倍数的概率是多少。14.一个均匀的立方体各面上分别标有数字1,2,3,4,6,8,其表面展开图如图所示,抛掷这个立方体,则朝上一面的数字恰好等于朝下一面的数字的2倍的概率是_____.。(1)因位试验400 20=8000次,出现红球6000次,所以摸到红球的频率为6000 8000=3 4,由此可估计出任摸一个红球的概率为3 4(2)设袋子中约有x个红球,则出现红球概率为x x+5,由稳定的频率估计概率得x x+5=3 4,解得x=15,所以袋中约有15个红球利用树状图或表格可以清晰地表示出某个事件发生的所有可能出现的结果。

5-8

显然,(1)和(2)的抽取行为都不是随机试验。因而不属于概率抽样。只有(3)的抽取行为是随机试验。总体的分布可用表5-1的分布列来描述,而(3)的随机试验中所观测的随机变量也有与表5-1有相同的分布。所以,(3)的抽取行为是概率抽样。

表5-1号码频率1

110

10个球号码的分布3

110

2

110

4

110

5

110

6

110

7

110

8

110

9

110

10

110

5-9

(四)放回抽样与不放回抽样

1.放回抽样。放回抽样的具体做法是:从总体中抽出一个样本单位,记录其标志值后,又将其放回总体中继续参加下一轮单位的抽取。放回抽样的特点是:第一,n个单位的样本是由n次试验的结果构成的。第二,每次试验是独立的,即其试验的结果与前次、后次的结果无关。第三,每次试验是在相同条件下进行的,每个单位在多次试验中选中的机会(概率)是相同的。在放回抽样中,样本可能的个数是Nn,N为总体单位数,n为样本容量。

5-10

对任意分布的总体j,期望为EX,方差为DX, 有放回抽选样本,容量为m,设样本均值为随机变量 其中,茗。抽样用 于 镀 层厚度试验的样本应从每一检查批(见3-6)中随机抽取,应按表1要求从每一检查批中抽取不少于即使小数量的制件组成样本。8.8按系统随机抽样方法确定抽取样本:首先给批中每个光盘编号1~n,然后确定抽样间隔,若样本量为n,则取n/n的整数部分作为抽样间隔,最后按抽样间隔从批中抽取样本n。

N!顺序,其样本可能个数为。(N?n)!n!

5-11

(五)抽样分布从总体中可以随机地抽取许多样本,由每一个样本都可以计算样本统计量的观测值,所有可能的样本观测值及其所对应的概率便是所谓的抽样分布。因此,抽样分布也可以称为样本统计量的概率分布。抽样分布可能是精确地服从某种已知分布(所谓已知分布,例如我们在第四章介绍过的各种常见分布),也可能是以某种已知分布为极限分布。在实际应用中,后者更为多见。

5-12

【例5-2】对某公司10名推销员用放回抽样方式抽取容量为n=2

n的样本(y1,y2),构造统计量Y?(?yi)/n。10名推销员任职年限如i?1

表5-2。

表5-2推销员编号任职年限(xi)11223310名推销员任职年限资料4455667788991010

要求:(1)计算样本的可能个数。(2)给出统计量X的分布、数学期望和标准差。

5-13

解:(1)可能样本数=N=10=100所有可能得到的样本如表5-3。表中方格内数对是用推销员序号表示的样本的各种配合方式,括号内数字是推销员任职年限的样本均值。(2)用表5-3中各样本配合方式的样本均值(括号中数字)数据作成分布数列(表5-4)便描述了样本平均数这个统计量的分布。

5-14

n

2

表5-3

1

121,1(1)2,1(1.5)3,1(2)4,1(2.5)

10人中有放回抽二人的全部可能样本

第二次抽取可能被抽中的人员

3

1,3(2)2,3(2.5)3,3(3)4,3(3.5)

2

1,2(1.5)2,2(2)3,2(2.5)4,2(3)

4

1,4(2.5)2,4(3)3,4(3.5)4,4(4)

5

1,5(3)2,5(3.5)3,5(4)4,5(4.5)

6

1,6(3.5)2,6(4)3,6(4.5)4,6(5)

7

1,7(4)2,7(4.5)3,7(5)4,7(5.5)

8

1,8(4.5)2,8(5)3,8(5.5)4,8(6)

9

1,9(5)2,9(5.5)3,9(6)4,9(6.5)

10

1,10(5.5)2,10(6)3,10(6.5)4,10(7)

第一次抽取可能被抽中的人员

345678910

5,1(3)

6,1(3.5)7,1(4)8,1(4.5)9,1(5)10,1(5.5)

5,2(3.5)

6,2(4)7,2(4.5)8,2(5)9,2(5.5)10,2(6)

5,3(4)

6,3(4.5)7,3(5)8,3(5.5)9,3(6)10,3(6.5)

5,4(4.5)

6,4(5)7,4(5.5)8,4(6)9,4(6.5)10,4(7)

5,5(5)

6,5(5.5)7,5(6)8,5(6.5)9,5(7)10,5(7.5)

5,6(5.5)

分布规律与参数_世界洋流的分布规律_分布规律与参数

6,6(6)7,6(6.5)8,6(7)9,6(7.5)10,6(8)

5,7(6)

6,7(6.5)7,7(7)8,7(7.5)9,7(8)10,7(8.5)

5,8(6.5)

6,8(7)7,8(7.5)8,8(8)9,8(8.5)10,8(9)

5,9(7)

6,9(7.5)7,9(8)8,9(8.5)9,9(9)10,9(9.5)

5,10(7.5)

6,10(8)7,10(8.5)8,10(9)9,10(9.5)10,10(10)

5-15

表5-4

样本均值X1.01.52.02.53.03.54.04.55.05.56.06.57.07.58.08.59.09.510.0

合计

任职年限样本均值分布数列

样本数12345678910987654321

100

P(X)0.010.020.030.040.050.060.070.080.090.100.090.080.070.060.050.040.030.020.01

1.00

5-16

利用表5-4的资料,可以计算出样本平均数的期望值与方差。

E(X)??XP(X)?5.50V(X)?E(X)?[E(X)]??XP(X)?[?XP(X)]?34.375?(5.5)?4.125

22222

V(X)?

4.125?2.0310

5-17

二、大数定理与中心极限定理

(一)大数定理。大数定理:独立同分布的随机变量X1,X2,?,Xn,?,并且有数学期望E?Xi???及方差V?Xi???(i=1,2,?)。则对任意的正数ε,有:

2

(5.5)

5-18

大数定理表明:尽管个别现象受偶然因素影响,有各自不同的表现。但是,对总体的大量观察后进行平均,就能使偶然因素的影响相互抵消,消除由个别偶然因素引起的极端性影响,从而使总体平均数稳定下来,反映出事物变化的一般规律。

5-19

(二)正态分布的再生定理如果变量X服从正态分布,总体的平均数是?,标准差是?,从这个总体中抽出一个容量是n的样本,则样本平均数X也服从正态分布,其平均数E(X)仍为?,其标准差为?X。

5-20

从正态分布的再生定理可以看出,只要总体变量服从正态分布,则从中抽取的样本,不管n是多少,样本平均数都服从正态分布。但是在客观实际中,总体并非都是正态分布。对于从非正态分布的总体中抽取的样本平均数的分布问题,需要由中心极限定理来解决。

5-21

林德伯格中心极限定理(独立同分布随机变量序列的中心极限定理),并会用相关定理近似计算有关随机事件的概率.。1、概率论的基本概念2、随机变量及其分布3、多维随机变量及其分布4、随机变量的数字特征5、大数定律及中心极限定理6、样本及抽样分布7、参数估计,其中数三的同学不考参数估计中的区间估计。概率与数理统计:1、概率论的基本概念2、随机变量及其分布3、多维随机变量及其分布4、随机变量的数字特征5、大数定律及中心极限定理6、样本及抽样分布7、参数估计8、假设检验。

5-22

1.理解总体、简单随机样本、统计量、样本均值、样本方差及样本矩的概念,其中样本方差定义为。 对任意分布的总体j,期望为EX,方差为DX, 有放回抽选样本,容量为m,设样本均值为随机变量 其中,茗。第五章已讲到,当总体方差已知时样本平均数的分布为正态分布或渐近正态分布。

5-23

第二节抽样分布

一、样本平均数的抽样分布二、样本比例的抽样分布

5-24

一、样本平均数的抽样分布

(一)样本平均数的期望值与方差

抽样调查用样本指标代表总体指标不可避免会产生误差,抽样推断虽然会有抽样误差(不包括登记误差和系统性误差),但只要严格遵守随机原则,所选的样本结构与总体结构相同,或者两者分布一致,就可以运用数学公式计算抽样误差。假设一定的数据集(一定分 布的总体),已知该分布的期望和方差,从这个总 体中抽出一部分(m个)数据,构成一个样本,计算 出一个样本平均值,这样有放回的无数次抽选样 本,将会产生无数个样本平均数,而且这些样本平 均数具有自己的分布形式。当只知样本平均数(),而不知总体平均数时,可根据平均数的样本分布进行推理。

2

与总体服从同一分布。设总体均值为?,方差差、标准差分别为:

5-25

2x

(5.7)

(5.8)

n

(5.9)

5-26

【例5-3】计算例5-2中10名推销员平均的任职年限及其标准差,并与例5-2求得的样本平均数的期望值与方差作比较。解:??(1?2+3+4+5+6+7+8+9+10)/10=5.5

n

?2.87228/2?2.0310

5-27

在不放回抽样的情况下,数学上可以证明,其样本平均数的期望值同样等于总体的期望值。而样本平均数的标准差为:

(5.10)

上式中的N为总体单位数。与放回抽样相比,这里多了一个

N?nn?1?,这个系数称为不放回抽样的修正系数。由于N?1N

3.横向效应系数h:1%抽样,加载到1000µε4.应变极限:0.01%抽样,均匀慢加力,当应变片的输出应变大于机械应变的10%时,这个应变即为极限应变5.疲劳寿命:抽样0.1%,在±1500µε(允许误差-50--+100µε),频率30hz作用下,当输出应变值相差100µε或出现穗状应变波形时,应变循环次数即为疲劳寿命6.机械滞后:抽样0.1%,应变片测拉压(拉压力相同)应变时,试件产生的应变是某一个值。 2sm时的抽样效果 2sm时的抽样效果 2sm时的抽样效果 4可知当采样频率大于等于信号频率的2倍时采样后的信号得到了忠实地保持 没有产生采样误差 而采样频率小于信号频率的2倍时 发生了混叠误差 这样就不能实现对原信号的复原。 抽样定理抽样定理主要是考虑如何不失真地对信号的抽样 特别是考察待采样信号的频率与采样频率之间的关系 如图1 4所示为二者之间不同关系时 采样后的信号频域示意图。