您现在的位置:首页 > 教案格式 > 正文

【精品】正态分布与参数估计

2019-05-01 04:24 网络整理 教案网

火车票座位分布规律_经纬线的分布规律_分布规律与参数

1正态分布与均数的参数估计统计学教研室徐涛2normal distribution 正态分布又称高斯分布, 是以均数为中心, 两侧对称的钟型分布。 一种重要的连续型分布。 正态分布的概率密度函数, 即正态分布曲线的方程为1)(π 一般用 N( µ, σ2) 表示均数为 µ, 方差为 σ2的正态分布。222σ)(2µ−σ−=xexf3standard normal distribution−=xu 如果进行变量变换,分布曲线的中心位置就由μ移到0, 正态分布即可转化为标准正态分布。, 并使μ= 0, σ= 1 , 正态 标准正态分布也称为u分布,准正态离差。 标准正态分布的概率密度函数为:u称为标准正态变量或标 标准正态分布可用N( 0, 1 ) 表示。 正态分布图和标准正态分布图.docσµ222π1)(ueu−=ϕ4正态分布的特征 正态曲线在横轴上方均数处最高。 标准正态分布在u=0时, ϕ( u) 达到最大值。

火车票座位分布规律_分布规律与参数_经纬线的分布规律

 正态分布以µ为中心, 左右对称。 正态分布有两个参数, 即µ和σ。– µ是位置参数, 当 σ恒定后, µ 越大, 则 曲线沿横轴越向右移动; µ 越小, 则曲线沿横轴越向左移动。– σ是变异度参数, 当 µ 恒定时, σ越大, 表示数据越分散, 曲线越扁平; σ越小, 表示数据越集中, 曲线越陡峭。 正态曲线下的面积分布有一定的规律。5正态曲线下面积的分布规律 横轴上的一定区间的面积占总面积的百分数, 用以估计该区间的例数占总例数的百分数( 频率分布) , 或变量值落在该区间的概率( 概率分布) 。 正态曲线下区间的面积, 可以通过对正态变量X的累计分布函数F( X) 的积分来求得, 它反映了 正态曲线下, 横轴尺度自 -∞ 到X的面积, 即下侧累计面积。xtxdeXF∫∞−−σ−=222)(2π1)(µσ6正态曲线下面积的分布规律 当µ、 σ和X已知时, 须进行u转换对标准正态变量u的累计分布函数Φ(u)的积分。

火车票座位分布规律_分布规律与参数_经纬线的分布规律

81、正态曲线在横轴上方且均数所在处最高、正态分布以均数为中心左右对称、有两个参数、在+1处各有一个拐点、正态分布的面积有一定的规律。了解标准正态分布、 分布、分布和分布得上侧 分位数,会查相应的数值表.3.掌握正态总体的样本均值.样本方差.样本矩的抽样分布.4.了解经验分布函数的概念和性质.十九、参数估计考试内容:点估计的概念 估计量与估计值 矩估计法 最大似然估计法考试要求1.了解参数的点估计、估计量与估计值的概念.2.掌握矩估计法(一阶矩、二阶矩)和最大似然估计法.。peaks符号计算多变量taylor级数展开将u一律编码的信号转换为线性信号空值输入宗量数验证函数输入宗量数函数输出宗量数二项式系数和全部组合数产生高维格点矩阵返回维数求数组维数数组a的维数准备新的缺省图,轴下一个新图取最接近的较大2次幂非负二乘解矩阵的非零元素总数矩阵的非零元素总数矩阵或向量范数正态分布累计概率密度函数估计矩阵的最大范数矢量估计矩阵2范数正态分布逆累计概率密度函数正态分布概率密度函数正态随机数发生器启动matlab和word的集成环境当前时钟时间零空间把非整数转换为串获取最小公分母和相应的分子表达式返回矩阵元素个数元素个数nyquist图指定存放非零元素所需内存非stiff微分方程边步长解算器stiff微分方程变步长解算器低阶法解微分方程低阶法解刚性微分方程适度stiff微分方程解算器stiff微分方程解算器非stiff微分方程变步长解算器ode文件模版获知ode选项设置参数ode输出函数的二维像平面图ode输出函数的三维相空间图ode输出函数的时间轨迹图在matlab指令窗显示结果全为1的阵打开图形从options构架中取得优化参数创建或改写优化泛函指令的选项参数值创建/修改option构架设定图形的排放方式设置走纸方向值空间正交化收集matlab内存碎块扩大内存调出图形排版对话框pascal矩阵创建块对象设置matlab搜索路径搜索路径管理器暂停暂停画坐标框属性分段hermit插值创建预解译p码文件伪彩图matlab提供的典型三维曲面具有两变量的采样数据函数。

分布规律与参数_经纬线的分布规律_火车票座位分布规律

( P2.5, P97.5) ( 双侧)( -∞,P95) 或( P5, + ∞) ( 单侧)当资料不能满足正态性要求时, 可用百xx9sample 样本: 从总体中随机抽取的部分观察单位的某个变量值所组成的集合。 抽样的目 的: 用样本信息来推断总体特征, 要保证样本的可靠性和代表性,使样本能够充分地反映总体的真实情况。 这就要求严格遵循随机化的原则,并保证足够的样本含量。10sampling error 由于抽样而造成的样本统计量和总体参数之差称为抽样误差( sampling error)。 由于抽样而造成的样本均数和总体均数之差称为均数抽样误差, 抽样误差是抽样研究固有的特点, 是不可避免的。 抽样误差的分布有一定的规律性, 并且可以通过一定的方法来估计。11N( μ,σ2)( μ,σ2)nxnx),σ(µ2xxN12Central Limit Theorem 中 心极限定理: 从正态总体N( μ,σ2) 中 ,随机抽取例数为n的样本, 样本均数 也服从正态分布, 即使是从偏态总体中 抽样, 当 n足够大时, 样本均数的分布仍然服从正态分布, 样本均数的均数µµ =x, 标准差为。分布规律与参数

火车票座位分布规律_经纬线的分布规律_分布规律与参数

xσ( )( )x()µµ =××=×=×==∑=i∑=i∑=innEnxEnnxExEninini111111x13N( μ,σ2)样本2n样本1n1 x2 x1 x2 xk x……样本kn……nk x……xμxσ14standard error是样本均数的标准差称为 均数标准误( 简称标准误) , 它反映了 样本均数与总体均数之间的接近程度, 常用以说明均数抽样误差的大小。 标准误的计算:xσnxσσ =15∑=i∑=i∑=i×=×==nininixVarnxVarnnxVarxVar12121)(1)(1)()(2)(σ=ixVar()()nnσnnxVar222222211)(σ=σ+σ+σ×=+×=nxσσ =16standard error of mean 在实际工作中, 总体标准差σ常是未知的而是用 样本标准差s来代替σ,作。

ssx=的 估计值记 例: 某地成年男 子红细胞数的抽样调查,n=144人,=5.38× 1012/L, s =0.44× 1012/L,求其标准误。ssx144/44. 0==xσxsnxLn/10037. 012×=17标准误的用途 标准误是反映样本均数变异程度的指标, 常用来表示抽样误差的大小。– 标准误大反映样本均数抽样误差大, 其对总体均数的代表性差;– 标准误小, 样本均数抽样误差就小, 其对总体均数的代表性就好。 标准误可用 于计算总体均数的可信区间, 也是进行假设检验的基础。18均数抽样误差的分布- t分布 在总体均数为 µ, 标准差为 σ的正态总体中 , 独立随机的抽取样本含量为n的样本, 则样本均数服从正态分布:µµ =x 将样本均数标准化, 则: 如果变量是正态的或近似正态的, 则标准化的变量服从或近似服从N( 0, 1 ) 分布, 即u分布。nxσσ =xxuσµ−=),σ(µ2xxN19t distribution t 变换: 其结果就不再服从标准正态分布了 , 而是服从自 由度为n-1 的t分布。

nsxsxtxµ−µ−==20t 分布的特征 t分布只有一个参数, 即自 由度; 单峰分布, 以0为中心, 左右两侧对称; t 分布的峰部较矮而尾部翘得较高, 说明远侧t值的个数相对较多, 即尾部面积较大; t 分布不是一条曲线, 而是由一簇随自 由度改变而变化的曲线所组成; 当ν逐渐增大时, t分布逐渐逼近标准正态分布; 当 ν=∞ 时, t分布就完全成为标准正态分布了 。21420-2-4.4.3.2.10.0ν=5ν=1ν=∞22t 界值 统计学家已将各种自 由度对应的t 分布曲 线下的尾部面积( 概率) 的百分界值编制成t 界值表。 表右上角插图中阴影部分, 表示tα,ν以外尾部面积占总面积的百分数, 即概率P。 随着自 由度ν的增大, t 界值逐渐减小, 当自由 度 无 穷 大 时 ,t0.05,=1 .645, 即为u分布的界值。双 侧 t0.05=1 .96,单 侧23t 界值 如由表查出单侧t0.05,1 0=1 .81 2, 表示从正态总体作样本例 数为 1 1 的随机抽样, 其t值服从ν=n-1 =1 1 -1 =1 0的t 分布, 理论上P(t≤-1 .81 2)=0.05, 或P(t≥1 .81 2)=0.05 用一般的表示法为– 单侧: P(t≤-tα,ν)=α, 或P(t≥tα,ν)=α– 双侧: P(t≤-tα,ν)+P(t≥tα,ν)=α反之 P(-tα,ν<t<tα,ν)=1 -α24Parameter estimation 参数估计是通过样本指标( 统计量) 来估计总体指标( 参数) 。分布规律与参数

这是用极差估计标准差的问题.样本数n=10,极差d=0.3668-0.2465=0.1203标准差sigma=d/cn=0.1203/3.0775=0.03909(cn是换算系数,要查极差分布表)以上结果是在样本总体为正态分布的假定之下.。区间估计是根据样本分布的理论,用样本分布的标准误(se)计算区间长度,解释总体参数落入某置信区间可能的概率。例如对总体平均数μ的估计,用样本均数。