本科生《统计计算》教材,采用R语言和Julia语言,包括误差(6)
所以平均相对误差可以用\(0.80 \frac{S_N}{\sqrt{N} \hat\theta} = 0.80 \frac{\text{RMSE}}{\hat\theta}\)估计。 平均相对误差为0.005相当于估计结果有两位有效数字, 平均相对误差为0.0005相当于估计结果有三位有效数字。
由\(\hat\theta\)的近似正态分布式, 一次估计的绝对误差\(| \hat\theta - \theta |\)的近似95%上界为\(2 \frac{S_N}{\sqrt{N}}\): \[\begin{aligned}P\left( | \hat\theta - \theta | \leq 2 \frac{S_N}{\sqrt{N}} \right) \approx 95\% ,\end{aligned}\] 所以也可以用\(2 \frac{S_N}{ \sqrt{N}} = 2\text{RMSE}\)作为绝对误差大小的一个度量, 用\(2 \frac{S_N}{ \sqrt{N} \hat\theta}\)作为相对误差大小的一个度量。
为了计算样本量\(N\)需要取多大才能控制估计的根均方误差小于\(\sigma_0\), 可以先取较小的\(N_0\)抽取\(N_0\)个样本值计算出\(S_{N_0}^2\), 用\(S_{N_0}^2\)估计总体方差\(\sigma^2\), 然后求需要的\(N\)的大小: \[\begin{aligned} \frac{S_{N_0}}{\sqrt{N}} < \sigma_0, \quad N > \frac{S_{N_0}^2}{\sigma_0^2}.\end{aligned}\]
用\(\hat\theta=\bar Y_N\)估计\(\theta=EY\)时, 可以利用近似正态分布式计算\(\theta\)的近似95%置信区间:\[\begin{align} \hat\theta \pm 2 \frac{S_N}{ \sqrt{N}} . \tag{11.12}\end{align}\]在更复杂的随机模拟问题中, 参数\(\theta\)不是用独立同分布样本的均值来估计, 设样本量为\(N\)时参数估计为\(\hat\theta\)并设\(\hat\theta\)是\(\theta\)的相合估计。 这时\(\hat\theta\)的方差\(\text{Var}(\hat\theta)\)没有简单的公式, \(\hat\theta\)也没有简单易得的渐近分布。 为了评估\(\hat\theta\)的随机误差大小, 可以独立地执行\(B\)次模拟, 每次得到一个估计量\(\hat\theta^{(j)}\), \(j=1,2,\dots,B\)。 令\(\bar\theta = \frac{1}{B} \sum_{j=1}^B \hat\theta^{(j)}\)。
估计根均方误差RMSE为\[\begin{align} \widehat{\text{RMSE}} = \sqrt{\frac{1}{B} \sum_{j=1}^B (\hat\theta^{(j)} - \theta)^2}, \tag{11.13}\end{align}\]但其中的\(\theta\)未知,仅能在已知\(\theta\)真值的验证问题中采用此计算公式。 如果已知\(\hat\theta\)是无偏或渐近无偏估计,则可估计根均方误差为\[\begin{align} \widehat{\text{RMSE}} = \sqrt{\frac{1}{B} \sum_{j=1}^B (\hat\theta^{(j)} - \bar\theta)^2} . \tag{11.14}\end{align}\]类似地,若\(\theta\)已知,估计平均绝对误差为\[\begin{align} \widehat{\text{MAE}} = \frac{1}{B} \sum_{j=1}^B \left| \hat\theta^{(j)} - \theta \right|, \tag{11.15}\end{align}\]估计平均相对误差为\[\begin{align} \widehat{\text{MRE}} = \frac{1}{\theta} \frac{1}{B} \sum_{j=1}^B \left| \hat\theta^{(j)} - \theta \right|, \tag{11.16}\end{align}\]
台湾的明白人很多糊涂人也很多