如何用R软件 制作数据的茎叶图、箱线图以及五数总括
ssrsmmy发表于 2014-12-27 15:00
数据的茎叶图、盒子图以及五数总括
一、实验目的
掌握判断样本数据是否来自正太总体的方法;对于给定的样本数据,会通过R软件画出样本数据的茎叶图、盒子图以及能够计算五数总括。
二、实验内容
通过R软件画出样本数据的茎叶图、箱线图,并计算五数总括。
三、准备知识
1.茎叶图
茎叶图有三列数:左边的一列数统计数,它是上(或下)向中心累积的值,中心的数(带括号)表示最多数组的个数;中间的一列表示茎,也就是变化不大的位数;
右边的是数组中的变化位,它是按照一定的间隔将数组中的每个变化的数一一列出来,像一条枝上抽出的叶子一样,所以人们形象地叫它茎叶图。茎叶图是一个与直方图相类似的特殊工具,但又与直方图不同,茎叶图保留原始资料的资讯,直方图则失去原始资料的讯息。将茎叶图茎和叶逆时针方向旋转90度,实际上就是一个直方图,可以从中统计出次数,计算出各数据段的频率或百分比。从而可以看出分布是否与正态分布或单峰偏态分布逼近。
2.箱线图
箱线图(Boxplot)也称箱须图(Box‐whisker Plot),是利用数据中的五个统计量:最小值、第一四分位数、中位数、第三四分位数与较大值来描述数据的一种方法,它也可以粗略地看出数据是否具有有对称性,分布的分散程度等信息,特别可以用于对几个样本的比较。
3.五数总括
直方图、茎叶图虽然包含了大量的样本信息,但是没有做任何加工或简化。有时,我们需要用少数几个统计量来对大量的原始数据进行概括。而最有代表性的、能够反映数据重要特征的五个数为:中位数、下四分位数、上四分位数、最小值和较大值。这五个数称为样本数据的五数总括。r 茎叶图
四、实验背景
某灯泡生产厂商测试某种新型灯泡的燃烧寿命,如下数据表格列出了200个灯泡样本的可使用小时数。
107 73 68 97 76 79 94 59 98 57
79 98 63 65 66 62 79 86 68 74
64 79 78 79 77 86 89 76 74 85
92 78 88 77 103 88 63 68 88 81
74 70 85 61 65 81 75 62 94 71
93 61 65 62 92 65 64 66 83 70
78 66 66 94 77 63 66 75 68 76
61 71 77 91 96 75 64 76 72 77
81 71 85 99 59 92 94 62 68 72
85 67 87 80 84 93 69 76 89 75
73 81 54 65 71 80 84 88 62 61
61 82 65 98 63 71 62 116 65 88
73 80 68 78 89 72 58 69 82 72
64 73 75 90 62 89 71 71 74 70
85 84 83 63 92 68 81 62 79 83
70 81 77 72 84 67 59 58 73 83
73 76 90 78 71 101 78 43 59 67
74 65 82 86 79 74 66 86 96 89
77 60 87 84 75 77 51 45 63 102
59 77 83 68 72 67 92 89 82 96
五、实验过程
1.绘出数据的茎叶图
>stem(x)
The decimal point is 1 digit(s) to the right of the |
4|3
4|5
5|14
5|78899999
6|011111222222223333334444
6|5555555566666677778888888899
7|000011111111222222333333444444
7|5555556666667777777778888889999999
8|00011111122223333344444
8|5555566667788888999999
9|00122222334444
2.绘出箱线图
>boxplot(x)
3. 计算五数总括
> fivenum(x)
43.066.5 75.584.0116.0
ssrsmmy发表于 2014-12-27 15:03
EXCEL与R的绘制方法已说,接下来是SAS的,敬请期待:rolleyes:
hyz901214发表于 2014-12-27 17:12
好的
liangbowang发表于 2014-12-27 22:11
学习了,谢谢!
ssrsmmy发表于 2014-12-29 13:58
自己顶一个
ssrsmmy发表于 2014-12-29 13:58
虽然服役时间早