2.茎叶图
(1)适用范围:当样本数据较少时,用茎叶图表示数据的效果较好.
(2)优点:它不但可以保留所有信息,而且可以随时记录,给数据的记录和表示都带来方便.
(3)缺点:当样本数据较多时,枝叶就会很长,茎叶图就显得不太方便.
[探要点、究所然]
探究点一 频率分布折线图、总体密度曲线的概念
思考1 如下图,在城市居民月均用水量样本数据的频率分布直方图中,各组数据的平均值大致是哪些数?
答 大致是这些小长方形下端的中点的横坐标,即0.25,0.75,1.25,1.75,2.25,2.75,3.25,3.75,4.25.
思考2 在频率分布直方图中,依次连接各小长方形上端的中点,就得到一条折线,这条折线称为频率分布折线图,你认为频率分布折线图能大致反映样本数据的频率分布吗?
答 由于折线图是取了长方形上端的中点,即每一组数据平均值对应的频率,所以能大致反映样本数据的频率分布.
思考3 当总体中的个体数很多时(如抽样调查全国城市居民月均用水量),随着样本容量增加,作图时所分的组数增多,组距减少,你能想象出相应的频率分布折线图会发生什么变化吗?
答 由于组数的增多,组距减少,长方形上端中点的数量增多,且相距越近,各相邻长方形上端中点的折线越短,折线变得近似于曲线.
思考4 在上述背景下,相应的频率分布折线图越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.那么下图中阴影部分的面积有何实际意义?
答 图中阴影部分的面积,就是总体在区间(a,b)内的取值的百分比.
思考5 对于一个总体,如果存在总体密度曲线,能否通过样本数据准确地画出总体密度曲线?为什么?
答 不能.由于频率分布折线图是随着随机抽取的样本、样本的容量和分组情况的变化而变化的,因此不能由样本的频率分布折线图得到准确的总体密度曲线.
探究点二 茎叶图
问题 某赛季甲、乙两名篮球运动员每场比赛的得分情况如下:
甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;
乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.
思考1 你能理解这个图是如何记录这些数据的吗?你能通过该图说明哪个运动员的发挥更稳定吗?
答 中间的数字表示得分的十位数,旁边的数字分别表示两个人得分的个位数.从图中看出乙运动员的发挥更稳定.
思考2 在统计中,思考1中的图叫做茎叶图,它也是表示样本数据分布情况的一种方法,那么“茎”、“叶”分别指的是哪些数?
答 茎是指中间的一列数,叶就是从茎的旁边生长出来的数.
小结 茎叶图的定义:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.
思考3 一般地,画出一组样本数据的茎叶图的步骤如何?
答 第一步,将每个数据分为“茎”(高位)和“叶”(低位)两部分;
第二步,将最小的茎和最大的茎之间的数按大小次序排成一列,写在左(右)侧;
第三步,将各个数据的叶按次序写在茎右(左)侧.
思考4 你认为用茎叶图表示数据的分布情况有哪些优点?又有什么缺陷?
答 优点:(1)保留了原始数据,没有损失样本信息;(2)数据可以随时记录、添加或修改;(3)可以帮助分析样本数据的大致频率分布,还可以用来分析样本数据的一些数字特征.
缺陷:茎叶图只方便记录两组的数据,两组以上的数据虽然能够记录,但是没有表示两组记录那么直观、清晰.
例1 某中学甲、乙两名同学最近几次的数学考试成绩情况如下:
甲的得分:95,81,75,89,71,65,76,88,94,110,107;
乙的得分:83,86,93,99,88,103,98,114,98,79,101.
画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.
解 甲、乙两人数学成绩的茎叶图如图所示.
从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是98分;甲同学的得分情况除一个特殊得分外,也大致对称,中位数是88分,但分数分布相对于乙来说,趋向于低分阶段.因此乙同学发挥比较稳定,总体得分情况比甲同学好.
反思与感悟 茎叶图和频率分布表极为类似,事实上,茎相当于频率分布表中的分组;茎上叶的数目相当于频率分布表中指定区间组的频率.
跟踪训练1 下面是甲、乙两名运动员某赛季一些场次得分的茎叶图,据下图可知( )
A.甲运动员的成绩好于乙运动员
B.乙运动员的成绩好于甲运动员
C.甲、乙两名运动员的成绩没有明显的差异
D.甲运动员的最低得分为0分
答案 A
解析 从茎叶图上看,由于甲运动员的成绩多数集中在31以上,而乙运动员的成绩集中在12到29之间,所以甲运动员成绩较好.
例2 甲、乙两位同学在高三的5次月考中数学成绩统计如茎叶图所示,若甲、乙两人的平均成绩分别是x甲,x乙,则下列正确的是( )
A.x甲>x乙;乙比甲成绩稳定
B.x甲>x乙;甲比乙成绩稳定
C.x甲<x乙;乙比甲成绩稳定
D.x甲<x乙;甲比乙成绩稳定
答案 C
解析 从茎叶图可知,甲五次成绩中一次茎为8,一次茎为9,而乙五次成绩中,茎8和茎9各两次,故可知x甲<x乙,乙比甲成绩稳定.
反思与感悟 从茎叶图观察比较甲、乙成绩哪个稳定的问题,主要是看它们的成绩的分布,如果相对集中在中位数附近,则成绩稳定,如果分散,则成绩不稳定.
跟踪训练2 某校举行演讲比赛,9位评委给选手A打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若统计员计算无误,则数字x应该是 ( )
A.5 B. 4 C. 3 D.2
答案 D
解析 去掉最低分87,去掉最高分94(假设x≤4),则7×91=80×2+9+8+90×5+2+3+2+1+x,
∴x=2,符合题意.
同理可验证x>4不合题意.
[当堂测、查疑缺]