11.如何对大量的原始数据进行数据分组? 当碰到大量原始数据时.把这些数据按适当的区间分组是方便的.为了便于计数.希望所选择的每个区间的中点是诸如5或10的倍数.一般区间数应不少于10个而不多于25个.区间的边界值通常应比原始数据中出现的小数位数多一位.以便使得每一个数据仅包含在一个区间之内. 假定下面的数据是有50个高中学生的一个班在某次数学测验中所得到的分数: 88 74 67 49 69 38 86 77 66 75 94 67 78 69 84 50 39 58 79 70 90 79 97 75 98 77 64 69 82 71 65 68 84 73 58 78 75 89 91 62 72 62 74 81 79 81 86 78 90 81 乍一看这些分数就知道.最低分为38.最高分为98.于是.如我们要把数据分组.使区间中点为5的整倍数.可分为13个区间.它满足大于10小于25的条件.为了保证每个数据仅被包含在一个区间内.区间的边界确定到小数点后一位.这就得出下面的数学测验得分的分组频数表. 区间 区间中点 频数 频数百分数 累积频数 累积频数百分比 37.5-42.5 42.5-47.5 47.5-52.5 52.5-57.5 57.5-62.5 62.5-67.5 67.5-72.5 72.5-77.5 77.5-82.5 82.5-87.5 87.5-92.5 92.5-97.5 97.5-102.5 40 45 50 55 60 65 70 75 80 85 90 95 100 2 0 2 0 4 5 7 8 10 4 5 2 1 4 0 4 0 8 10 14 16 20 8 10 4 2 2 2 4 4 8 13 20 28 38 42 47 49 50 4% 4% 8% 8% 16% 26% 40% 56% 76% 84% 94% 98% 100% 表1-23 为了从图形上说明分组数据的频数分布.我们用频数直方图来代替点频数图.直方图是一种条线图.其中每一个矩形的底表示一个区间.高表示在给定的区间内观测数据的个数.上述数学测验得分分组直方图如图1-6所示: 对未分组的数据作出的累积图给出了累积分布.对分组数据.我们叫做累积折线.也叫尖顶图.这个图的作法是:折线上的点的横坐标取所在区间的右边界.纵坐标取相应的累积频数.然后把所确定的点用线段连接起来.横坐标为第一个区间的左边界.纵坐标为零的点.也包括在累积折线内.如图1-7所示: 这样.对于累积折线上的任何一点.纵坐标给出了少于或等于横坐标的观察数据的数目.从前面给出的数学测验的累积折线图上可以看到.少于或等于91分的大约为45人. 像在累积图上一样.也可用同样的方法在累积折线上决定百分位数.例如.在上图中可以读出.中位数为76,25百分位数是67,75百分位数是82. 前面的问题介绍了频数表和频数分布.这个问题中又介绍了如何对数据进行分组.让我们来看一道例题说明前面这些图表的作法. 例 下面是30个灯泡的寿命 870 840 920 950 960 810 830 860 900 800 940 920 850 840 880 810 950 840 830 910 970 930 870 930 900 980 910 930 970 880 试作出这组数据的总频数图和累积图.另外把这些数据按区间795-815.815-835.835-855.-.975-995分组.作出其频数表.直方图和累积折线. 思路启迪 为了作出点频数图和累积图.我们先做出这组数据的频数 表如下所示: 寿命 频数 寿命 频数 800 810 820 830 840 850 860 1 2 0 2 3 12 1 900 910 920 930 940 950 960 2 2 2 3 1 2 1 870 880 890 2 2 0 970 980 990 2 1 0 表1-24 有了上面的频数表.我们很容易作出点频数图和累积图. 规范解法 根据所给数据的频数表我们可以作出点频数图和累积图如下所示: 按给定的分组可得频数表.直方图和累积折线分别如下: 区间 区间中点 频数 频数百分比 累积频数 累积频数百分比 795-815 805 3 10 3 10 815-835 825 2 6.7 5 16.7 835-855 845 4 13.3 9 30 855-875 965 3 10 12 40 875-895 885 2 6.7 14 46.7 895-915 905 4 13.3 18 60 915-935 925 5 16.7 23 76.7 935-955 945 3 10 26 86.7 955-975 965 3 10 29 96.7 975-995 985 1 3.3 30 100 表1-25 【
查看更多】
题目列表(包括答案和解析)