12.如何度量给定数据组的中心趋势和离散程度? 资本家和工会公开辩论工人的工资.工会报告说.工人每年拿到的工资平均只有3000元.而资本家却说工人的年平均工资为7300元.到底谁的话更可信呢? 在作出判断之前.我们先来看一下用来计算上述结果的工人工资数:3000.3000.3000.3500.4000.4500.6000.6000.15000和25000.在所有这些工资中.哪一层次的最普遍呢?也就是说.在上面所列的工资中.工人拿哪一种工资的人最多?在数据集合中.我们称出现最多的数字为“众数 .在上面给出的集合中.众数是3000. 用以代替所考虑的最常出现的工资数.我们把所有工人的工资放在-起求平均数.这样得到的是这组数据的平均数.一般用“ 表示.即:对给定的数据.有下列公式.按公式可以计算我们给定的工资集合的平均数元.那么7300元是不是对工人平均工资的合理的估计呢? 有时.用来估计数据集合的中心趋势的另一个数是中位数.把一组数据按从小到大的顺序排列.然后取中间的一个数.它就是中位数.如果数据的个数是偶数.那么中位数就取中间两个数的平均数.那么上述工资数据的中位数是多少呢?易得这组数据的中位数是4250.那么在3000.4250.7300这三个数中.哪一个看上去是平均工资的最好估计呢? 上面讲的众数.平均数和中位数可统称为平均.一般情况下.如果有人告诉你某一数据集合的平均是某个数.而没告诉你它是一个什么样的平均.则这个信息就没有太大的作用.一般来说.即使告诉了你别人用了哪种平均方法.掌握更多的资料比只知道平均更为有价值. 例如.除了知道平均数为7300元以外.我们又知道它由10个人的工资所平均.这样的话.工资总数为73000元.当然.工资总数并不能告诉你工资是如何分配的.这对工会来说似乎是最重要的问题.如果有一份工资为50000元..那么分给其他9个人的工资就不会太多.换一种情况.如果最高工资为8000元.那么大多数雇员一定会得到7000元左右的工资.这样.很清楚.如果与平均工资一起报出最高和最低工资.我们就能对上述两种说法有比较公正的看法了. 如果不是告诉读者最高和最低工资.而是给出了最高和最低工资之差.对于精明的读者.仍然能找到许多有用的信息.例如.如果10份工资的平均数是7300元.极差是22000元.我们就能断定最高工资至少是22000元.更可能是24000元或25000元.因为最少的工资几乎可以肯定会是2000元或多一些.因此有如果10个人的平均工资是7300元.总工资应为73000元.如果一个人的工资大约是24000元.那么其他9个人的总工资应为49000元.9人的平均工资约为5444元. 一个数据集合的极差是这组数据离散程度的度量.可是.极差仅仅依赖于数据两端的值.它没有给出关于这两个端点间数据离散程度的任何信息. 对一个数据集来说.任何一个数据对平均数的离差为使用前面关于工资的数据.我们计算3000对于平均数的离差:再计算15000对于平均数的离差:注意到3000对于的离差为负.而15000对于的离差为正.计算其余的每一工资数对于的离差有: 3000 3500 4000 4500 6000 15000 25000 -4300 -3800 -3300 -2800 -1300 7700 17700 表1-26 由上表可知.所有工资数对于的离差之和为0. 事实上.任何一组数据对平均数的离差之和总是0.因此.不能用对平均数的离差来描述这组数据的离散程度.因为对平均数离差的总和没有给出关于这一数据集合的离散程度的任何信息. 可是.我们可以考查对平均数离差的绝对值.由于一个数的绝对值不会是负数.并且除非对所有的有.否则对平均数的离差的绝对值之和就不会是0.就上述工资的数据来计算这个和.我们得到40900.这个和也不是关于数据离散程度的满意的度量.因此我们用测量数据的个数去除40900.得到4090这个值称为平均离差.它常用来度量数据的离散性. 虽然数据的平均离差能对数据的离散性进行可靠.合理的度量.但在更高级的数学处理中.绝对值的运算常常会带来一些问题.因此.我们常采用所谓标准差来作为离散性的度量. 经过上面的叙述可以知道.之所以使用绝对值函数.主要考虑到它是正的.也就是说.我们只需要考虑绝对值的大小.具有同样性质的另一种函数是将离差平方.这种作法构成了下面标准差概念的基础. 定义:已知是一组观测值.是这组观测数据的平均数.则该组数据的标准差为:标准差的平方与标准差本身是一样方便的.标准差的平方称为方差. 关于上面工资数据的离差和离差的平方如下表: 3000 3500 4000 4500 6000 15000 25000 -4300 -3800 -3300 -2800 -1300 770 1770 18490000 14440000 10890000 7840000 1690000 59290000 313290000 73000 0 464600000 表1-27 一个用以简化计算标准差的等价公式是: 为了推导这个公式.我们来考查方差的公式: 将和式中每一个二项式平方后得到: 整理后得到: 在上式两端取平方根就得到 因为上面的公式和关于标准差的原公式是等价的.所以如果觉得哪个方便就用哪个.例如计算3.5.8.13的标准差.用所推导的公式计算如下: 而运用原公式.我们计算如下: 【
查看更多】
题目列表(包括答案和解析)