1.线性相关性检验
例1.一个工厂在某年里每月产品的总成本y(万元)与该月产量x(万件)之间由如下一组数据:
x |
1.08 |
1.12 |
1.19 |
1.28 |
1.36 |
1.48 |
1.59 |
1.68 |
1.80 |
1.87 |
1.98 |
2.07 |
|
y |
2.25 |
2.37 |
2.40 |
2.55 |
2.64 |
2.75 |
2.92 |
3.03 |
3.14 |
3.26 |
3.36 |
3.50 |
|
1)画出散点图;2)检验相关系数r的显著性水平;3)求月总成本y与月产量x之间的回归直线方程.
解析:
i |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
xi |
1.08 |
1.12 |
1.19 |
1.28 |
1.36 |
1.48 |
1.59 |
1.68 |
1.80 |
1.87 |
1.98 |
2.07 |
yi |
2.25 |
2.37 |
2.40 |
2.55 |
2.64 |
2.75 |
2.92 |
3.03 |
3.14 |
3.26 |
3.36 |
3.50 |
xiyi |
2.43 |
2.264 |
2.856 |
3.264 |
3.590 |
4.07 |
4.643 |
5.090 |
5.652 |
6.096 |
6.653 |
7.245 |
=,==2.8475,=29.808,=99.2081,=54.243 |
1)画出散点图:
2)
r=
=
在“相关系数检验的临界值表”查出与显著性水平0.05及自由度12-2=10相应的相关数临界值r0.05=0.576<0.997891, 这说明每月产品的总成本y(万元)与该月产量x(万件)之间存在线性相关关系.
3)设回归直线方程,
利用
,
计算a,b,得b≈1.215, a=≈0.974,
∴回归直线方程为:
4.独立性检验
①列联表:列出的两个分类变量和,它们的取值分别为和的样本频数表称为列联表1
分类 |
1 |
2 |
总计 |
1 |
|
|
|
2 |
|
|
|
总计 |
|
|
|
构造随机变量(其中)
得到的观察值常与以下几个临界值加以比较:
如果 ,就有的把握因为两分类变量和是有关系;
如果 就有的把握因为两分类变量和是有关系;
如果 就有的把握因为两分类变量和是有关系;
如果低于,就认为没有充分的证据说明变量和是有关系.
[教法指引]
统计案例
本部分内容主要包括回归分析的基本思想及其初步应用和独立性检验的基本思想和初步应用,是教材新增内容,估计高考中比重不会过大.
(1)知识点将会考察回归分析的基本思想方法,用独立性检验判断A与B间的关系,及2×2列联表;
(2)考查的形式主要以选择、填空题为主,但不会涉及很多;
随机变量的分布列
本部分内容主要包括随机变量的概念及其分布列,离散性随机变量的均值和方差,正态分布,从近几年的高考观察,这部分内容有加强命题的趋势。
(1)考查的重点将以随机变量及其分布列的概念和基本计算为主,题型以选择、填空为主,有时也以解答题形式出现;
(2)预计2010年高考还是实际情景为主,建立合适的分布列,通过均值和方差解释实际问题;
[典例精析]
3.两个变量之间的关系
求回归直线方程的步骤:
第一步:先把数据制成表,从表中计算出;
第二步:计算回归系数的a,b,公式为
第三步:写出回归直线方程.
2.用样本估计总体
样本分布反映了样本在各个范围内取值的概率,我们常常使用频率分布直方图来表示相应样本的频率分布,有时也利用茎叶图来描述其分布,然后用样本的频率分布去估计总体分布,总体一定时,样本容量越大,这种估计也就越精确.
①用样本频率分布估计总体频率分布时,通常要对给定一组数据进行列表、作图处理.作频率分布表与频率分布直方图时要注意方法步骤.画样本频率分布直方图的步骤:求全距→决定组距与组数→分组→列频率分布表→画频率分布直方图.
②茎叶图刻画数据有两个优点:一是所有的信息都可以从图中得到;二是茎叶图便于记录和表示,但数据位数较多时不够方便.
③平均数反映了样本数据的平均水平,而标准差反映了样本数据相对平均数的波动程度,其计算公式为.
1.抽样
(1)简单随机抽样
简单随机抽样是一种最简单、最基本的抽样方法.抽样中选取个体的方法有两种:放回和不放回.我们在抽样调查中用的是不放回抽取.
(2)系统抽样
系统抽样与简单随机抽样之间存在着密切联系,即在将总体中的个体均分后的每一段中进行抽样时,采用的是简单随机抽样.
系统抽样的分段间隔,当(N为总体中的个体数,n为样本容量)是整数时,;当不是整数时,从总体中剔除一些个体使剩下的个体个数能被n整除,这时.
(3)分层抽样
当总体由明显差别的几部分组成时,为了使抽样更好地反映总体情况,将总体中各个个体按某种特征分成若干个互不重叠的部分,每一部分叫层;在各层中按层在总体中所占比例进行简单随机抽样.
8. 理解独立性检验的基本思想和步骤。能够用的计算及临界值的比较判断事件的相关与无关
[考纲要求]
统计部分要求不太高,主要是考抽样方法与正态分布有关的问题,最多一个小题(选择或填空)属容易题,但应充分注意以统计为载体、问题实质涉及期望与方差计算的综合解答题.
[知识纵横]
7. 理解回归分析的基本思想,通过具体案例,理解进行残差分析的必要性,以及相关指数对回归模型的刻画。
6. 了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立象形回归方程。
5. 理解相关关系,能够区分两变量间是相关关系还是函数关系。
4. 理解数据标准差的意义和作用,学会计算平均数,标准差;会用样本的数字特征估计总体的数字特征。
湖北省互联网违法和不良信息举报平台 | 网上有害信息举报专区 | 电信诈骗举报专区 | 涉历史虚无主义有害信息举报专区 | 涉企侵权举报专区
违法和不良信息举报电话:027-86699610 举报邮箱:58377363@163.com