0  423977  423985  423991  423995  424001  424003  424007  424013  424015  424021  424027  424031  424033  424037  424043  424045  424051  424055  424057  424061  424063  424067  424069  424071  424072  424073  424075  424076  424077  424079  424081  424085  424087  424091  424093  424097  424103  424105  424111  424115  424117  424121  424127  424133  424135  424141  424145  424147  424153  424157  424163  424171  447090 

2. 线性回归方程的意义是:以为基数,每增加1个单位,相应地平均增加个单位;

试题详情

1. 线性回归模型与确定性函数相比,它表示之间是统计相关关系(非确定性关系)其中的随机误差提供了选择模型的准则以及在模型合理的情况下探求最佳估计值的工具;

试题详情

2.练习:练习第题.

试题详情

1.例题:

例1.下表给出了我国从年至年人口数据资料,试根据表中数据估计我国年的人口数.

年份











人口数/百万











解:为了简化数据,先将年份减去,并将所得值用表示,对应人口数用表示,得到下面的数据表:
























[来源:]

作出个点构成的散点图,

由图可知,这些点在一条直线附近,可以用线性回归模型来表示它们之间的关系.

根据公式(1)可得

这里的分别为的估

计值,因此线性回归方程

由于年对应的,代入线性回归方程可得(百万),即年的人口总数估计为13.23亿.

例2. 某地区对本地的企业进行了一次抽样调查,下表是这次抽查中所得到的各企业的人均资本(万元)与人均产出(万元)的数据:

人均
资本
/万元










人均
产出
/万元










  (1)设之间具有近似关系(为常数),试根据表中数据估计的值;

  (2)估计企业人均资本为万元时的人均产出(精确到).

分析:根据所具有的关系可知,此问题不是线性回归问题,不能直接用线性回归方程处理.但由对数运算的性质可知,只要对的两边取对数,就能将其转化为线性关系.

解(1)在的两边取常用对数,可得,设,则.相关数据计算如图所示.

 











1
人均资本/万元
3
4
5.5
6.5
7
8
9
10.5
11.5
14
2
人均产出/万元
4.12
4.67
8.68
11.01
13.04
14.43
17.5
25.46
26.66
45.2
3

0.47712
0.60206
0.74036
0.81291
0.8451
0.90309
0.95424
1.02119
1.0607
1.14613
4

0.6149
0.66932
0.93852
1.04179
1.11528
1.15927
1.24304
1.40586
1.42586
1.65514

仿照问题情境可得的估计值别为可得,即的估计值分别为

  (2)由(1)知.样本数据及回归曲线的图形如图(见书本 页)

时,(万元),故当企业人均资本为万元时,人均产值约为万元.

试题详情

4. 化归思想(转化思想)

在实际问题中,有时两个变量之间的关系并不是线性关系,这就需要我们根据专业知识或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为线性回归方程,从而确定未知参数.下面列举出一些常见的曲线方程,并给出相应的化为线性回归方程的换元公式.

  (1),令,则有

  (2),令,则有

  (3),令,则有

  (4),令,则有

  (5),令,则有

试题详情

3. 线性回归方程的意义是:以为基数,每增加1个单位,相应地平均增加个单位;

试题详情

2.探求线性回归系数的最佳估计值:

对于问题②,设有对观测数据,根据线性回归模型,对于每一个,对应的随机误差项,我们希望总误差越小越好,即要使越小越好.所以,只要求出使取得最小值时的值作为的估计值,记为

注:这里的就是拟合直线上的点到点的距离.

用什么方法求

回忆《数学3(必修)》“2.4线性回归方程”P71“热茶问题”中求的方法:最小二乘法.

利用最小二乘法可以得到的计算公式为

其中

由此得到的直线就称为这对数据的回归直线,此直线方程即为线性回归方程.其中分别为的估计值,称为回归截距,称为回归系数,称为回归值.

在前面质点运动的线性回归方程中,

试题详情

1.线性回归模型的定义:

我们将用于估计值的线性函数作为确定性函数;

的实际值与估计值之间的误差记为,称之为随机误差;

称为线性回归模型.

说明:(1)产生随机误差的主要原因有:

①所用的确定性函数不恰当引起的误差;

②忽略了某些因素的影响;

③存在观测误差.

  (2)对于线性回归模型,我们应该考虑下面两个问题:

     ①模型是否合理(这个问题在下一节课解决);

     ②在模型合理的情况下,如何估计

试题详情

思考,讨论:这些点并不都在同一条直线上,上述直线并不能精确地反映之间的关系,的值不能由完全确定,它们之间是统计相关关系,的实际值与估计值之间存在着误差.

试题详情

2.问题:在时刻时,质点的运动位置一定是吗?

试题详情


同步练习册答案