(六)线性回归法 直觉拟合法最大的缺陷就是无法克服连线时的主观随意性.也就是说.直接拟合很难找到一条离各个数据点最近的图线.那么是否可以通过严格的数学方法找到这条最佳的图线呢?这就是下面要讨论的问题. 1.线性回归法 假定变量x和y的关系是线性的 y=kx+b 其图线是一条直线. 在实验中测得n组数据现在的问题是怎样根据这些数据确定上面线性方程中的k和b.为了理论上计算的需要.假定中只有是有误差的.在实际处理实验数据据时.可以把两个变量中相对业说误差较小的变量作为x. 我们对回归直线提了的标准是:要求从各数据点到回归直线的竖直距离平方之和为最小.也就是说.要求出k和b等于什么值时.各数据点到回归直线的竖直距离平方之和取得极小值.由于数学知识的限制.这里不介绍具体推导.只给出结论供使用: 令 那么斜率 截距 式中符号表示求和.如果共有n个数据点.那么 这个计算过程看起来比较复杂.但在职电脑使用日益普及的今天.用电脑来完成这样的工作很方便.一些功能比较齐全的计算器具有二维统计功能.也能自动完成这些计算. 在统计理论中还给出一个叫做相关系数的量.它主要表征x.y两个变量相关的程度.从图线上看.如果x.y的相关程度高.那么数据点都比较靠近拟合出来的图线,如果相关程度低.那么数据点就比较分散.相关系数 当x与y完全不相关时.r=0,当x与y正相关.即回归直线的斜率为正时.r>0;当x与y负相关.即回归直线的斜率为负时.r<0,当所有数据点都在回归直线上时..所以.r的数值只能在之间.图11-10说明了数据点分布情况不同时的相关系数. (2)线性回归法的误差 由于线性回归法是建立在严格的统计理论基础上的.因此可以计算回归直线方程的系数k和b的误差.同样由于数学方面的原因.这里只给出计算结果: k的相对误差: k的绝对误差: b的绝对误差: b的相对误差: 有了k和b的误差.便可以确定k和b的有效位数了:使k和b只保留一位存疑数.即让误差的位数和k.b的最末一位数相同. 3.线性关系显著的标准 由对相关系数r的讨论可知.对一个实际问题.只有当相关系数r的绝对值大到一定程度时.才可以用回归直线来近似地表示变量x和y之间的关系.即可以认为x与y成线性关系.因此.要有一个标准.在这个标准之上.就可以认为x与y线性关系显著. 线性关系显著的标准与数据点的个数有关.下面我们给出两个变量达到线性关系显著标准的相关系数的最小值(此值还与显著性水平有关.这里列出的是显著性水平a=0.01时的相关系数的最小值).下表中n为数据点个数.r为相关系数的最小值. n 3 4 5 6 7 8 9 10 11 r 1.000 0.990 0.959 0.917 0.874 0.834 0.798 0.765 0.735 n 12 13 14 15 16 17 18 19 20 r 0.708 0.684 0.661 0.641 0.623 0.606 0.590 0.575 0.561 下面用一个很简单的例子来说明线性回归法处理实验数据的具体做法. 在研究导体上的电流I和导体两端的电压U的关系时.得到如下数据: U(伏) 0.40 0.60 0.80 0.95 1.10 1.30 1.60 2.00 I 2.78 4.10 5.14 6.10 7.45 8.86 10.82 13.10 (1)对以上数据进行线性回归处理 (2)计算相关系数及误差 (3)根据以上计算.可以得到下列结论 ①电流I和电压U的相关系数为0.9988,因为0.9988>0.834,因此是显著相关.说明I和U成线性关系. ②回归直线的截距b=0.06953,而.因此可以认为回归直线过原点.说明I和U成正比. ③导体的电阻 因此 查看更多

 

题目列表(包括答案和解析)


同步练习册答案