独立性检验的思想 把表1中的数字用字母代替.得到如下用字母表示的列联表: 表2 吸烟与肺癌列联表 不患肺癌 患肺癌 总计 不吸烟 吸烟 总计 为了回答上述问题.我们先假设:吸烟与患肺癌没有关系. 则有:.即. 因此.越小.说明吸烟与患肺癌之间关系越弱,越大.说明吸烟与患肺癌之间关系越强. 构造一个随机变量 (1) 若成立.即“吸烟与患肺癌没有关系 .则应该很小. 根据表1中的数据.利用公式(1)计算得到的观测值为 这个值到底能告诉我们什么呢? 统计学家经过研究后发现.在成立的情况下. (2) 问题2:如何理解在成立的情况下.(2)式的含义呢? 问题3:结合(2)式.以及的观测值.由这两个式子你能得到什么样的结论呢? 师:这种判断会犯错误.但犯错误的概率不会超过.即我们有的把握认为“吸烟与患肺癌有关系 . 上面这种利用随机变量来确定是否能以一定把握认为“两个分类变量有关系 的方法.称为两个分类变量的独立性检验. 类比:上面解决问题的想法类似于反证法.可以从与反证法思想比较的角度帮助学生理解上面介绍的独立性检验的思想. 下表列出了二者的对应关系: 反证法 独立性检验 要证明的结论 要检验的是 在A不成立的前提下进行推理 在不成立的条件下.即成立的条件下进行推理 推出矛盾.意味着结论成立 推出有利于成立的小概率事件发生.意味着成立的可能性很大 没有找到矛盾.不能对下任何结论.即反证法不成功 推出有利于成立的小概率事件不发生.接受原假设 从上面的对比中.可以看出独立性检验的思想方法和反证法类似.不同之处有两个:其一是在独立性检验中用有利于的小概率事件的发生代替了反证法中的矛盾,其二是独立性检验中的接受原假设的结论相当于反证法中没有找到矛盾. 师:要确认是否能以给定的可信程度认为“两个分类变量有关系 ?(师生共同回忆上述问题的独立性检验的过程.) 怎样判断的观测值是大还是小呢?这仅需确定一个正数.如果时.就认为“两个分类变量之间有关系 ,否则就认为“两个分类变量之间没有关系 . 我们称这样的为一个判断规则的临界值. 在实际应用中.要在获取样本数据之前通过下表确定临界值: 2.独立性检验的基本步骤: ① 根据实际问题需要的可信程度确定临界值, ② 利用公式(1).由观测数据计算得到随机变量的观测值; ③ 如果.就以的把握认为“与有关系 ,否则就说没有的把握认为 “与有关系 . 查看更多

 

题目列表(包括答案和解析)


同步练习册答案