3、“事件A的发生或事件B发生”称为“事件A与B的并事件(或和事件)”,记作:“”,
“事件A的发生且事件B发生”称为“事件A与B的交事件(或积事件)”,记作:“”。
若即为不可能事件,称事件A与B互斥,即事件A与B在任何一次试验中不可能同时发生。若为不可能事件且为必然事件,则称事件A与B互为对立事件。即事件A与B在任何一次试验中有且只有一次发生。
2、 从多个可选答案中挑选正确答案的决策问题,那么“使得样本出现的可能性最大”可以作为决策的准则。这方法叫极大自然法。
1、 事件分为确定事件(包括必然事件与不可能事件)与随机事件。随机事件发生的可能性的大小用概率来度量。在n次试验中,事件A发生的次数称为事件A发生的频数。称为事件A发生的频率。随着试验次数的增加,频率稳定在某个常数上,这个常数称为事件A发生的概率。频率是变化的与试验次数有关,概率是不变的,与试验次数无关。频率是概率的近似值。
8、 相关关系:与函数关系(确定关系)不同,相关关系是一种不确定性关系。从散点图上看,如果散点分布在从左下角到右上角的区域内,这两个变量的相关关系称为正相关,如果散点分布在从左上角到右下角的区域内,这两个变量的相关关系称为负相关。如果这些点从整体上看大致分布在一条直线的附近,则称这两个变量具有线性相关,这条直线叫回归直线。回归直线是:
线性相关系数:
第十三讲概率
7、 标准差、极差、方差都是描述数据的波动大小。前两者与数据的单位一致,方差与数据的单位不一致。
方差的计算公式是:
练习:
6、 中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或中间两个数据的平均数)叫做这组数据的中位数。中位数可能会不是数据中的数。众数是指在一组数据中出现次数最多的数据,可能不只一个。在频率分布直方图中,中位数左边和右边的直方图的面积应该相等。
5、 茎叶图不仅能保留原始数据而且方便对数据的记录和表示。但如果数据较多,茎叶图就显得不方便。
茎是指中间的一列数,叶是从茎的旁边生长出来的数。
4、 连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图,随着样本容量的增加,分组组距的不断缩小,相应的频率折线图会越来越接近于一条光滑曲线,统计学中称这条光滑曲线为总体密度曲线。总体密度曲线反映了总体在各个范围内取值的百分比。总体在某一区间内取值的百分比就是该区间与该曲线所夹的曲边梯形的面积。总体密度曲线通常是用样本的频率分布估计出来的。这是因为:(1)并非所有的总体都存在密度曲线,如一些离散型总体没有。(2)尽管有些总体密度曲线是客观存在的,但一般很难像函数图象那样被准确地画出来,只能用样本的频率分布来对它估计。样本容量越大,这种估计越精确。
3、 列频率分布表、画频率分布直方图的步骤:(1)求极差(最大值与最小值之差),(2)决定组距与组数,(3)将数据分组,(4)列频率分布表,(5)绘频率分布直方图。在频率分布直方图中,纵轴表示频率/组距,横轴表示样本数据,各小长方形的面积表示相应各组的频率,各小长方形的面积的总和为1。直率分布直方图的重心就是样本平均数。
2、 按某顺序以一定的间隔进行抽取得到的样本叫系统抽样。将总体分成互不交叉的层,然后按一定比例抽取一定数量的个体,将各层取出的个体放在一起作为样本,这种方法叫分层抽样。系统抽样的特点是:总体容量大且个体之间无差异。分层抽样的特点是:总体容量大且个体之间差异大。
湖北省互联网违法和不良信息举报平台 | 网上有害信息举报专区 | 电信诈骗举报专区 | 涉历史虚无主义有害信息举报专区 | 涉企侵权举报专区
违法和不良信息举报电话:027-86699610 举报邮箱:58377363@163.com