2020高中数学 第3章 统计案例 3.1 独立性检验教学案 苏教版选修2-3 下载本文

内容发布更新时间 : 2024/5/17 9:35:52星期一 下面是文章的全部内容请认真阅读。

精品

3.1 独立性检验

1.2×2列联表的定义

对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值,即类A和类B;Ⅱ也有两类取值,即类1和类2.这些取值可用下面的2×2列联表表示.

2

.χ统计量的求法

n(ad-bc)

公式χ=.

(a+c)(b+d)(a+b)(c+d)

2

2

2

3.独立性检验的概念

2

用统计量χ研究两变量是否有关的方法称为独立性检验. 4.独立性检验的步骤

要判断“Ⅰ与Ⅱ有关系”,可按下面的步骤进行: (1)提出假设H0:Ⅰ与Ⅱ没有关系;

22

(2)根据2×2列联表及χ公式,计算χ的值; (3)查对临界值,作出判断. 其中临界值如表所示:

P(χ≥x0) χ0 20.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 10.828 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 2 表示在H0成立的情况下,事件“χ≥x0”发生的概率. 5.变量独立性判断的依据

2

(1)如果χ>10.828时,那么有99.9%的把握认为“Ⅰ与Ⅱ有关系”;

2

(2)如果χ>6.635时,那么有99%的把握认为“Ⅰ与Ⅱ有关系”;

2

(3)如果χ>2.706时,那么有90%的把握认为“Ⅰ与Ⅱ有关系”;

2

(4)如果χ≤2.706时,那么就认为没有充分的证据显示“Ⅰ与Ⅱ有关系”,但也不能作出结论“H0成立”,即Ⅰ与Ⅱ没有关系.

精品

1.在2×2列联表中,通常要求a,b,c,d的值均不小于5.

2.表中|ad-bc|越小,Ⅰ与Ⅱ关系越弱;|ad-bc|越大,Ⅰ与Ⅱ关系越强.同时要记准表中a,b,c,d四个数据是交叉相乘然后再作差取绝对值,一定不要乘错.

3.表中类A与类B,以及类1与类2的关系:对于对象Ⅰ来说,类A与类B是对立的,也就是说类A发生,类B一定不发生,类A不发生,则类B一定发生;同样对于对象Ⅱ来说,类1与类2的关系也是如此.

[例1] 在一项

有关医疗保健的社会调查中,发现调查的男性为530人,女性为670人,其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为492人,请作出性别与喜欢吃甜食的列联表.

[思路点拨] 在2×2列联表中,共有两类变量,每一类变量都有两个不同的取值,然后找出相应的数据,列表即可.

[精解详析] 作列联表如下: 男 女 合计 喜欢甜食 117 492 609 不喜欢甜食 413 178 591 合计 530 670 1 200

[一点通] 分清类别是列联表的作表关键步骤.表中排成两行两列的数据是调查得来的结果.

1.下面是2×2列联表:

x1 x2 合计 y1 a 2 b y2 21 25 46 合计 73 27

则表中a,b的值分别为________,________.

解析:∵a+21=73,∴a=52.又∵a+2=b,∴b=54. 答案:52 54

2.某学校对高三学生作一项调查后发现:在平时的模拟考试中,性格内向的426名学生中有332名在考前心情紧张,性格外向的594名学生中在考前心情紧张的有213人 .作出2×2列联表.

解:作列联表如下:

考前心情紧张 考前心情不紧张 合计

性格内向 332 94 426 性格外向 213 381 594 合计 545 475 1 020 精品

[例2] 下表是

某地区的一种传染病与饮用水的调查表:

干净水 不干净水 合计 得病 52 94 146 不得病 466 218 684 合计 518 312 830

(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;

(2)若饮用干净水得病5人,不得病50人,饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异.

2

[思路点拨] (1)根据表中的信息计算χ的值,并根据临界值表来分析相关性的大小,对于(2)要列出2×2列联表,方法同(1).

[精解详析] (1)假设H0:传染病与饮用水无关.把表中数据代入公式,得

830×(52×218-466×94)χ=≈54.21,

146×684×518×312

2

2

因为当H0成立时,χ≥10.828的概率约为0.001,

所以我们有99.9%的把握认为该地区这种传染病与饮用不干净水有关. (2)依题意得2×2列联表:

2

干净水 不干净水 合计

得病 5 9 14 不得病 50 22 72 合计 55 31 86 86×(5×22-50×9)

此时,χ=≈5.785.

14×72×55×31

2

2

由于5.785>2.706,

所以我们有90%的把握认为该种疾病与饮用不干净水有关.

两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但(1)中我们有99.9%的把握肯定结论的正确性,(2)中我们只有90%的把握肯定.

2

[一点通] 解决独立性检验问题的基本步骤是:①指出相关数据,作列联表;②求χ的值;③判断可能性,注意与临界值作比较,得出事件有关的可能性大小.

3.某保健药品,在广告中宣传:“在服用该药品的105人中有100人未患A疾病”.经调查发现,在不使用该药品的418人中仅有18人患A疾病,请用所学知识分析该药品对患A疾病是否有效?

解:依题意得2×2的列联表: 使用 不使用 合计 患病 5 18 23 不患病 100 400 500 合计 105 418 523

要判断该药品对患A疾病是否有效,即进行独立性检验提出假设H0:该药品对患A疾病没有效. 根据列联表中的数据可以求得