x2检验

x2检验


2024年3月8日发(作者:佳能ip1180)

第四章 x2检验

一. 本章教学简介

本章介绍第二个统计推断工具,非参数检验类的X2检验,内容包括X2检验的性质、原理、类型、方法和应用。

本章重点是X2检验两种类型的应用,难点是X2检验的原理。

本章要求学员学习后能了解X2检验的性质和原理,掌握X2检验的生物学应用,能熟练使用计算器解题,有条件的学员能用电脑SPSS操作,并将结果进行比较。

教材提示:教材77-85页详细阅读。

二.本章教学内容

一.适用特征和功效

1.适用特征:

(1) 样本资料为非连续性变量(离散量资料,或称计数性资料);

(2) 总体分布未知;

(3) 非参数性检验,而是分布性检验。

2.功效:

基于非连续性变量(即计数性资料)的非参数检验。

说明:对质量性状的资料研究常用方法,比数量性状资料研究难。

x2检验,平均数对它无意义,属于非参数性的属性检验,适合对质量性状的检验,对原始数据的要求比t检验低,原始数据即观察数往往只是归类计数的频次,都是整数,无分数小数。

二.类型

1.适合性(符合性,拟合优度)检验:判断Oi与Ei是否一致。

2.独立性检验:通过Oi与Ei是否一致来判断因素之间是否独立。

三.原理和方法

㈠适合性检验

Oi :观察数(实际数)

Ei :期望数(理论数)

适合性检验就是检验Oi与Ei是否一致(即是否有显著差异),解决Oi与Ei是否在统计学意义上相等的问题。

适合性检验的方法也是典型的统计检验“五步法”。

1.H0(无效假设): Oi=Ei (或Oi-Ei=0)

2.建立适当的分布(x2分布)并计算:

x2c =∑(Oi-Ei)2/Ei

df=n-1 适合性检验中df等于相加项数-1

3.查表: x20.05(df)= ? x20.01(df)= ?

4.比较:

(1)当 x2c〈 x20.05 ,接受H0, Oi与Ei无显著差异,P>0.05

(2)当 x20.05〈 x2c〈x20.01 ,拒绝H0 ,Oi与Ei有显著差异,P<0.05

1 / 12

(3)当 x2c〉x20.01 ,拒绝H0 ,Oi与Ei有极其显著差异,P<0.01

5.结论

例1.豌豆杂交试验得到80朵黄花,34朵白花,问此结果是否符合3∶1的分离规律?

解: 已知 O1=80 O2=34

根据3∶1规律求出:E1=(80+34)*3/4=85.500,

E2=(80+34)*1/4=28.500

(Ei可以而且应当有小数,保留位数一般应比后面比较的临界值多1位)

1.H0(无效假设): Oi=Ei (或Oi-Ei=0)

2.建立适当的分布(x2分布)并计算:

x2c=∑(Oi-Ei)2/Ei= (80-85.5)2/85.5+(34-28.5)2/28.5=1.43

22 (xc

即x实际结果数小数位数应与比较的临界值一致)

df=2-1=1

(自由度等于相加项数-1)

3.查表: x20.05(df)= ? x20.01(df)= ?

经查表知:x20.05(1)=3.84 , x20.01(1)=6.63

4.比较:

∵ x2c< x20.05(1) ,∴ 接受H0 , Oi与Ei无显著差异,P>0.05

(属于比较的第(1)种情况)

5.结论:试验结果符合3:1的分离规律。

当堂练习1:

教材79页例6.2,请学员参照上述“五部法”独立完成本题,并将结果与教材上的例题解答进行比较核对。

回家作业:教材85页第5题。

(二)独立性检验

独立性检验的功效就是通过Oi与Ei是否一致来判断因素之间是否独立。

例2.为试验某新药抗癌效果,进行动物荷瘤试验,结果如下:

康复 死亡

用药组 28 32

非用药组 16 40

问此药是否有效?

解:独立性检验的步骤也是“五部法”。

1.H0 : Oi=Ei

现已知 O11=28 O12=32

O21=16 O22=40

如何找到Ei?

一般的方法是用“混合比例法”,将已知Oij行列求和。

康复 死亡

用药组 O11=28 O12=32 t1= O11+ O12=60

非用药组 O21=16 O22=40 t2= O21+ O22=56

C1= O11+ O21=44 C2= O12+ O22=72 T= t1+ t2=116

用比例公式求得:E11=60*44/116=22.759, E12=60*72/116=37.241

2 / 12

E21=56*44/116=21.241, E22=56*72/116=34.759

2.建立适当的分布(x2分布)并计算:

计算x2

x2 =∑(Ei-Oi)2/Ei =(28-22.759)2 /22.759+(32-37.241)2

/37.241+(16-21.241)2 /21.241+(40-34.759)2 /34.759=4.0279≈4.03

计算自由度:

df=(m-1)(n-1)=(2-1)(2-1)=1

3.查表知:x20.05(1)=3.84 x20.01(1)=6.63

4.比较:

∵ x20.05(1)

< x2

< x20.01(1),∴拒绝H0

,Oi与Ei 有显著差异,P<0.05,

即用药与康复两因素不独立(有关联作用)。

5.结论:此药是有效的。

当堂练习2:

教材80页例6.3,请学员参照上述“五部法”独立完成本题,并将结果与教材上的例题解答进行比较核对。

回家作业:教材84页第1,2,3,4题。

四.修正公式和简捷公式

(一)df=1 的修正

x2检验中自由度=1时,若x2

的值与3.84很接近,特别有必要进行修正,以减少范错误的风险。

22

x修=∑(|Oi-Ei|-0.5)2/Ei

x修

所得的值比x2c

的值小。

(二)2*2

独立性检验简捷公式

x2简=(O11*O22-O12*O21)2T/t1t2C1C2

x2简修=( |O11*O22-O12*O21|-T/2)2T/ t1t2C1C2

参阅教材83页。

如再对例2进行简捷计算:

用x2简

公式计算x2c=4.03,与上面“五部法”的结果和结论相同。

22

用x简修公式计算xc=3.30,

此时∵x2c< x20.05

,∴接受H0,Oi与Ei 无显著差异,P>0.05,

即用药与康复两因素独立(无关联作用)。

结论:此药是无效的。

此结论与上面“五部法”的结论不同,应当说,经过修正的检验结论更可靠。

建议学员以后碰到df=1的x2检验尽量运用修正公式。

(三) m*n独立性检验的简捷运算

3 / 12

O11

O21

Om1

C1

O12

O22

Om2

C2

O13

O23

Om3

C3

O1n

O2n

Om4

Cn

t1

t2

tm

T

x2 =T(∑∑Oij2/tiCj -1)

说明:独立性检验随着行列数m、n的增大,计算Eij的工作量会随之增大,且易出错,此时可用上述简捷运算公式。

教学建议:建议在用“五部法”完成84页作业1、3、4题后,再用此简捷公式计算,比较两者的结果是否一样。(答案:应该一样)

四.计算机SPSS的X2检验

(一)计算机SPSS的x2适合性检验

1.设定数据库变量(原始数据不能有小数点)

变量Oi, 设为数字型。

2.输入数据

如上面例1: Oi

34

80

3.加权处理 Date---Weight Case By Oi

4.命令执行 Analyze----Nonparametric Tests---Chi-square

具体操作可参阅教材176-177页内容。

演示例1。

(二)计算机SPSS的X2独立性检验

1.设定数据库变量(原始数据不能有小数点)

VA : 行变量 ,数字型,宽度一位

VB : 列变量 ,数字型,宽度一位

VC

: 因变量(观察数),数字型,宽度由最大观察数位数决定。

2. 输入数据,建立数据库

如上面例2:

VA VB VC

1 1 28

1 2 32

2 1 16

2 2 40

3.加权处理 Date---Weight Case By Vc

4.统计命令执行

Analyze----Descriptive Statistics---Crosstabs

具体操作可参阅教材178-180页内容。

4 / 12

演示例2。

第五章 方差分析

一. 本章教学简介

本章介绍第三个重要统计推断工具,参数检验类的方差分析,内容包括方差分析的功效、性质、原理、类型、方法和应用。

本章重点是单因素方差分析的应用,难点是方差分析的计算,尤其是双因素方差分析。

本章要求学员学习后能了解方差分析的性质和原理,掌握方差分析的生物学应用,能熟练使用计算器解题,有条件的学员能用电脑SPSS操作,并将结果进行比较。

教材提示:教材86-105页详细阅读。

二.本章教学内容

一.意义义和功效

方差分析是参数检验,是对多个(三个和三个以上)平均数的比较检验。

1.意义:有了t检验,为何还要引入方差分析?

方差分析是解决多个平均数的比较。若10个平均数,用t检验两两检验,需次数C102=45次,若取α=0.05

则: 1次 准确率 0.95 错误率 1-0.95=0.05

2次 准确率 0.952

错误率 1-0.952

3次 准确率 0.953

错误率 1-0.953

… … …

45次 准确率 0.9545=0.09944 错误率 1-0.9545=0.90056

从以上可见,t检验随次数的增加,准确率下降,t检验达多次重复以后,可靠性无法保证,所以t检验只适合两个平均数的比较。因此,为了解决多个平均数的比较,引入方差分析。

2.功效:方差分析不仅能检验多个平均数是否存在差异,同时还能分析差异的来源和原因。

二.类型

⑴ 单因素方差分析 a:n相等 b:n不相等

⑵ 双因素方差分析 a:n=1 b:n>1 (n相等 和n不相等)

⑶ 多因素方差分析

三.原理和步骤

㈠ 单因素方差分析

⑴ 单因素方差分析(n相等)

5 / 12

例:某学校有四个平行班进行生物统测,结果如下:

甲班

乙班

丙班

丁班

学生成绩

80

66

70

80

TA1(表甲组成绩之和)

TA2(表乙组成绩之和)

TA3(表丙组成绩之和)

TA4(表丁组成绩之和)

68

55

80

70

72

70

82

72

72

62

75

68

66

63

72

69

问四个班平均成绩是否有显著差异?

解:① H0

x1= x2=…xk

② 平方和和自由度分析

总体平方和: SST

=∑∑(xij-x总)2=∑xi2-(∑xi)2/N =∑xi2-T2/N

T 为所有数之和 ,令 C= T2/N (C为校正系数)

SST

= ∑xi2-C dfT=N-1

组间平方和:SSA=∑TAi2/n-C dfA=k-1

组内平方和:SSe= SST-SSA dfe=dfT- dfA

③计算方差

SA2(组间方差)=SSA/dfA Se2(组内方差)=SSe/dfe

① F检验

Fc= SA2/ Se2

② 查 Fa

F0.05(dfA,dfe)= ?

F0.01(dfA,dfe)= ?

③ 比较:

a.当 Fc≤F0.05(dfA,dfe) , 接受H0 ,各组均值无显著差异(P>0.05)

b.当F0.05(dfA,dfe)< Fc< F0.01(dfA,dfe) ,拒绝H0,各组均值有显著差

异,(P<0.05)。

c.当 Fc> F0.01(dfA,dfe),

拒绝H0,各组均值有极其显著差异,(P<0.01)。

④ 多重比较

⑤ 结论

例子中:TA1=358

TA2=316

TA3=379

TA4=359

C=(358+316+379+359)2/20=99687.2

SST

= ∑xi2-C=100544-99687.2=856.8 dfT=19

SSA=∑TAi2/n-C=425.2 dfA=4-1=3

SSe=856.8-425.2=435.6 dfe=19-3=16

SA2=SSA/dfA=425.2/3=140.4

Se2=SSe/dfe=435.6/16=27.225

Fc= SA2/ Se2=140.4/27.225=5.16

查表知: F0.05(3,16)=3.24 F0.01(3,16)=5.29

所以 F0.05(3,16)< Fc< F0.01(3,16) 拒绝H0,各组均值有显著差异

3. 多重比较

6 / 12

⑴ 功效:通过各组的比较,进一步分析变异的来源和原因。

⑵ 表示方法类型: 三角形法,连线法,符号法等。

⑶ 检验方法类型:

1.LSD法(最小显著差数表)

例:书192页

A 74 82 70 76 A组Xi平均值 75.5

B 88 80 85 83 B组Xi平均值84

C 71 73 74 70 C组Xi平均值72

LSD法:

C A

Xi平均 Xi平均-72 Xi平均-75.5

XB平均=84 12 8.5

XA平均=75.5 3.5 0

XC平均=72 0 -3.5

LSD=ta(dfe)sqrt(2 Se2/n)

LSD0.05=t0.05(9)sqrt(2*13.222/4)=2.262*2.571=5.816

LSD0.01=t0.01(9)sqrt(2*13.222/4)=3.250*2.571=8.356

若:平方数差异〉LSD0.01 则打“**”表有极其显著差异

LSD0.05〈平方数差异〈LSD0.01 则打“*”表有显著差异

平方数差异〈LSD0.05,不做标记,表无显著差异

所以例题中:除A.C组外,其他各组均有极其显著差异

⑵ 单因素方差分析(n不相等)

① H0 x1= x2=…=xk

② C=T2/N N为总体个数

总体平方和: SST

= ∑xi2-C dfT=N-1

组间平方和:SSA=∑TAi2/ni-C dfA=k-1

组内平方和:SSe= SST-SSA dfe=dfT- dfA

③计算方差

SA2(组间方差)=SSA/dfA Se2(组内方差)=SSe/dfe

④检验

Fc= SA2/ Se2

⑤查 Fa

F0.05(dfA,dfe)= ?

F0.01(dfA,dfe)= ?

⑥ 比较:

a: Fc≤F0.05(dfA,dfe) , 接受H0 ,各组均值无显著差异(P>0.05)

b: F0.05(dfA,dfe)< Fc< F0.01(dfA,dfe) ,拒绝H0,各组均值有显著差异

7 / 12

(P<0.05)

c: Fc> F0.01(dfA,dfe), 拒绝H0,各组均值有极其显著差异(P<0.01)

⑦ 多重比较(若有显著差异)

LSD=ta(dfe)sqrt(2 Se2/n0)

n0=1/(k-1)(∑ni-∑ni2/∑ni)

⑶ SPSS中的单因素方差分析操作

① 数据库建立

a.变量设定:VA 行变量

VB 列变量

VC

因变量

b.输入

② 主命令 Analyze—Compare Means---One Way ANOVA (Analyze of variance)

若要进行多重比较,主命令为Analyze—Compare Means---One Way

ANOVA—POST---LSD Multiple Comparisions

㈡ 双因素方差分析

⑴ n=1

例:四种不同品系的小鼠注射三种不同计量性激素,两周各称重,结果如下:

(横向 :B因素)m 组

计量0.2 计量0.4 计量0.8

品系 1 106 116 145

品系 2 42 68 115

品系 3 70 111 133

品系 4 42 63 87

纵向:A因素 k组

做题思路:

① H0 : A向k组 B向m组

x1= x2=… xk

x1=x2=…xm

② SS与df分析:

C= T2/N (C为校正系数)

SST

= ∑xi2-C dfT=N-1

SSA=∑TAi2/mn-C dfA=k-1

SSB=∑TBi2/kn-C dfB=m-1

SSe= SST-SSA-SSB dfe=dfT- dfA-dfB

③ 计算方差

SA2(组间方差)=SSA/dfA SB2(组间方差)=SSB/dfB Se2(组内方差)=SSe/dfe

④ 检验:

FA= SA2/ Se2

FB= SB2/ Se2

⑤ 查表

A向: F0.05(dfA,dfe)= ? F0.01(dfA,dfe)= ?

B向: F0.05(dfB,dfe)= ?F0.01(dfB,dfe)= ?

⑥ 比较:

A向: a:当 Fc≤F0.05(dfA,dfe) , 接受H0 ,各组均值无显著差异(P>0.05)

8 / 12

b:当F0.05(dfA,dfe)< Fc< F0.01(dfA,dfe) ,拒绝H0,各组均值有显著差异

(P<0.05)

c:当 Fc> F0.01(dfA,dfe), 拒绝H0,各组均值有极其显著差异(P<0.01)

B向: a: 当Fc≤F0.05(dfB,dfe) , 接受H0 ,各组均值无显著差异(P>0.05)

b: 当F0.05(dfB,dfe)< Fc< F0.01(dfB,dfe) ,拒绝H0,各组均值有显著差异

(P<0.05)

c: 当Fc> F0.01(dfB,dfe), 拒绝H0,各组均值有极其显著差异(P<0.01)

⑦ 多重比较:

A向:LSDa=ta(dfe)sqrt(2 Se2/m)

B向:LSDa=ta(dfe)sqrt(2 Se2/k)

⑧ 结论:

第六章 相关与回归

一. 本章教学简介

本章是本学科第三部分教学内容,内容包括相关和回归的概念、原理、方法和应用。

本章重点是相关和回归的概念和应用,难点是相关和回归的检验原理。

本章要求学员学习后能理解相关和回归的性质和原理,掌握相关和回归的生物学应用,能熟练使用计算器解题,有条件的学员能用电脑SPSS操作,并将结果进行比较。

二.本章教学内容

一.相关

⑴ 概念:研究变量之间联系程度的一种数学指标。

⑵ 类型:

① 从性质分:正相关:变量随着另外变量增长而增长。如考试成绩与复习时间

负相关:变量随着另外变量增长而减小。如老人健康状况与年龄

零相关:两个变量独立变化,互不相关。

② 从变量数分:

单相关:两个相关数变量,为复相关基础。

复相关:超过两个变量数,有主次之分。

③ 从数学规律或数量变化趋势分为:

线性相关

非线性相关(包括曲线相关,超线性相关)

⑶ 数学描述

① 相关系数:r -1≤r≤+1

9 / 12

r=1,表示绝对正相关 r= -1,表示绝对负相关 r=0,表示绝对0相关

② 相关几何意义:

y随x 增大而增大

y随x增大而减小

x,y独立变化

③ 计算公式

r=(∑xy-∑x∑y/n)/(n-1)SxSy

④ 检验:a: H0 r=0

b: Fc=(n-2)r2/1-r2

c: 查表:Fa(1,n-2)

d: 比较:若 Fc

接受H0, r=0

若F0.05〈Fc0,正相关,r<0,负相关

若Fc〉F0.01 拒绝H0, r≠0, r>0,强正相关,r<0,强负相关

⑤ 结论

⑷SPSS应用

① 数据库

描述性统计的直接编码。

② 主名令

Analyze---Correlate---Biovariate

二.回归

1、概念:变量之间关系利用最小误差理论,求得最佳关系式的过程。

2、类型:

(1) 从变量数分:

 单回归

10 / 12

 复回归

(2) 从变化趋势分:

 线性回归

 非线性回归

3、数学方法:

(1)直线回归方程

a.∑(y-b.∑(y-(2)建立=a+b x建立的必要条件

)=0 居中无偏性

)2min 平均数适合回归方程

=a+bx 最小二乘方原理, 条件极值法求系数a,b

b=(∑xy-∑x∑y/n)/(∑x2-(∑x)2/n)

=(∑y-b∑x)/n

(3)作图(两端点法)

○1 xmin=? xmax=?

1=? 2=?

○2连线

○3写出方程和r

○4两端不准延伸

注意事项:

a.回归显著性检验包括回归关系、回归系数显著性检验,与r显著性检验完全等效。

B.先求r,并检验,如r达显著程度,再作相应回归,以避免无效回归。

C.回归直线两端不准延伸,因为回归只对这个区间内有效。

D.回归作图不要忘记标注原始点。

4、回归与相关的关系

○1在相关系数达到显著程度时为有意义回归,

在相关系数达不到显著程度(即为零相关)时为无意义回归。

○2r2=bx*by

5、回归的检验

与相关等效

6、回归的SPSS处理

○1数据库与相关一样处理

○2回归 Analyze---Regression----linear/curve

作图:Graph----Intergrative---Scaterplot fit中打开,选Regression

11 / 12

12 / 12


发布者:admin,转转请注明出处:http://www.yc00.com/num/1709905907a1670637.html

相关推荐

发表回复

评论列表(0条)

  • 暂无评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信