2024年3月8日发(作者:佳能ip1180)
第四章 x2检验
一. 本章教学简介
本章介绍第二个统计推断工具,非参数检验类的X2检验,内容包括X2检验的性质、原理、类型、方法和应用。
本章重点是X2检验两种类型的应用,难点是X2检验的原理。
本章要求学员学习后能了解X2检验的性质和原理,掌握X2检验的生物学应用,能熟练使用计算器解题,有条件的学员能用电脑SPSS操作,并将结果进行比较。
教材提示:教材77-85页详细阅读。
二.本章教学内容
一.适用特征和功效
1.适用特征:
(1) 样本资料为非连续性变量(离散量资料,或称计数性资料);
(2) 总体分布未知;
(3) 非参数性检验,而是分布性检验。
2.功效:
基于非连续性变量(即计数性资料)的非参数检验。
说明:对质量性状的资料研究常用方法,比数量性状资料研究难。
x2检验,平均数对它无意义,属于非参数性的属性检验,适合对质量性状的检验,对原始数据的要求比t检验低,原始数据即观察数往往只是归类计数的频次,都是整数,无分数小数。
二.类型
1.适合性(符合性,拟合优度)检验:判断Oi与Ei是否一致。
2.独立性检验:通过Oi与Ei是否一致来判断因素之间是否独立。
三.原理和方法
㈠适合性检验
Oi :观察数(实际数)
Ei :期望数(理论数)
适合性检验就是检验Oi与Ei是否一致(即是否有显著差异),解决Oi与Ei是否在统计学意义上相等的问题。
适合性检验的方法也是典型的统计检验“五步法”。
1.H0(无效假设): Oi=Ei (或Oi-Ei=0)
2.建立适当的分布(x2分布)并计算:
x2c =∑(Oi-Ei)2/Ei
df=n-1 适合性检验中df等于相加项数-1
3.查表: x20.05(df)= ? x20.01(df)= ?
4.比较:
(1)当 x2c〈 x20.05 ,接受H0, Oi与Ei无显著差异,P>0.05
(2)当 x20.05〈 x2c〈x20.01 ,拒绝H0 ,Oi与Ei有显著差异,P<0.05
1 / 12
(3)当 x2c〉x20.01 ,拒绝H0 ,Oi与Ei有极其显著差异,P<0.01
5.结论
例1.豌豆杂交试验得到80朵黄花,34朵白花,问此结果是否符合3∶1的分离规律?
解: 已知 O1=80 O2=34
根据3∶1规律求出:E1=(80+34)*3/4=85.500,
E2=(80+34)*1/4=28.500
(Ei可以而且应当有小数,保留位数一般应比后面比较的临界值多1位)
1.H0(无效假设): Oi=Ei (或Oi-Ei=0)
2.建立适当的分布(x2分布)并计算:
x2c=∑(Oi-Ei)2/Ei= (80-85.5)2/85.5+(34-28.5)2/28.5=1.43
22 (xc
即x实际结果数小数位数应与比较的临界值一致)
df=2-1=1
(自由度等于相加项数-1)
3.查表: x20.05(df)= ? x20.01(df)= ?
经查表知:x20.05(1)=3.84 , x20.01(1)=6.63
4.比较:
∵ x2c< x20.05(1) ,∴ 接受H0 , Oi与Ei无显著差异,P>0.05
(属于比较的第(1)种情况)
5.结论:试验结果符合3:1的分离规律。
当堂练习1:
教材79页例6.2,请学员参照上述“五部法”独立完成本题,并将结果与教材上的例题解答进行比较核对。
回家作业:教材85页第5题。
(二)独立性检验
独立性检验的功效就是通过Oi与Ei是否一致来判断因素之间是否独立。
例2.为试验某新药抗癌效果,进行动物荷瘤试验,结果如下:
康复 死亡
用药组 28 32
非用药组 16 40
问此药是否有效?
解:独立性检验的步骤也是“五部法”。
1.H0 : Oi=Ei
现已知 O11=28 O12=32
O21=16 O22=40
如何找到Ei?
一般的方法是用“混合比例法”,将已知Oij行列求和。
康复 死亡
用药组 O11=28 O12=32 t1= O11+ O12=60
非用药组 O21=16 O22=40 t2= O21+ O22=56
C1= O11+ O21=44 C2= O12+ O22=72 T= t1+ t2=116
用比例公式求得:E11=60*44/116=22.759, E12=60*72/116=37.241
2 / 12
E21=56*44/116=21.241, E22=56*72/116=34.759
2.建立适当的分布(x2分布)并计算:
计算x2
x2 =∑(Ei-Oi)2/Ei =(28-22.759)2 /22.759+(32-37.241)2
/37.241+(16-21.241)2 /21.241+(40-34.759)2 /34.759=4.0279≈4.03
计算自由度:
df=(m-1)(n-1)=(2-1)(2-1)=1
3.查表知:x20.05(1)=3.84 x20.01(1)=6.63
4.比较:
∵ x20.05(1)
< x2
< x20.01(1),∴拒绝H0
,Oi与Ei 有显著差异,P<0.05,
即用药与康复两因素不独立(有关联作用)。
5.结论:此药是有效的。
当堂练习2:
教材80页例6.3,请学员参照上述“五部法”独立完成本题,并将结果与教材上的例题解答进行比较核对。
回家作业:教材84页第1,2,3,4题。
四.修正公式和简捷公式
(一)df=1 的修正
x2检验中自由度=1时,若x2
的值与3.84很接近,特别有必要进行修正,以减少范错误的风险。
22
x修=∑(|Oi-Ei|-0.5)2/Ei
x修
所得的值比x2c
的值小。
(二)2*2
独立性检验简捷公式
x2简=(O11*O22-O12*O21)2T/t1t2C1C2
x2简修=( |O11*O22-O12*O21|-T/2)2T/ t1t2C1C2
参阅教材83页。
如再对例2进行简捷计算:
用x2简
公式计算x2c=4.03,与上面“五部法”的结果和结论相同。
22
用x简修公式计算xc=3.30,
此时∵x2c< x20.05
,∴接受H0,Oi与Ei 无显著差异,P>0.05,
即用药与康复两因素独立(无关联作用)。
结论:此药是无效的。
此结论与上面“五部法”的结论不同,应当说,经过修正的检验结论更可靠。
建议学员以后碰到df=1的x2检验尽量运用修正公式。
(三) m*n独立性检验的简捷运算
3 / 12
O11
O21
…
Om1
C1
O12
O22
…
Om2
C2
O13
O23
…
Om3
C3
…
…
…
…
…
O1n
O2n
…
Om4
Cn
t1
t2
…
tm
T
x2 =T(∑∑Oij2/tiCj -1)
说明:独立性检验随着行列数m、n的增大,计算Eij的工作量会随之增大,且易出错,此时可用上述简捷运算公式。
教学建议:建议在用“五部法”完成84页作业1、3、4题后,再用此简捷公式计算,比较两者的结果是否一样。(答案:应该一样)
四.计算机SPSS的X2检验
(一)计算机SPSS的x2适合性检验
1.设定数据库变量(原始数据不能有小数点)
变量Oi, 设为数字型。
2.输入数据
如上面例1: Oi
34
80
3.加权处理 Date---Weight Case By Oi
4.命令执行 Analyze----Nonparametric Tests---Chi-square
具体操作可参阅教材176-177页内容。
演示例1。
(二)计算机SPSS的X2独立性检验
1.设定数据库变量(原始数据不能有小数点)
VA : 行变量 ,数字型,宽度一位
VB : 列变量 ,数字型,宽度一位
VC
: 因变量(观察数),数字型,宽度由最大观察数位数决定。
2. 输入数据,建立数据库
如上面例2:
VA VB VC
1 1 28
1 2 32
2 1 16
2 2 40
3.加权处理 Date---Weight Case By Vc
4.统计命令执行
Analyze----Descriptive Statistics---Crosstabs
具体操作可参阅教材178-180页内容。
4 / 12
演示例2。
第五章 方差分析
一. 本章教学简介
本章介绍第三个重要统计推断工具,参数检验类的方差分析,内容包括方差分析的功效、性质、原理、类型、方法和应用。
本章重点是单因素方差分析的应用,难点是方差分析的计算,尤其是双因素方差分析。
本章要求学员学习后能了解方差分析的性质和原理,掌握方差分析的生物学应用,能熟练使用计算器解题,有条件的学员能用电脑SPSS操作,并将结果进行比较。
教材提示:教材86-105页详细阅读。
二.本章教学内容
一.意义义和功效
方差分析是参数检验,是对多个(三个和三个以上)平均数的比较检验。
1.意义:有了t检验,为何还要引入方差分析?
方差分析是解决多个平均数的比较。若10个平均数,用t检验两两检验,需次数C102=45次,若取α=0.05
则: 1次 准确率 0.95 错误率 1-0.95=0.05
2次 准确率 0.952
错误率 1-0.952
3次 准确率 0.953
错误率 1-0.953
… … …
45次 准确率 0.9545=0.09944 错误率 1-0.9545=0.90056
从以上可见,t检验随次数的增加,准确率下降,t检验达多次重复以后,可靠性无法保证,所以t检验只适合两个平均数的比较。因此,为了解决多个平均数的比较,引入方差分析。
2.功效:方差分析不仅能检验多个平均数是否存在差异,同时还能分析差异的来源和原因。
二.类型
⑴ 单因素方差分析 a:n相等 b:n不相等
⑵ 双因素方差分析 a:n=1 b:n>1 (n相等 和n不相等)
⑶ 多因素方差分析
三.原理和步骤
㈠ 单因素方差分析
⑴ 单因素方差分析(n相等)
5 / 12
例:某学校有四个平行班进行生物统测,结果如下:
甲班
乙班
丙班
丁班
学生成绩
80
66
70
80
TA1(表甲组成绩之和)
TA2(表乙组成绩之和)
TA3(表丙组成绩之和)
TA4(表丁组成绩之和)
68
55
80
70
72
70
82
72
72
62
75
68
66
63
72
69
问四个班平均成绩是否有显著差异?
解:① H0
x1= x2=…xk
② 平方和和自由度分析
总体平方和: SST
=∑∑(xij-x总)2=∑xi2-(∑xi)2/N =∑xi2-T2/N
T 为所有数之和 ,令 C= T2/N (C为校正系数)
SST
= ∑xi2-C dfT=N-1
组间平方和:SSA=∑TAi2/n-C dfA=k-1
组内平方和:SSe= SST-SSA dfe=dfT- dfA
③计算方差
SA2(组间方差)=SSA/dfA Se2(组内方差)=SSe/dfe
① F检验
Fc= SA2/ Se2
② 查 Fa
F0.05(dfA,dfe)= ?
F0.01(dfA,dfe)= ?
③ 比较:
a.当 Fc≤F0.05(dfA,dfe) , 接受H0 ,各组均值无显著差异(P>0.05)
b.当F0.05(dfA,dfe)< Fc< F0.01(dfA,dfe) ,拒绝H0,各组均值有显著差
异,(P<0.05)。
c.当 Fc> F0.01(dfA,dfe),
拒绝H0,各组均值有极其显著差异,(P<0.01)。
④ 多重比较
⑤ 结论
例子中:TA1=358
TA2=316
TA3=379
TA4=359
C=(358+316+379+359)2/20=99687.2
SST
= ∑xi2-C=100544-99687.2=856.8 dfT=19
SSA=∑TAi2/n-C=425.2 dfA=4-1=3
SSe=856.8-425.2=435.6 dfe=19-3=16
SA2=SSA/dfA=425.2/3=140.4
Se2=SSe/dfe=435.6/16=27.225
Fc= SA2/ Se2=140.4/27.225=5.16
查表知: F0.05(3,16)=3.24 F0.01(3,16)=5.29
所以 F0.05(3,16)< Fc< F0.01(3,16) 拒绝H0,各组均值有显著差异
3. 多重比较
6 / 12
⑴ 功效:通过各组的比较,进一步分析变异的来源和原因。
⑵ 表示方法类型: 三角形法,连线法,符号法等。
⑶ 检验方法类型:
1.LSD法(最小显著差数表)
例:书192页
A 74 82 70 76 A组Xi平均值 75.5
B 88 80 85 83 B组Xi平均值84
C 71 73 74 70 C组Xi平均值72
LSD法:
C A
Xi平均 Xi平均-72 Xi平均-75.5
XB平均=84 12 8.5
XA平均=75.5 3.5 0
XC平均=72 0 -3.5
LSD=ta(dfe)sqrt(2 Se2/n)
LSD0.05=t0.05(9)sqrt(2*13.222/4)=2.262*2.571=5.816
LSD0.01=t0.01(9)sqrt(2*13.222/4)=3.250*2.571=8.356
若:平方数差异〉LSD0.01 则打“**”表有极其显著差异
LSD0.05〈平方数差异〈LSD0.01 则打“*”表有显著差异
平方数差异〈LSD0.05,不做标记,表无显著差异
所以例题中:除A.C组外,其他各组均有极其显著差异
⑵ 单因素方差分析(n不相等)
① H0 x1= x2=…=xk
② C=T2/N N为总体个数
总体平方和: SST
= ∑xi2-C dfT=N-1
组间平方和:SSA=∑TAi2/ni-C dfA=k-1
组内平方和:SSe= SST-SSA dfe=dfT- dfA
③计算方差
SA2(组间方差)=SSA/dfA Se2(组内方差)=SSe/dfe
④检验
Fc= SA2/ Se2
⑤查 Fa
F0.05(dfA,dfe)= ?
F0.01(dfA,dfe)= ?
⑥ 比较:
a: Fc≤F0.05(dfA,dfe) , 接受H0 ,各组均值无显著差异(P>0.05)
b: F0.05(dfA,dfe)< Fc< F0.01(dfA,dfe) ,拒绝H0,各组均值有显著差异
7 / 12
(P<0.05)
c: Fc> F0.01(dfA,dfe), 拒绝H0,各组均值有极其显著差异(P<0.01)
⑦ 多重比较(若有显著差异)
LSD=ta(dfe)sqrt(2 Se2/n0)
n0=1/(k-1)(∑ni-∑ni2/∑ni)
⑶ SPSS中的单因素方差分析操作
① 数据库建立
a.变量设定:VA 行变量
VB 列变量
VC
因变量
b.输入
② 主命令 Analyze—Compare Means---One Way ANOVA (Analyze of variance)
若要进行多重比较,主命令为Analyze—Compare Means---One Way
ANOVA—POST---LSD Multiple Comparisions
㈡ 双因素方差分析
⑴ n=1
例:四种不同品系的小鼠注射三种不同计量性激素,两周各称重,结果如下:
(横向 :B因素)m 组
计量0.2 计量0.4 计量0.8
品系 1 106 116 145
品系 2 42 68 115
品系 3 70 111 133
品系 4 42 63 87
纵向:A因素 k组
做题思路:
① H0 : A向k组 B向m组
x1= x2=… xk
x1=x2=…xm
② SS与df分析:
C= T2/N (C为校正系数)
SST
= ∑xi2-C dfT=N-1
SSA=∑TAi2/mn-C dfA=k-1
SSB=∑TBi2/kn-C dfB=m-1
SSe= SST-SSA-SSB dfe=dfT- dfA-dfB
③ 计算方差
SA2(组间方差)=SSA/dfA SB2(组间方差)=SSB/dfB Se2(组内方差)=SSe/dfe
④ 检验:
FA= SA2/ Se2
FB= SB2/ Se2
⑤ 查表
A向: F0.05(dfA,dfe)= ? F0.01(dfA,dfe)= ?
B向: F0.05(dfB,dfe)= ?F0.01(dfB,dfe)= ?
⑥ 比较:
A向: a:当 Fc≤F0.05(dfA,dfe) , 接受H0 ,各组均值无显著差异(P>0.05)
8 / 12
b:当F0.05(dfA,dfe)< Fc< F0.01(dfA,dfe) ,拒绝H0,各组均值有显著差异
(P<0.05)
c:当 Fc> F0.01(dfA,dfe), 拒绝H0,各组均值有极其显著差异(P<0.01)
B向: a: 当Fc≤F0.05(dfB,dfe) , 接受H0 ,各组均值无显著差异(P>0.05)
b: 当F0.05(dfB,dfe)< Fc< F0.01(dfB,dfe) ,拒绝H0,各组均值有显著差异
(P<0.05)
c: 当Fc> F0.01(dfB,dfe), 拒绝H0,各组均值有极其显著差异(P<0.01)
⑦ 多重比较:
A向:LSDa=ta(dfe)sqrt(2 Se2/m)
B向:LSDa=ta(dfe)sqrt(2 Se2/k)
⑧ 结论:
第六章 相关与回归
一. 本章教学简介
本章是本学科第三部分教学内容,内容包括相关和回归的概念、原理、方法和应用。
本章重点是相关和回归的概念和应用,难点是相关和回归的检验原理。
本章要求学员学习后能理解相关和回归的性质和原理,掌握相关和回归的生物学应用,能熟练使用计算器解题,有条件的学员能用电脑SPSS操作,并将结果进行比较。
二.本章教学内容
一.相关
⑴ 概念:研究变量之间联系程度的一种数学指标。
⑵ 类型:
① 从性质分:正相关:变量随着另外变量增长而增长。如考试成绩与复习时间
负相关:变量随着另外变量增长而减小。如老人健康状况与年龄
零相关:两个变量独立变化,互不相关。
② 从变量数分:
单相关:两个相关数变量,为复相关基础。
复相关:超过两个变量数,有主次之分。
③ 从数学规律或数量变化趋势分为:
线性相关
非线性相关(包括曲线相关,超线性相关)
⑶ 数学描述
① 相关系数:r -1≤r≤+1
9 / 12
r=1,表示绝对正相关 r= -1,表示绝对负相关 r=0,表示绝对0相关
② 相关几何意义:
y随x 增大而增大
y随x增大而减小
x,y独立变化
③ 计算公式
r=(∑xy-∑x∑y/n)/(n-1)SxSy
④ 检验:a: H0 r=0
b: Fc=(n-2)r2/1-r2
c: 查表:Fa(1,n-2)
d: 比较:若 Fc 接受H0, r=0 若F0.05〈Fc 若Fc〉F0.01 拒绝H0, r≠0, r>0,强正相关,r<0,强负相关 ⑤ 结论 ⑷SPSS应用 ① 数据库 描述性统计的直接编码。 ② 主名令 Analyze---Correlate---Biovariate 二.回归 1、概念:变量之间关系利用最小误差理论,求得最佳关系式的过程。 2、类型: (1) 从变量数分: 单回归 10 / 12 复回归 (2) 从变化趋势分: 线性回归 非线性回归 3、数学方法: (1)直线回归方程 a.∑(y-b.∑(y-(2)建立=a+b x建立的必要条件 )=0 居中无偏性 )2min 平均数适合回归方程 =a+bx 最小二乘方原理, 条件极值法求系数a,b b=(∑xy-∑x∑y/n)/(∑x2-(∑x)2/n) =(∑y-b∑x)/n (3)作图(两端点法) ○1 xmin=? xmax=? 1=? 2=? ○2连线 ○3写出方程和r ○4两端不准延伸 注意事项: a.回归显著性检验包括回归关系、回归系数显著性检验,与r显著性检验完全等效。 B.先求r,并检验,如r达显著程度,再作相应回归,以避免无效回归。 C.回归直线两端不准延伸,因为回归只对这个区间内有效。 D.回归作图不要忘记标注原始点。 4、回归与相关的关系 ○1在相关系数达到显著程度时为有意义回归, 在相关系数达不到显著程度(即为零相关)时为无意义回归。 ○2r2=bx*by 5、回归的检验 与相关等效 6、回归的SPSS处理 ○1数据库与相关一样处理 ○2回归 Analyze---Regression----linear/curve 作图:Graph----Intergrative---Scaterplot fit中打开,选Regression 11 / 12 12 / 12
发布者:admin,转转请注明出处:http://www.yc00.com/num/1709905907a1670637.html
评论列表(0条)