2024年3月31日发(作者:)
用户快速指导
POPGENE
版本 1.32
1
一、POPGENE窗口概览
该软件由 C++语言书写。
POPGENE 窗口计算环境有两种类型:Data display windows(数据显示窗
口)和 Dialog boxes(对话框).
其窗口菜单包含八部分:
File:用于建立新的数据文件或打开存在的文件
Edit:用于从其他窗口修改和复制文本
Search:寻找或取代选择的文本
Co-Dominant:用于通过用 co-dominant 标志去调用物种遗传分析
Dominant:用于通过用 dominant 标志去调用物种遗传分析
Quantitative:用于通过用量化特征去调用物种遗传分析
Window:用于布置、选择和控制窗口分布
Help:帮助,告诉你如何使用该软件
在菜单栏下面有工具栏,可以快速容易的使用窗口的特色部分。
底部有状态栏,它提供的信息包括光标位置和输入数据大小。
二、POPGENE 计算程序窗口概览
POPGENE/Co-Dominant 和 Dominant markers 两个对话框:Haploid Data
Analysis 和 Diploid Data Analysis。 每个对话框里有 3 个等级的 Hierarchical
Structure:Single Populations, Groups 和 Multiple populations。 Single Locus
和 Multilocus 遗传参数的评定通过选择一个或多个 Hierarchical Structure 核对
框实现的。
HAPLOID DATA ANALYSIS
Gene Frequency: 从原始数据中判断每个 locus 的基因频率
Allele Number:计数非零频率等位基因的数量
2
Effective Allele Number:评价彼此的结合性
Polymorphic Loci: 不管等位基因频率,所有多种组合形态位置的百分比
Gene Diversity:判断 Nei’s (1973)基因多样性
Shannon Index: 判断 Shannon 信息指数,以此作为基因多样性的程度
Homogeneity Test: 构建双向相依表和进行(χ
2
)和相似率(G2)测试
F-Statistics:为 Groups 或 Multiple Populations 判断 Nei’s (1973) G
ST
,以及 G
ST
和 G
CS
Gene Flow: 从 G
ST
或 F
ST
中的判断中来进一步判断基因流
Genetic Distance: 判断 Nei’s (1972)遗传特性和遗传距离以及不偏遗传特性和遗
传距离
Dendrogram:用 UPGMA 做基于 Nei’s 遗传距离的树形图
Neutrality Test:用 Manly 提出的算法,为临界稳定执行 Ewens-Watterson 测试
Two-locus LD: 判断 loci 和 χ
2
测试之间的 gametic disequilibria
Brown:计算观察的和预想的 K 的 moments
Smouse:编码常出现的等位基因为 1,假的等位基因为 0. 判断平均内在关系
DIPLOID DATA ANALYSIS
Genotypic Frequency: 从针对 co-dominant markers 的原始数据中判断每个
locus 的基因频率
HW Test:在随机杂交的情况下,用 Levence 计算法则计算预想的遗传型频率,
并 且 执 行 基 于 Hardy-Weinberg 平 衡 ( χ
2
) 和 相 似 率 (G2) 的 测 试 ,
co-dominant markers
Fixation Index:判断 F
IS
作为异形接合体缺失或过多的判据
Allele Frequency:判断原始数据的基因频率
Allele Number: 计数非零频率等位基因的数量
Effective Allele Number: 评价彼此的结合性
Polymorphic Loci: 不管等位基因频率,所有多种组合形态位置的百分比
Obs. Homozygosity:判断给定 locus 观察到杂合子的比例,仅对于 co-dominant
markers
3
仅 限 于
Exp. Homozygosity:判断随即杂交的情况下,预想杂合子的比例,仅对于
co-dominant markers
Shannon Index: 判断 Shannon 信息指数,以此作为基因多样性的程度
Homogeneity Test: 构建双向相依表和进行(χ
2
)和相似率(G2)测试,测试针对于
Groups 或者 Multiple Populations
F-Statistics: 为 Groups 或 Multiple Populations 判断 F-statistics
Gene Flow: 从 GST 或 FST 中的判断中来进一步判断基因流
Genetic Distance: 判断 Nei’s (1972)遗传特性和遗传距离以及不偏遗传特性和遗
传距离
Dendrogram: 用 UPGMA 做基于 Nei’s 遗传距离的树形图
Neutrality Test:用 Manly 提出的算法,为临界稳定执行 Ewens-Watterson 测试
Two-locus LD: 判断 loci 和 χ
2
测试之间的 gametic disequilibria
Smouse: 编码常出现的等位基因为 1,假的等位基因为 0,他们的异形接合体为
1/2. 判断平均内在关系
三、软件的使用
输入文件格式
输入文件应该由表头和数据两部分构成。表头的格式应该是这样:(1)用
/* ... */符号限定;(2)populations 的数量;(3)loci 数量;(4)locus 的名字。
数据开始为每个 population 的 ID #和 population 的名字 ,这两个都是可
选项。如果这两项没有给出的话,就应该在 populations 之间留下至少一个空白
行,该软件会自动给你产生 population 的 ID。如果这两项给出来的话,你的
population 的 ID#和 population 的名字之间必须是不重复的。原始数据的格式很
自由,纵行之间可以带或不带 1 个或更多的空格,但他们之间不能有空行。对于
haploids 和 dominant markers 像 RAPDs 无值的位置要以“ .“代替(也就是
说把出现或未出现等位基因的代表为一个点),对 diploids co-dominant markers
的用“ . .“。下面给出三个例子。头两个例子纵行之间有空格,第三个数据中是
4
空格和无空格的混合以说明数据输入的灵活性。
例 1:haploid data 的输入格式
/* Haploid numeric data of 3 populations each with 3 records (gametes) & 19 loci
*/
Number of populations = 3
Number of loci = 19
locus name :
AAT-1 AAT-2 ACO ADH APH DIA-2 DIA-3 GDH G6H IDH MDH-1 MDH-2 MDH-3 MDH-4
ME PGI
PGM 6PG-1 6PG-2
ID = 1
12111111
12111111
32111211
ID = 2
13111111
16311111
33111111
ID = 3
12111111
12111111
12111111
例 2:diploid data, co-dominant marker 的输入格式
/* Diploid alphabetic data of 3 populations each with varying records
(genotypes) & 21 loci */
Number of populations = 3
5
Number of loci = 21
Locus name :
AAT-1 AAT-2 AAT-3 ACO ADH DIA-1 DIA-3 EST-2 GDH G6P HA
IDH MDH-1 MDH-2 MDH-3 MDH-4 PEP-1 PEP-2 PGI-2 PGM SPG-2
AA AA AA AA AA AA AA BB AA AA AA AA AA AA AA AA AA AA AA AA AA
AA AA AA AB BB A3 AA AB BB AA AA AA AA AA AA AA AA AA AB AA AA
AA AA AA AA BC AC AA AB AB AB AA AA AA AA AA AA AA AA AA AA AA
AA AA AA AA BB CC AA BB AB AA AA AA AA AA AA AA AA AA AA AA AA
AA AA AA AA AB AC AA BB AA AA AA AA AA AA AA AC AA AA AA AB AA
AA AA AA AB AB AC AA AB AB AA AA AA AA AA AA AB AA AA AA AA AA
AB AA AA AA BC AC AA AB AB AA AA AA AA AB AA AB AA AA AA AA AA
AA AA AA AA BB AA AA AA AA AA AA AA AA AA AA AA AA AA AC AA AA
AA AA AA AA AA BC AA AB AA AA AA AA AA AA AA AB AA AA AA AA AA
AA AA AA AB BC BC AA BB AB AA AA AA AA AB AA AA AA AA AA AC AA
AA AA AA AB AC AB AA BB BB AA AA AA AA AA AA AA AA AA AA AA AA
AA AA AA AA AB AC AA BB AA AA AA AA AA AA AA AA AA AA AA AA AA
AA AA AA AA AA BC AB AB AA AA AA AA AA AA AA AA AA AA AC AA AA
AA AA AA AB AA AC AA AB AB AA AA AA AA AA AA AB AA AA AA AA AA
AA AA AA AA BB BB AA AA AA AA AA AA AA AA AA AB AA AA AA AA AA
AA AA AA AA AC AC AA BB AB AA AA AA AA AA AA AA AA AA AA AA AA
AA AA AA AB BB BC AA BB AA AC AA AA AA AA AA AA AA AA AC AD AA
AA AA AA AA AB BC AA AB AB AA AA AA AA AA AA AA AA AA AA AA AA
AA AA AA AA BB BC AA BB AA AA AA AA AA AA AA AB AA AA AA AC AA
AA AA AA AA AA BC AA AB AB AA AA AA AA AA AA BC AA AA AA AA AA
AA AA AA AA AB BC AA AB AB AA AA AA AA AA AA AB AA AA AA AA AA
AA AA AA AA BD BC AA AB AB AA AA AA AA AA AA AA AA AA AC AE AA
AA AA AA AB CC BB AA BB AA AA AA AA AA AA AA AA AA AA AA AB AA
AA AA AA AA BC BB AA AB AB AA AA AA AA AA AA AA AA AA AA AA AA
AA AA AA AB CC BB AA AA AB AA AA AA AA AA AA AA AA AA AA AB AA
6
AA AA AA AA BB BC AA AB AB AA AA AA AA AA AA AA AA AA AA AA AA
AA AA AA AA AB BC AA AA BB AA AA AA AA AA AA AB AA AA AA AA AA
AA AA AA AB AC AB AA BB AA AA AA AA AA AA AA AA AA AA AA AB AA
AA AA AA AB BC BB AA BB BB AA AA AA AA AA AA AB AA AA AA AA AA
AA AA AA AB AB AB AA BB AA AA AA AA AA AA AA AA AA AA AA AA AA
AA AA AA AA BB AB AA AA AA AA AA AA AA AA AA BB AA AA AA AA AA
AA AA AA AA AC BC AA BB AA AA AA AA AA AA AA AA AA AA AA AA AA
AA AA AA AA CC BC AA AB AB AA AA AA AA AA AA AB AA AA AA AC AA
AA AA AA AA BB AC AA BB AA AA AA AA AA AA AA AA AA AA CC AA AA
AA AA AB AA BE BB AA BB AB AA AA AA AA AA AA AB AA AA AA AA AA
AA AA AA AA AB BC AA AB AA AA AA AA AA AA AA AB AA AA AA AA AA
AA AA AA BB AA CC AA AB AB AA AA AA AA AA AA BC AA AA AA AA AA
AA AA AA AB AC BC AA BB BB AA AA AA AA AA AA AA AA AA AA AA AA
AA AA AA AB AA BB AA AC AB AA AA AA AA AA AA AB AA AA AA AA AA
AA AA AA AB BB AC AA BB AA AA AA AA AA AA AA AB AA AA AA AA AA
AA AA AA AA AC AC AA AA AB AA AA AA AB AA AA AB AA AA AA AA AA
AA AA AA AA AA AB AA AB AB AA AA AA AA AA AA AB AA AA AA AA AA
AA AA AA AA BC BC AA BB AB AA AA AA AA AA AA AB AA AA AA AC AA
例 3:diploid data, dominant marker 的输入格式
Number of populations = 2
Number of loci = 28
Locus name :
OPA01-1 OPA01-2 OPA01-3 OPA01-4 OPA01-5
OPA03-1 OPA03-2 OPA03-3 OPA03-4 OPA03-5 OPA03-6
OPA04-1 OPA04-2 OPA04-3 OPA04-4 OPA04-5 OPA04-6 OPA04-7
OPA07-1 OPA07-2 OPA07-3 OPA07-4 OPA07-5 OPA07-6
OPA11-1 OPA11-2 OPA11-3 OPA11-4
name = Slave Lake
7
fis = -0.238
11101 100100 0111010 001000 1001
10110 100100 0011010 001000 0001
11100 100100 0011010 001000 0001
11111 100100 0011010 001010 0001
10110 101100 0011010 001010 1101
11000 100100 1001010 001000 0001
11101 100100 0101010 001000 1001
10110 100100 0000110 111101 0001
11001 100100 0111010 001010 1001
11101 101100 0101010 001000 1001
11100 100100 0011010 110000 1001
11101 111100 0011010 001000 0001
11111 111000 0101010 001000 0001
11000 100100 0000010 001010 0001
11001 100100 0110010 001000 1001
11101 101000 1000010 001000 1001
name = Little Smoky
fis = 0.0
11101 111101 0111010 111000 1111
11101 111100 0011010 001000 1111
11110 100001 1011010 101010 1011
11101 111000 0011010 001011 0001
10101 111111 0011010 111000 0101
11000 100000 0111010 111010 0111
10001 101000 0011010 011000 1001
11101 101111 0011010 011010 1001
11001 101010 0011010 101010 1011
11011 111100 0011010 011010 1011
8
11110 111101 0011010 001001 0011
11001 111111 1011010 001010 1001
11111 111110 0000010 111010 0111
11011 101000 0011010 001000 0001
11101 100000 1111010 001000 1001
11111 100000 1111010 001000 1001
11100 101100 0001010 000101 0110
11001 101100 0100010 110100 1001
10101 100100 0011010 000010 1001
11001 111000 0010010 001000 0001
9
(1) 打开菜单中 File/Load data,然后选择一个合适的数据设置进行分析.
四软件具体操作步骤:
10
(2) 打开你的数据文件后,点击菜单上的 Co-Dominant,根据你的数据
类型选择 Haploid 或 Diploid.
11
(3) 打开 Haploid Data Analysis 或者 Diploid Data Analysis 对话框核对:
是否变量(marker loci)或记录(individual organisms)是柱状输入;
是否你的分析通过 Single Populations, Groups 和/或 Multiple Populations;
正确的 Single Locus 简要统计;
正确的 Multilocus 简要统计;
下面的是一个 Haploid Data Analysis 对话框。注意下面的 Check All 是激活
的。
如果你不确定什么样的特殊分析要进行就检查一下所有的选项,然后点击
OK。
下面是一个关于 co-dominant markers 的 Diploid Data Analysis 对话框。注
意仅仅部分分析选项被选择了。
12
(4) 现在,可能会被程序问道:‘Do you want to retain all loci for further
analysis ?",点击 Yes 或 No 根据自己的情况。
13
如果你选择 No,那么 Delete Locus 对话框会弹出让你删除部分你选择的 loci
14
analysis?‘
(5) 接着,回答问题"Do you want to retain all populations for further
如果你选择 No,那么 Delete Populations 对话框会弹出让你删除部分你选择的
populations
15
(6) 如果你在第(3)步选择了 Groups,在 enter the number of groups
对话框输入组数
16
点击 OK 打开 Group Populations 对话框,为每个 group 选择正确的 populations
17
(7) 如果 Two-locus LD 在第(3)步被选择 Check 的话,你需要选一个
significance level(P)去测试 loci 之间的 linkage disequilibria。重要的:
在你有大量的 alleles/locus, loci 和 populations 时,一个高的 P 值能导
致一个极大的输出大部分例子中,P 应该小于等于 0.05
18
(8) 如果 Neutrality Test 在第(3)步被选择 Check 的话,你需要选择去
测试 neutrality 的为计算 95%上下限的置信界限的 simulations 的数量。
推荐 500 – 1000 simulations 为置信界限的可信估计。
19
(9) 如果你正确的完成了从(1)到(8)的操作,这是会出现
输出窗口,显示了你选择数据的分析结果。打开 File | 保存成 SCII
码形式,可以进一步使用或者直接复制粘贴到 word 中。
下面是关于 dominant markers 的 Diploid Data Analysis 对话框。你可能需要在
HW equilibrium (i.e., F
IS
= 0) 或 HW disequilibrium (i.e., F
IS
0)之间进行选
择。注意到在你的数据中,你可以为每一个 population 指定
F
IS
值。如果你没
有指定 F
IS
值,程序会默认假定你的
population 处于 HW equilibrium。当
你选择了 HW disequilibrium,程序会在判断等位基因频率的时候读
F
IS
值并且
使用它。如果你有了 F
IS
值但是却选择了
HW equilibrium,这个时候程序
会忽略你的
F
IS
值并认为是
HW equilibrium。
20
对于 dominant markers 的数据分析,和描述的 co-dominant markers 分析很相
似。
2
发布者:admin,转转请注明出处:http://www.yc00.com/web/1711894697a1973534.html
评论列表(0条)