玩转服务器—pySCENIC环境难题,共享服务器一键化解
SCENIC
SCENIC (Single-Cell rEgulatory Network Inference and Clustering) 是一种基于单细胞 RNA 测序数据的调控网络分析方法,旨在从单细胞水平推断 转录调控网络。其核心思想是通过 聚类分析(Clustering)和 保守性分析(Conservation)识别活跃的转录因子(TF)、预测它们的靶基因,并解析细胞类型或状态特异性的调控机制。SCENIC 最早由 Aertslab 团队提出(SCENIC: Single-Cell Regulatory Network Inference via Clustering and Conservation【 .1038/nmeth.4463 】),而 pySCENIC 是SCENIC分析的python实现,其具有更快的速度。
SCENIC经过以下三个步骤完成转录因子分析:
- 基因共表达网络构建,利用GENIE3 或 GRNBoost2算法,从scRNA-seq 数据中推断基因之间的相互作用,并识别潜在转录因子和其靶基因间的关系。
- 调控模块生成,将转录因子及其推断的靶基因集合定义为「调控模块」,此步骤通过结合数据库中已知的 转录因子结合基序(Motif) 进一步验证,筛选出更可信的调控网络。
- 调控模块活性评分:使用 AUCell 算法计算每个调控模块在每个单细胞中的活性。AUCell(Area Under the Curve for geneset enrichment) 是用来衡量特定基因模块在单细胞中的表达水平的方法。
共享服务器一键开启pySCENIC
可能大家都没留意到共享服务器是有配置singularity的,pyscenic的运行环境没有必须自己再去单独配置,完全可以直接调用singularity,拉取 pyscenic镜像文件,直接使用。
代码语言:javascript代码运行次数:0运行复制# pySCENIC CLI version
singularity build aertslab-pyscenic-0.12.1.sif docker://aertslab/pyscenic:0.12.1
##镜像文件大小
286M 3月 25 01:28 aertslab-pyscenic-0.12.1.sif
拉取镜像文件
数据库下载
数据库网址:
- /
- /
- /
- Gene-based 数据库存储的是 基因组上已知转录因子(TF)的结合位点(TFBS),通常针对 基因的启动子或增强子区域。主要用于 验证已知 TF 的 Motif 是否在特定基因集合中富集,适用于靶向已知的调控元件分析。
- Region-based 数据库存储的是 全基因组范围内的保守或功能区域(如启动子、增强子、沉默子等),而非局限于已知基因。主要用于 探索未知调控元件 或分析 大规模区域集(如 ATAC-seq 可及区域)的 Motif 富集。
cd ~/reference && mkdir pyscenic_database
##human:
screen -r wget
wget -c .genes_vs_motifs.rankings.feather
wget -c .genes_vs_motifs.rankings.feather
wget -c .txt
##other
wget -c .txt
wget -c .hgnc-m0.001-o0.0.tbl
wget -c .hgnc-m0.001-o0.0.tbl
hg38
下载数据库文件
同理按需依次下载所需文件。
运行
基因调控网络推断及共表达模块生成
输入:
- 表达矩阵文件,支持 CSV文件【行=细胞,列=基因】或者loom文件【行=基因,列=细胞】
参考文件:
- 转录因子列表文件(每行一个 TF 名称)
singularity run ~/sif/aertslab-pyscenic-0.12.1.sif \
pyscenic grn \
--num_workers 6 \
--output /home/data/t030659/pyscenic_test/expr_mat.adjacencies.tsv \
--method grnboost2 \
/home/data/t030659/pyscenic_test/mc_mat.loom \
/home/data/t030659/reference/pyscenic_database/allTFs_hg38.txt
--num_workers #调用线程设置
--output #输出文件,转录因子(TF)与其靶点之间的邻接关系列表
--method #算法选择,可选:genie3(基于梯度提升的树模型)、grnboost2(默认,基于逻辑回归)
pyscenic grn 日志
转录调控预测
输入:
- module_fname,基因调控网络文件(.tsv)
- 表达矩阵文件(.loom)
参考文件:
- database_fname,调控特征数据库文件(.feather)
- 基序注释文件(.tbl)
singularity run ~/sif/aertslab-pyscenic-0.12.1.sif \
pyscenic ctx \
/home/data/t030659/pyscenic_test/expr_mat.adjacencies.tsv \
--expression_mtx_fname /home/data/t030659/pyscenic_test/mc_mat.loom \
/home/data/t030659/reference/pyscenic_database/hg38_10kbp_up_10kbp_down_full_tx_v10_clust.genes_vs_motifs.rankings.feather \
--annotations_fname /home/data/t030659/reference/pyscenic_database/motifs-v10nr_clust-nr.hgnc-m0.001-o0.0.tbl \
--output /home/data/t030659/pyscenic_test/cistarget_out_reg.csv \
--num_workers 6 \
--mask_dropouts
--expression_mtx_fname #表达矩阵文件
--annotations_fname #Motif注释文件
--mask_dropouts #掩码零值cell
pyscenic ctx 日志
评估转录因子调控模块活性
用AUCell算法计算每个调控模块在每个细胞中的活性分数。
代码语言:javascript代码运行次数:0运行复制singularity run ~/sif/aertslab-pyscenic-0.12.1.sif \
pyscenic aucell \
/home/data/t030659/pyscenic_test/mc_mat.loom \
/home/data/t030659/pyscenic_test/cistarget_out_reg.csv \
--output out_SCENIC.loom \
--num_workers 6
pyscenic aucell日志
参考:
- .html#docker-podman-and-singularity-apptainer-images
- ==&mid=2247485056&idx=2&sn=199b38c0e3da84d7e304e6f6f5704a64&scene=21#wechat_redirect
发布者:admin,转转请注明出处:http://www.yc00.com/web/1748135233a4736780.html
评论列表(0条)