玩转服务器—pySCENIC环境难题,共享服务器一键化解

SCENICSCENIC (Single-Cell rEgulatory Network Inference and Clustering) 是一种基于单细胞 RNA 测序数据的调控网络分析方法,旨在从单细胞水平推断 转录调控网络。其核心思

玩转服务器—pySCENIC环境难题,共享服务器一键化解

SCENIC

SCENIC (Single-Cell rEgulatory Network Inference and Clustering) 是一种基于单细胞 RNA 测序数据的调控网络分析方法,旨在从单细胞水平推断 转录调控网络。其核心思想是通过 聚类分析(Clustering)和 保守性分析(Conservation)识别活跃的转录因子(TF)、预测它们的靶基因,并解析细胞类型或状态特异性的调控机制。SCENIC 最早由 Aertslab 团队提出(SCENIC: Single-Cell Regulatory Network Inference via Clustering and Conservation【 .1038/nmeth.4463 】),而 pySCENIC 是SCENIC分析的python实现,其具有更快的速度。

SCENIC经过以下三个步骤完成转录因子分析:

  • 基因共表达网络构建,利用GENIE3 或 GRNBoost2算法,从scRNA-seq 数据中推断基因之间的相互作用,并识别潜在转录因子和其靶基因间的关系。
  • 调控模块生成,将转录因子及其推断的靶基因集合定义为「调控模块」,此步骤通过结合数据库中已知的 转录因子结合基序(Motif) 进一步验证,筛选出更可信的调控网络。
  • 调控模块活性评分:使用 AUCell 算法计算每个调控模块在每个单细胞中的活性。AUCell(Area Under the Curve for geneset enrichment) 是用来衡量特定基因模块在单细胞中的表达水平的方法。

共享服务器一键开启pySCENIC

可能大家都没留意到共享服务器是有配置singularity的,pyscenic的运行环境没有必须自己再去单独配置,完全可以直接调用singularity,拉取 pyscenic镜像文件,直接使用。

代码语言:javascript代码运行次数:0运行复制
# pySCENIC CLI version
singularity build aertslab-pyscenic-0.12.1.sif docker://aertslab/pyscenic:0.12.1

##镜像文件大小
286M 3月  25 01:28 aertslab-pyscenic-0.12.1.sif
拉取镜像文件

拉取镜像文件

数据库下载

数据库网址:

  • /
  • /
  • /
  • Gene-based 数据库存储的是 基因组上已知转录因子(TF)的结合位点(TFBS),通常针对 基因的启动子或增强子区域。主要用于 验证已知 TF 的 Motif 是否在特定基因集合中富集,适用于靶向已知的调控元件分析。
  • Region-based 数据库存储的是 全基因组范围内的保守或功能区域(如启动子、增强子、沉默子等),而非局限于已知基因。主要用于 探索未知调控元件 或分析 大规模区域集(如 ATAC-seq 可及区域)的 Motif 富集。
代码语言:javascript代码运行次数:0运行复制
cd ~/reference && mkdir pyscenic_database

##human:
screen -r wget
wget -c .genes_vs_motifs.rankings.feather
wget -c .genes_vs_motifs.rankings.feather
wget -c .txt

##other
wget -c .txt
wget -c .hgnc-m0.001-o0.0.tbl
wget -c .hgnc-m0.001-o0.0.tbl
hg38

hg38

下载数据库文件

下载数据库文件

同理按需依次下载所需文件。

运行

基因调控网络推断及共表达模块生成

输入:

  • 表达矩阵文件,支持 CSV文件【行=细胞,列=基因】或者loom文件【行=基因,列=细胞】

参考文件:

  • 转录因子列表文件(每行一个 TF 名称)
代码语言:javascript代码运行次数:0运行复制
singularity  run ~/sif/aertslab-pyscenic-0.12.1.sif \
        pyscenic grn \
        --num_workers 6 \
        --output /home/data/t030659/pyscenic_test/expr_mat.adjacencies.tsv \
        --method grnboost2 \
        /home/data/t030659/pyscenic_test/mc_mat.loom \
        /home/data/t030659/reference/pyscenic_database/allTFs_hg38.txt

--num_workers #调用线程设置
--output #输出文件,转录因子(TF)与其靶点之间的邻接关系列表
--method #算法选择,可选:genie3(基于梯度提升的树模型)、grnboost2(默认,基于逻辑回归)
pyscenic grn 日志

pyscenic grn 日志

转录调控预测

输入:

  • module_fname,基因调控网络文件(.tsv)
  • 表达矩阵文件(.loom)

参考文件:

  • database_fname,调控特征数据库文件(.feather)
  • 基序注释文件(.tbl)
代码语言:javascript代码运行次数:0运行复制
singularity  run ~/sif/aertslab-pyscenic-0.12.1.sif \
        pyscenic ctx \
        /home/data/t030659/pyscenic_test/expr_mat.adjacencies.tsv \
        --expression_mtx_fname /home/data/t030659/pyscenic_test/mc_mat.loom \
        /home/data/t030659/reference/pyscenic_database/hg38_10kbp_up_10kbp_down_full_tx_v10_clust.genes_vs_motifs.rankings.feather \
        --annotations_fname /home/data/t030659/reference/pyscenic_database/motifs-v10nr_clust-nr.hgnc-m0.001-o0.0.tbl \
        --output /home/data/t030659/pyscenic_test/cistarget_out_reg.csv \
        --num_workers 6 \
        --mask_dropouts

--expression_mtx_fname #表达矩阵文件
--annotations_fname #Motif注释文件
--mask_dropouts #掩码零值cell

pyscenic ctx 日志

pyscenic ctx 日志

评估转录因子调控模块活性

用AUCell算法计算每个调控模块在每个细胞中的活性分数。

代码语言:javascript代码运行次数:0运行复制
singularity  run ~/sif/aertslab-pyscenic-0.12.1.sif \
        pyscenic aucell \
        /home/data/t030659/pyscenic_test/mc_mat.loom \
        /home/data/t030659/pyscenic_test/cistarget_out_reg.csv \
        --output out_SCENIC.loom \
        --num_workers 6
pyscenic aucell日志

pyscenic aucell日志

参考:

  • .html#docker-podman-and-singularity-apptainer-images
  • ==&mid=2247485056&idx=2&sn=199b38c0e3da84d7e304e6f6f5704a64&scene=21#wechat_redirect
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。原始发表:2025-03-25,如有侵权请联系 cloudcommunity@tencent 删除算法网络数据库服务器日志

发布者:admin,转转请注明出处:http://www.yc00.com/web/1748135233a4736780.html

相关推荐

  • 玩转服务器—pySCENIC环境难题,共享服务器一键化解

    SCENICSCENIC (Single-Cell rEgulatory Network Inference and Clustering) 是一种基于单细胞 RNA 测序数据的调控网络分析方法,旨在从单细胞水平推断 转录调控网络。其核心思

    4小时前
    20

发表回复

评论列表(0条)

  • 暂无评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信