Enrichr算法

用途与运行方式

  • 场景一:对SDAS DEG分析得到的显著差异基因富集分析

    SDAS geneSetEnrichment enrichr \
    -i de_t-test.anno_rctd.SmoothMuscle-vs-Endo.sig_filtered.csv -o outdir \
    --species human
    
  • 场景二:只用感兴趣的数据库进行显著差异基因的富集分析

    SDAS geneSetEnrichment enrichr \
    -i de_t-test.anno_rctd.SmoothMuscle-vs-Endo.sig_filtered.csv -o outdir \
    --gmt sdas_deg_enrichment/lib/GSEADB/KEGG_2021_Human.gmt
    

输入参数说明

enrichr参数 是否必须 默认值 描述
-i / --input SDAS DEG 分析得到的sig_filtered.csv文件
-o / --output 结果存放路径
--species human 指定物种的数据库,'human' 或 'mouse',默认 'human',当指定--gmt参数时,该参数不起作用
--gmt gmt格式的数据库文件,其中gene name信息必须转为大写,多个文件时用','隔开,不提供时使用--species参数指定的物种数据库
--cut_off 1 富集结果作图时过滤的pvalue阈值,默认值为1,设太小可能会由于没有显著富集结果导致无法作图
--background 设定富集分析时使用的background,默认为所用数据库的gene数
--top_term 10 筛选top数量的通路进行作图,默认10
-v / --verbose 启用详细模式,打印任务进度。默认:False

输出结果展示

enrichr结果文件 描述
enrichment_{database}.UP.csv 上调基因的富集分析结果
enrichment_{database}.DOWN.csv 下调基因的富集分析结果
enrichment_{database}.pdf/png 上调和下调基因显著富集通路图
  • 上/下调基因的富集分析结果: enrichment_{database}.UP/DOWN.csv ,分别对上调和下调基因进行富集分析的结果文件,文件包含Gene_set,Term,Overlap,P-value,Adjusted P-value,Odds Ratio,Combined Score,Genes这几列,分别表示基因集所属的数据库名称、具体的功能通路名称、输入基因列表中与该基因集重叠的基因数量及比例、富集分析的原始显著性p值、校正后的p值、衡量输入基因在基因集中富集的强度值、综合评分、输入基因中与该基因集重叠的具体基因名称。
Gene_set Term Overlap P-value Adjusted P-value Odds Ratio Combined Score Genes
KEGG_2021_Human.gmt ABC transporters 43/45 0.00026880161509715636 0.002529897553855589 5.888896293211162 48.41577841510133 ABCA3;ABCB4;...
KEGG_2021_Human.gmt AGE-RAGE signaling pathway in diabetic complications 90/100 0.00011055669162020043 0.0013606977430178514 2.928493469422023 26.678523151510976 AKT1;PLCB1;...
KEGG_2021_Human.gmt AMPK signaling pathway 107/120 6.61066069653723e-05 0.0009525689822440243 2.709298083129859 26.074940028325518 AKT1;CREB3;...
... ... ... ... ... ... ... ...
  • 富集分析结果条形图:enrichment_{database}.pdf/png不同颜色分别表示上下调基因最富集的top通路。
© 2025 STOmics Tech. All rights reserved.Modified: 2025-08-01 16:50:17

results matching ""

    No results matching ""