InferCNV算法

用途

利用inferCNV工具对空间转录组数据进行拷贝数变异(CNV)推断,帮助揭示组织中不同区域的基因组变异特征。同时该工具也支持对scRNA-Seq数据进行CNV推断。

运行方式

  • 使用细胞注释后的h5ad,准备rds文件:
SDAS dataProcess h5ad2rds -i st.h5ad -o outdir
  • 运行inferCNV
SDAS infercnv -i st.rds --h5ad st.h5ad --bin_size 50 --slice_key batch \
-o outdir --label_key anno_cell2location --species human \
--ref_group_names B,T --min_counts_per_cell 200

输入参数说明

参数 是否必须 默认值 描述
--run_mode stRNA 选择空间转录组(stRNA)或单细胞(scRNA)模式
-i / --input rds文件,要求有原始表达矩阵
-o / --output 所有文件的输出目录
--h5ad h5ad格式的sample.h5ad,用于空间热图(单细胞模式无需设置)
--bin_size Bin大小,控制空间热图点大小(如20,50,100),单细胞模式无需设置
--label_key rds对象metadata中的注释信息字段
--ref_group_names 参考分组名,指定normal cell/sample分组,默认用全部cell(不推荐)
--gene_order_file 用户自定义基因染色体位置信息文件,不提供时,使用--species指定的软件自带文件。
--cluster_heatmap False 是否对cell聚类展示CNV heatmap(True/False)
--species human 指定预先构建好的物种的*_pos.txt,‘human’ 或者‘mouse’,默认‘human’,当指定--gene_order_file参数时,该参数不起作用
--slice_key sampleID 多片h5ad.obs中表示片编号的列名
--gene_symbol_key real_gene_name rds中基因名(symbol)的列名(_index为矩阵列名)
--assay rds中用于计算cnv的assay名称
--cutoff 0.02 基因过滤参数,参考细胞/bins中每基因最小平均counts数
--min_counts_per_cell 100 每个cell的最小counts数

输出结果展示

结果文件 描述
<input_name>_run.final.infercnv_obj.rds 包含所有基因和spot的cnv矩阵的rds对象
<input_name>_CNV_score.csv 每个spot的cnv score
<input_name>_CNV_ref.png/pdf 参考细胞的CNV表达热图(ref_group_names为None时不输出)
<input_name>_CNV_obs.png/pdf 观测细胞的CNV表达热图
<input_name>_CNV_score.png/pdf CNV score的空间热图(多片时每片一张,单细胞模式不输出)
  • 参考细胞的CNV表达热图<input_name>_CNV_ref.png/pdf 横轴为spot,纵轴为基因,颜色为CNV强度
  • 观测细胞的CNV表达热图<input_name>_CNV_obs.png/pdf 横轴为spot,纵轴为基因,颜色为CNV强度
    • --cluster_heatmap False : 不对spot进行聚类

  • --cluster_heatmap True:对spot进行聚类

  • CNV score空间热图<input_name>_CNV_score.png/pdf 颜色为CNV强度
  • CNV score文本文件<input_name>_CNV_score.csv,值越大代表CNV强度越高
spot_id CNV_score
429496737600_D03663C6 0.0018
429496737700_D03663C6 0.0015
429496737800_D03663C6 0.0031
... ...
© 2025 STOmics Tech. All rights reserved.Modified: 2025-08-01 16:50:17

results matching ""

    No results matching ""