monocle3算法

用途

利用monocle3 算法对空间转录组和单细胞数据进行轨迹推断,自动输出多种轨迹相关结果。

运行方式

  • 使用细胞注释后的h5ad,准备rds文件
SDAS dataProcess h5ad2rds -i st.h5ad -o outdir
  • 运行monocle3
SDAS trajectory monocle3 -i st.rds -o outdir --root_key anno_spotlight --root CAF_DES \
--gene_symbol_key real_gene_name \
--batch_key sampleID

输入参数说明

参数 是否必须 默认值 描述
-i / --input rds文件,要求有原始表达矩阵
-o / --output 输出文件夹
--root_key meta.data中根节点所在的列名称
--root 设置为根节点的名称
--assay rds文件中用于分析的assay名称,若不设置则用当前默认assay
--gene_symbol_key real_gene_name rds文件中基因名(symbol)的列名(meta.features),_index 表示用矩阵的列名
--batch_key 进行批次校正的meta.data列名,不输入则不做去批次
--resolution leiden聚类的resolution参数,不输入则算法会自适配
--use_existing_umap_cluster 使用rds已有的umap和cluster信息
--umap_key umap 输入rds存储umap信息的名称
--cluster_key leiden 输入rds存储cluster信息的名称
--deg 分析随拟时序变化的差异基因则输入”--deg”
--n_cpus 8 多线程数
--top_gene_num 5 随拟时序变化的top差异基因数目的表达图
--gene_file 自定义基因列表文件路径,画基因随拟时序变化的表达趋势图
--gene_color_label pseudotime 基因图展示的列的名称
--pval_cutoff 0.05 差异基因筛选p值
--qval_cutoff 0.05 差异基因筛选q值
--seed 42 随机种子

输出结果展示

结果文件 描述
<input_name>_dimension.png/pdf 降维图,展示细胞在低维空间的分布结构
<input_name>_dimension_color_by_batch.png/pdf 以批次信息展示的降维图(有做批次校正时输出),用于评估批次效应
<input_name>_cluster.png/pdf 聚类图,展示细胞聚类分布情况
<input_name>_roots.png/pdf root图,显示轨迹分析的根节点位置
<input_name>_pseudotime.png/pdf 拟时序图,展示细胞的拟时序分布
<input_name>_top_genes_in_pseudotime.png/pdf 拟时序变化的top基因表达趋势图
<input_name>_custom_genes_in_pseudotime.png/pdf 拟时序变化的自定义基因表达趋势图
<input_name>_monocle3.rds 包含轨迹分析结果的rds文件
<input_name>_pseudotime.csv 细胞的拟时序结果,记录每个细胞的拟时序值
<input_name>_deg_trajectory.xls 随拟时序变化的所有基因的结果
  • 降维图<input_name>_dimension.png/pdf 展示细胞在低维空间的分布结构,反映整体异质性和分群结构
  • 聚类图<input_name>_cluster.png/pdf 展示细胞聚类分布,反映整体异质性和分群结构
  • root图<input_name>_roots.png/pdf 展示轨迹分析的根节点,标记轨迹推断的起始点(根节点),用于后续拟时序排序
  • 拟时序图<input_name>_pseudotime.png/pdf 展示细胞拟时序分布,细胞按推断的发育/转化顺序着色,反映动态变化过程
  • 拟时序变化的top基因表达趋势图<input_name>_top_genes_in_pseudotime.png/pdf 展示拟时序变化最显著的top基因表达趋势
  • 拟时序变化的自定义基因表达趋势图<input_name>_custom_genes_in_pseudotime.png/pdf 展示用户指定基因在拟时序过程中的基因表达趋势

调参建议

monocle3的轨迹分析一般需以细胞亚型精准注释为前提。通过亚型划分,算法可排除无关细胞干扰,聚焦于具有发育连续性的细胞群体,从而推断符合生物学逻辑的分化路径。实际分析中,推荐选取特定细胞群体,不要使用全片进行分析,同时可降低运行时间和内存。

© 2025 STOmics Tech. All rights reserved.Modified: 2025-08-01 16:50:17

results matching ""

    No results matching ""