splitMask | 通过SE FASTQ文件里的CID indexing,将Stereo-seq芯片 T mask 文件拆分成多个部分。 |
CIDCount | 计算Stereo-seq芯片T mask 文件的CID数量,预估mapping过程中的所需内存(强烈建议在mapping之前使用该模块) |
mapping | 将记录于FASTQ(3,4)文件的Stereo-Seq原位捕获的测序reads和空间信息对应。将reads与参考基因组比对,并生成排序后的BAM文件; |
merge (可选) | 合并CID(类似barcode)对应reads数列表。仅应用于多对FASTQ数据合并分析; |
count | 读取mapping生成的BAM文件,对比对结果进行基因注释、去重、和基因表达分析; |
register | 用于将显微拍照的组织切片影像图与count生成的基因表达矩阵文件(GEF)进行配准;当图像QC失败或缺图像时可选择性不使用register。 |
imageTools | 将IPR文件转换成TIFF文件,例如把TIFF文件进行模板对齐和拼接,把组织分割和细胞分割图像进行二值化,当图像QC失败或者缺失图像时可不使用此模块。 |
tissueCut | 根据count生成的基因表达矩阵或同时结合register得到的配准图像,识别芯片上的组织覆盖区域,提取对应位置的基因表达矩阵; |
spatialCluste | 根据tissueCut生成的组织覆盖区域基因表达矩阵做bin200的聚类分析; |
cellCut | 根据count生成的基因表达矩阵并同时结合从register和imageTools得到的细胞分割结果图,识别芯片上每个细胞的空间位置区域,提取单个细胞的基因表达矩阵;当图像QC失败或者缺失图像时可不使用此模块。 |
cellCluster | 根据cellCut生成的细胞的基因表达矩阵做细胞聚类分析;当图像QC失败或者缺失图像时可不使用此模块。 |
saturation | 根据count生成的用于抽样统计的文件计算组织覆盖区域的测序饱和度。 |
report | 生成整合了每步分析结果的JSON格式统计报告,以及HTML网页分析报告,展示基因的空间表达分布、关键统计指标、测序饱和度统计图、以及聚类分析结果;HTML报告是否具有cell bin统计数据和关键结果的图像处理,取决于图像是否通过QC以及和register程序选取的模式。 |
cellCut的其他应用 | 根据count生成的基因表达矩阵或同时结合register得到的配准图像,识别芯片上的组织覆盖区域,提取对应位置的基因表达矩阵; |
rapidRegister | 根据tissueCut生成的组织覆盖区域基因表达矩阵做bin200的聚类分析; |
checkGTF | 根据cellCut生成的细胞的基因表达矩阵做细胞聚类分析;当图像QC失败或者缺失图像时可不使用此模块。 |
imageTools的其他应用 | 1)以R-G-B的顺序融合2-3张TIFF图,用于检查分割结果; 2)将模版信息标记在拼接大图上辅助评估拼接和配准结果; 3)将TIFF图转成RPI格式。 |
manualRegister | 根据StereoMap可视化软件获取到的手动配准操作参数运行manualRegister来修改IPR中的配准记录。可通过开启“微调”参数在manualRegister运行时对手动配准结果进行自动调整,使其更加精准。 |
lasso | 根据StereoMap可视化软件手动套索获取的GEOJSON记录的区域信息提取对应坐标范围的一个或多个空间或细胞的基因表达矩阵子集。 |
运行SAW的Linux系统需满足的最低要求包括:
运行SAW需提前安装下列其中一个软件: