Lowpass 用户手册

DCS Cloud大约 13 分钟

Lowpass 用户手册

1. 第一章 产品信息

1.1 产品描述

Lowpass流程是基于低深度全基因组测序(0.1X-10X)进行基因型填补 (Genotype-Imputation)

的流程,同时支持 CNV 变异检测和多基因风险评分 (PRS) 等功能。该流程功能包括数据比对、质控、变异检测、填补以及报告生成。通过DCS Cloud平台用户图形化界面进行参数输入及报告输出的流程分析管理,使用方法简单。该流程使用高性能服务器配置,任务实行并行化,缩短分析周期,达到快速、高效交付的目的。

1.2 注意事项

  1. 专门分析lowpass 全基因组测序(LP-WGS)的流程。
  2. 流程名称
    Lowpass_v5主流程(生成单样本html报告);
    LowpassSummary_v5流程(可用于生成多样本报告或单样本交付报告)。
  3. 当前流程仅支持人和猪两个物种,后续如有新物种的需求,会迭代更新。
  4. 当前最新版本:V1.2.0,发布时间:2024.11

2. 第二章 产品介绍

2.1 分析流程图

Lowpass流程是专门分析LP-WGS数据的流程。根据单倍型参考序列集(Reference panel)信息,对低深度全基因组测序的下机数据中缺失的基因型进行推断和基因型填补(Genotype-Imputation)。同时,人类样本支持CNV 变异检测和多基因风险评分(Polygenic Risk Score,简称PRS)等功能。

流程包含以下几项功能:

  • 数据比对:根据参考基因组进行比对,生成并统计比对结果。
  • 变异检测:根据比对结果,分析样本的突变结果包括SNP和InDel。
  • 填补:根据单倍型参考序列集,对缺失的基因型进行推断和基因型填补。
  • 生成报告:综合分析结果,整理汇总成HTML和PDF报告。
图2-1 整体分析流程图

2.1.1 参考基因组比对

使用BWA将Raw Fastq文件与参考基因组进行比对,然后将输出结果传给samtools工具,将其转变为bam格式文件。

2.1.2 排序与去重

使用GATK分析比对生成的bam文件,按照染色体位置,进行排序操作,然后标记重复部分,输出含有重复项统计信息的bam文件及相应的bai索引文件。

2.1.3 碱基质量矫正

使用GATK中的BaseRecalibrator工具,通过参考基因组与含有已知SNP位点的vcf数据集,对bam文件进行测序数据识别与矫正,生成重矫正表文件。随后用ApplyBQSR 工具,根据上一步的重矫正表文件,对bam进行碱基质量得分重矫正。

2.1.4 变异检测与基因型填补

通过GATK和bcftools工具初步检测出基因型信息和基因型似然值。根据基因型似然值结果以及基于大量高深度测序样本分型后的单倍型参考序列集用自开发的Lowpass软件基于HMM模型进行填补。

2.1.5 分析与报告输出

综合分析结果,整理汇总成HTML和PDF报告。Lowpass_v5主流程会生成单样本html质控报告,LowpassSummary_v5流程可用于生成多样本报告或单样本交付报告,报告内含有流程介绍和结果统计。

3. 第三章 使用说明书

Lowpass标准分析流程通过STOmics时空云平台系统进行样本输入及报告输出的全流程管理。下面具体介绍基于STOmics时空云平台系统使用Lowpass标准分析流程的操作指南。

3.1 指南概述

3.1.1 概述

本章介绍如何使用Lowpass标准分析流程进行分析。在使用之前,请认真阅读并理解其中内容,保证能够正确使用Lowpass。

3.2 使用场景一:手动投递

操作共包括四个步骤:上传数据、添加工作流、Lowpass分析、LowpassSummary输出报告。运行任务后,当客户在看到任务状态为completed时,代表任务已完成,即可查看报告部分(详见3.4部分)。

3.2.1 步骤一:上传数据

  1. 点击左侧导航栏【数据管理】,进入数据管理页面,进入目标文件夹,点击右上角【+添加文件】-【工具上传】上传数据(图3-1):
图3-1 步骤一(1):文件上传
  1. 点击【上传】浏览并选择所需文件(图3-2),上传完成后文件会在目标文件夹中显示(如首次上传,则需点击【安装并启动传输客户端】安装所需工具):
图3-2 步骤一(2):文件上传

3.2.2 步骤二:添加工作流

  1. 点击顶部导航栏【项目】进入项目列表页面,在搜索框输入项目名称/项目编号,点击进入项目(图3-3):
图3-3 步骤二(1):添加工作流
  1. 点击左侧导航栏【流程分析】进入流程分析页面,点击右上角【+ 添加工作流】添加工作流,点击【从公共库复制】(图3-4):
图3-4 步骤二(2):添加工作流
  1. 在搜索框中输入Lowpass,选择Lowpass_v5*,点击【复制】,进入下一步,然后再选择LowpassSummary_v5,点击【复制】,跳至第5步(图3-5):
  1. 设置流程名称,完成后点击【确定】(图3-6):
  1. 工作流添加成功(图3-7、图3-8):
图3-7 步骤二(5):添加工作流
图3-8 步骤二(5):添加工作流

3.2.3 步骤三:Lowpass分析

  1. 点击左侧导航栏【流程分析】进入流程分析页面,在搜索框输入Lowpass,点击【运行】(图3-9):
图3-9 步骤三(1):Lowpass分析
  1. 输入实体ID,点击【下一步】(图3-10):
图3-10 步骤三(2):Lowpass分析
  1. Lowpass_v5录入样本信息,完成后点击【下一步】(图3-11):
图3-11 步骤三(3):Lowpass分析

Lowpass_v5分析变量说明

SN:样本名称或特殊ID,默认与Entity ID一致;

LIB:BWA DNA制备文库标识符输入,或自定义(例如,SN);

PU:测序平台下级单位名称(run的名称),如slide-id+lane,或自定义(例如,SN);

RefPanel:参考面板仅由“hg38”(GRCh38)组成;

RawFastqs:测序获得的原始数据 (fq.gz)。PE:一个文件组中有一对 FASTQ 文件(注意FASTQ文件选择顺序,先选择read1然后选择read2)。SE:一个文件组中有一个 FASTQ 文件;

DoCNVStep:调用 CNV(拷贝数变体);

DoPRSStep:对 PRS(多基因风险评分)分析,仅限人类;

  1. 点击【运行】启动分析(图3-12)。
图3-12 步骤三(4):Lowpass分析
  1. 点击左侧导航栏【任务管理】进入流程分析页面,在流程名称中选择Lowpass_v5,查看任务状态,任务完成后,任务状态显示为完成,复制任务编号(图3-13),点击导航栏【数据管理】,将任务编号输入文件夹/文件名进行搜索,如W202407110016(请用实际生成的任务编号)文件夹将作为 LowpassSummaryV5的DataDir参数的输入(图3-14)。
图3-13 步骤三(5):Lowpass分析
图3-14 步骤三(5)Lowpass分析

3.2.4 步骤四:LowpassSummary输出报告

  1. 点击左侧导航栏【流程分析】进入流程分析页面,在搜索框输入LowpassSummary,点击【运行】(图3-15):
图3-15 步骤四(1):LowpassSummary输出报告
  1. 输入实体 ID,点击【下一步】(图3-16):
图3-16 步骤四(2):LowpassSummary输出报告
  1. LowpassSummaryV5录入样本信息,完成后点击【下一步】(图3-17):
图3-17 步骤四(3): LowpassSummaryV5输出报告

LowpassSummaryV5变量说明

SN:样本名称或特殊ID,默认与Entity ID一致;

DataDir:输入文件是低通处理染色vcf.gz文件夹(即Lowpass分析的输出文件夹,如在步骤三(3.2.3Lowpass分析)生成的文件夹/Files/ResultData/Workflow/W202407110016);

RefPanel:参考面板仅由“hg38”(GRCh38)组成;

MergeVcf:是否合并样本 vcf;

Depth:测序覆盖的平均深度;

  1. 点击【运行】启动分析,等待报告输出(图3-17)
图3-17 步骤四(4):LowpassSummary输出报告

3.3 使用场景二:表格投递

操作共包括五个步骤:上传数据、添加工作流、下载表格模板、填写并导入表格、启动分析。完成样本模板导入后,可批量运行任务,当客户在看到任务状态为完成时,代表任务已完成,即可查看报告部分(详见3.4部分)。

3.3.1 步骤一:上传数据

与使用场景一(手动投递)步骤一一致(详见3.2.1步骤一:上传数据)。

3.3.2 步骤二:添加工作流

与使用场景一(手动投递)步骤二一致(详见3.2.2步骤二:添加工作流)。

3.3.3 步骤三:下载表格模板

  1. 点击左侧导航栏【数据管理】,选择【表格】-【下载模板】(如图3-18), 点击【从流程导出模板】,选择Lowpass_v5、LowpassSummaryV5模板下载:
图3-18 样本模板下载导航
  1. 打开后样本模板Excel如图3-19、3-20:
图3-19 Lowpass_v5样本模板表格
图3-20 LowpassSummaryV5样本模板表格

3.3.4 步骤四:填写并导入表格

  1. 该使用场景条件下,导入表格需填写工作表。该场景表示对已测序完成的样本数据在导入表格后,直接进入分析。

Excel注意事项

[1] 导入文件路径必须在云平台已存在。

[2] 模板中,所有内容均为必填项,任何字段不得为空。

[4] Excel中不能合并单元格,单元格内容前后不能有空格或特殊字符。

[5] 分析样本录入(图3-21、3-22):

Lowpass_v5变量说明

Entity ID:流程分析过程中关联任务和数据的标识ID,您可以填写SN(时空组学)、sample id、样本名称或其他分析所需的真实数据ID,填写后流程产生的任务、结果数据都将关联到此ID下;

SN:样本名称或特殊ID,默认与Entity ID一致;

LIB:BWA DNA制备文库标识符输入,或自定义(例如,SN);

PU:测序平台下级单位名称(run的名称),如slide-id+lane,或自定义(例如,SN);

RefPanel:参考面板仅由“hg38”(GRCh38)组成;

RawFastqs:测序获得的原始数据 (fq.gz) (fq.gz)。PE:一个文件组中有一对 FASTQ 文件(注意FASTQ文件选择顺序, 先选择read1然后选择read2)。SE:一个文件组中有一个 FASTQ 文件;

DoCNVStep:调用 CNV(拷贝数变体);

DoPRSStep:对 PRS(多基因风险评分)分析,仅限人类;

图3-21 Lowpass_v5填写表格模板

LowpassSummaryV5变量说明

Entity ID:流程分析过程中关联任务和数据的标识ID,您可以填写SN(时空组学)、sample id、样本名称或其他分析所需的真实数据ID,填写后流程产生的任务、结果数据都将关联到此ID下;

SN:样本名称或特殊ID,默认与Entity ID一致;

DataDir:输入文件是低通处理染色vcf.gz文件夹(即Lowpass分析的输出文件夹的路径,如在步骤三(3.2.3Lowpass分析)生成的文件夹/Files/ResultData/Workflow/W202407110016);

RefPanel:参考面板仅由“hg38”(GRCh38)组成;

MergeVcf:是否合并样本 vcf;

Depth:测序覆盖的平均深度;

图3-22 LowpassSummaryV5填写表格模板
  1. 配置好表格模板后,回到【数据管理】界面,点击【表格】-【+ 添加表格】(图3-23):
图3-23 步骤四(2):表格导入
  1. 点击【点击上传 / 拖拽到此处】浏览并选择已填好样本信息的表格,点击【确认】(图3-24),上传完成后文件会在目标文件夹中显示:
图3-24 步骤四(3):表格导入
  1. 点击导航栏【流程分析】进入流程分析页面,在搜索框输入 Lowpass_v5 或 LowpassSummaryV5,点击【运行】(图3-25),此处以Lowpass_v5为例:
图3-25 步骤四(4):表格导入
  1. 选择表格数据输入,点击 请选择表格处,选择在本小节3)中导入的表格,选中所需的行,点击【下一步】(图3-26):
图3-26 步骤四(5):表格导入
  1. 在取值处点击并选择对应的值,如RawFastqs选取rawfq1{raw_fq1}rawfq2{raw_fq2},注意rawfq1{raw_fq1}rawfq2{raw_fq2}要按顺序选取(如图3-27):
图3-27 步骤四(6):表格导入
  1. 录入样本信息,完成后点击【下一步】,确保参数设置无误(如图3-28):
图3-28 表格导入模板

3.3.5 步骤五:启动分析

点击【运行】启动分析(图3-29)

图3-29 启动分析

3.4 报告查看及结果文件下载

  1. 点击左侧导航栏【任务管理】进入任务管理页面,在流程名称中选择LowpassSummaryV5,查看任务状态,任务完成后,任务状态显示为完成,代表任务已完成,即可查看报告部分,此时复制任务编号(图3-30):
图3-30 (1)报告查看
  1. 点击导航栏【数据管理】,将任务编号输入任务ID进行搜索,点击文件名称,直接查看文件(图3-31):
图3-31 (2)报告查看
  1. 选中summary_report.en.pdfsummary_report.ch.pdf文件,点击【下载】-【镭速工具下载】(如图3-32):
图3-32 (3)报告下载
  1. 选中全部 文件,点击【批量下载】(如图3-33),随后自行选择存储路径完成下载,若第一次下载,需要安装镭速工具,点击【安装并启动传输客户端】即可:
图3-33 (4)报告下载

4. 第四章 结果展示

4.1 Lowpass样本分析报告展示

图4-1 Lowpass样本报告目录
111.png
图4-2  Lowpass样本报告质简介
图4-3 Lowpass样本报告数据质控结果展示
图4-4 Lowpass样本报告分析结果展示
图4-5 Lowpass样本报告原理和方法展示
图4-6 Lowpass样本报告输出文件说明展示

![](https://alidocs.oss-cn-zhangjiakou.aliyuncs.com/res/54Lq3RYmLb5Vn7Ed/img/efaba93f-73aa-4aee-9897-095f5f16b104.pngopen in new window "图4-7 Lowpass样本报告参考文献说明展示" =498x621)

上次编辑于: