基因组Denovo
不依赖于任何参考序列信息就可对某个物种进行全基因组测序和拼接组装,并对组装得到的基因组序列进行组分和功能注释,构建该物种的全基因组序列图谱与基因组数据库,为后续基因挖掘、功能验证提供更完善的基因组序列信息。
基因组Survey(二代测序)
基于小片段文库的二代测序数据,通过K-mer分析,有效评估基因组大小、GC含量、杂合度高低及重复序列含量等信息,为后续的组装策略的制定提供理论依据。
基因组Denovo(三代测序)
对基因组序列未知的物种进行全基因组水平的深度测序,然后用生物信息学方法进行组装和注释,从而获得该物种完整的基因组图谱,有助于研究该物种起源进化及特定环境适应性。
泛基因组(三代测序)
是指一个生物分支(如一个物种)的全部基因组信息,由所有个体共享的核心基因组和部分个体共享或个体特异性的非必需基因组成。通过构建泛基因组,可以将每个物种中的代表性个体的特异基因组序列包括到泛基因组中,获得物种更全面的遗传信息。
T2T基因组(三代测序)
T2T基因组中的T即端粒(Telomere),是真核生物线性染色体的末端部分,完美基因组(T2T)追求基因组组装从染色体的一端到另外一端,准确、完整识别每一个碱基,无错误还原基因的原始序列信息。通过三代测序/Hic等多种技术手段结合实现一条或多条染色体端粒到端粒水平组装的0 gap基因组,解决高复杂高重复区域的组装难题,最终得到高准确性、高连续性、高完整性的端粒到端粒的完整基因组。
单倍型基因组(三代测序)
单倍型(Haplotype)是是指共存于单条染色体上的一系列遗传变异位点的组合。常用的基因组组装方法往往忽略了同源染色体之间的差异,将杂合区域整合,得到的基因组混杂了来自双亲同源染色体等位基因的嵌合序列。以PacBio HiFi数据为核心进行单倍型基因组研究。分析内容主要涵盖单倍型基因组组装、Hi-C辅助单倍型基因组组装和单倍型基因组注释,是研究结构、功能、变异与进化的较理想方式。
单倍型T2T基因组(三代测序)
单倍型T2T基因组,结合T2T基因组的最新组装策略,并通过单倍型基因组组装区分来自双亲的染色体,获得分别来自父本、母本的完整遗传信息,构建更加完整的基因组,进而研究双亲单倍型之间的差异、等位基因变异、追踪个体亲缘关系、探究杂种优势等。
超大基因组(三代测序)
大型基因组(5 Gb≤ Genome Size<10 Gb)和超大型基因组(Genome Size≥10 Gb) 在进化期间往往伴随着多倍体化或全基因组复制等事件的发生,造成其基因组存在大量的重复序列,使得大型基因组在组装时会存在组装连续性低、重复序列难以跨越、组装资源消耗大和组装周期长等难题。随着长读长测序技术的发展和组装算法的优化升级,现阶段已可以对大型基因组物种进行全基因组测序和拼接组装,获得该物种完整的基因组图谱,为后续该物种的研究奠定基础。
应用方向
- 全面基因组信息挖掘:更完善的参考基因组,可以校正之前基因组组装的错误,发现新的基因序列,鉴定新的功能基因和遗传变异信息,也可以鉴定出更多此前未被成功组装的重复序列、着丝粒和端粒等;
- 物种进化和起源分析:解开物种的遗传密码,探寻物种祖先种及其遗传多样性为提高物种进化潜力和适应能力提供了新的可能性;
- 作物育种与改良:帮助种质资源的遗传多样性和遗传价值评估,了解物种间的遗传差异和关系,作为其他组学的研究基础为遗传改良提供最完善的参考信息;
案例解析

32份黍稷种质资源的泛基因集分析
黍稷图形泛基因组揭示驯化相关的基因组变异
中国农业科学院作物科学研究所刁现民团队联合陈金锋团队在《Nature Genetics》发表论文“Pangenome analysis reveals genomic variations associated with domestication traits in broomcorn millet”。该研究首次揭示了世界范围内516种黍稷种质资源的遗传变异多样性及起源和传播的演化史。利用PacBio HiFi测序对黍稷24份栽培材料和8份野生材料的基因组进行从头组装,得到了32个黍稷染色体水平的高质量参考基因组,基因组Contigs N50长度平均为12.95Mb,BUSCO完整性平均为95.97%。该研究发现了与驯化和农艺性状相关的关键位点和基因。为开展黍稷基因组辅助育种提供了基础资源。AG旗舰厅基因为该研究提供了基于PacBio平台的三代建库测序服务。
参考文献:Jinfeng Chen , Yang Liu, et al. Pangenome analysis reveals genomic variations associated with domestication traits in broomcorn millet[J]. Nature Genetics, 2023, 55(12):2243-2254.