蔬菜所发布染色体水平冬瓜参考基因组
近日,蔬菜所华南蔬菜组学数据挖掘团队在Scientific Data(中科院二区,IF=8.501)发表了题为“A chromosome-level reference genome of the wax gourd (Benincasa hispida)”的研究论文。蔬菜所罗文龙副研究员和闫晋强副研究员为论文的共同第一作者,江彪研究员为通讯作者。
蔬菜所2019年对黑皮大冬瓜B227进行基因组测序,发布了首个冬瓜参考基因组。然而由于技术限制,B227基因组的完整性和连续性较差,存在大量缺口(gap),加上冬瓜育种长期定向选择所导致的狭窄遗传基础,制约了冬瓜基因组学研究和遗传改良。为了获得更高质量的冬瓜参考基因组,研究团队以粉皮小冬瓜pf3为对象,首先利用PacBio和Illumina测序数据,通过混合组装(Hybrid assembly)策略组装产生高质量的重叠群(unitigs),进而利用Hi-C数据挂载构建了染色体水平基因组。混合组装产生的重叠群全长974.87 Mb,N50达到2.43 Mb;Hi-C挂载产生的scaffolds全长975.62 Mb,其中94.92%的序列(926.05 Mb)位于最大的12个scaffolds,对应于冬瓜的12条染色体。通过将pf3基因组与2019年发布的B227基因组进行比较,发现整体共线性较高,但两者之间存在大量Mb级别的大片段倒置和缺失,且多位于染色体末端;进一步利用Hi-C数据,验证这些大片段差异是由于B227的组装错误而非真实差异所致。高质量基因组的绘制为冬瓜基因组学研究和分子育种改良提供了一个更加准确可靠的参考,对加快冬瓜的基础研究和品种选育具有重要意义。
本研究得到了国家自然科学基金、广东省农业科学院学科团队建设项目等项目资助。
pf3组装的Hi-C热图及基因组特征Circos图