公司动态您现在的位置:主页 > 杏彩新闻 > 公司动态 >

助力中国农业科研界完成“3010份亚洲栽

  “3010份亚洲栽培稻基因组变异研究”课题团队里的中国核心成员。照片由受访团队提供

  150T,这是一个超越一般人认知范围的庞大数字,这是目前全球植物界最大量的一组研究数据。深圳强大的“IT+BT”融合创新能力,助力中国农业科研界完成“3010份亚洲栽培稻基因组变异研究”,并于今年4月26日(北京时间)登上国际顶级学术期刊《自然》。

  这个“由中国科学家主导的,世界范围内的一次大规模、高水平合作”所诞生的论文共有72位全部作者,其中7位通讯作者和12位共同第一作者,在国际顶级学术期刊上可以说史无前例。而更史无前例的是在《自然》上首次出现两个汉字“籼”“粳”和它们的拼音“Xian”“Keng”,让源远流长的中华水稻文化,在国际上得到更广的推广。

  2004年,随着宝安、龙岗两区“城市化”,深圳决定以科技为引擎,转型发展现代农业生物育种产业。

  2010年,科技部批复深圳国家农业科技园区,市政府与中国农科院签署合作共建深圳现代农业生物育种创新示范区框架协议,陆续引进优秀人才团队。2011年,大鹏新区成立。同年,中国农科院与深圳华大基因研究院共创的中国农科院生物育种创新研究院也成立了,中国农科院农作物基因资源与基因改良国家重大科学工程首席科学家黎志康任副院长。

  一同起步的还有黎志康牵头的“绿色超级稻项目”之“全球3000份水稻核心种质资源重测序计划”,由中国农科院、国际水稻研究所和华大基因,共同拉开水稻核心种质资源的基因组重测序和大数据分析。2014年“世界饥饿日”这天,3000份水稻基因组测序原始数据公开发布,并实现全球共享。

  据了解,实际样本量是3010份,这些水稻来自全球80多个国家地区。为了完成如此庞大的测序量,华大基因几乎将所有测序仪投入其中。随后研究计算部分,由阮珏带领这个年轻团队对这3010份水稻,进行基因组组装及结构变异检测,“占用”1000个CPU核心,纯计算时间就长达5个月,存储量就达150T。

  深圳的科技优势在这里得到充分体现,阮珏团队参与研发的基因组装技术SOAPdenovo和结构检测变异技术novoBreak,起到了“加速器”的作用,“如果没有采用前者,那么整个计算部分的时间将至少翻两番。”阮珏说,后者原是应用于癌症领域的人类体细胞突变检测技术,经过修改,应用在水稻上,增加了对水稻基因结构变异检测的灵敏度。

  科研人员们通过对3010份亚洲栽培稻进行测序、计算和分析,得出巨大的数据库;已建成SNP数据库、泛基因组数据库,正在建立水稻功能等位基因的数据库,并将最终建立一个更加综合的数据平台。

  水稻因种植地区气候等条件的不同,外观表现和食味也有明显的差异,主要分为籼稻和粳稻两个亚种,这种分类命名方式在中国已有2000年以上历史。但目前国际上通用命名源自于日本学者,1928年,该学者通过杂交等手段证明两者的不同,并将籼稻称为“印度型”(Indica),将粳稻称为“日本型”(Japonica)。

  我国科学家一直坚持为“籼稻”和“粳稻”正名。上世纪50年代,第一任中国农业科学院院长丁颖,就系统地提出“Xian”和“Keng”命名法。在对3010份水稻样本进行基因组研究后,科研人员发现,亚洲栽培稻应该至少分为9大类,而不是原来的5类。科研人员建议今后发表论文中有涉及的,应该用“籼(Xian)”和“粳(Keng)”这两个中性名词。“这个建议最终得以保留经历了数次波折。”

  该论文共同第一作者、黎志康的博士生吴志超透露。黎志康第一次提出该想法,是在2015年陕西杨凌举行的“全国植物基因组大会”期间,黎志康和学生们讨论问题之余,突然说“我打算在‘3K’的文章里面使用‘Xian’和‘Keng’,替代‘Indica’和‘Japonica’ ……”黎志康表示,这可能是中国科研人员的最后一次机会,也是最有力的机会。凭借这篇影响力足够大的文章,才能推动后来者效仿。

  吴志超还表示,起初国际水稻所的外国科研人员并不同意这个提法,黎志康与他们就此争辩了40多分钟,最终硬着头皮说这事没得商量,必须用这个名字。

  在预览版本时,《自然》编辑反馈说他们的系统不支持象形文字,而汉字就是象形文字,所以预览版本把“籼”和“粳”两个字删掉了。科研人员们发邮件反馈,希望编辑尝试用图片形式保留这两个汉字。但是《自然》编辑并没有回复同意保留还是不同意。北京时间4月26日凌晨1点多,“籼”和“粳”两个汉字,最终以图片形式出现在《自然》杂志的这篇论文中。

  成立短短4年,深圳基因组所的发展也体现出“深圳速度”,已引进基因组研究人才200余。

 

分享到:
相关文章