历时5年建设,9月22日,中国首个国家基因库宣布正式对外运营。
这是继美国、日本和欧盟之后,全球第四个建成的国家级基因库,也是目前为止世界最大的基因库。
国家基因库将以生物资源为依托,形成资源到科研到产业的全贯穿、全覆盖模式,应用方向包括人类健康、新型农业、物种多样性及生态环境保护等。
未来,国家基因库还将依照相关规则开放样本、数据资源,成为一个公共服务平台,在基因测序和基因育种等方面发挥重要作用。
位于观音山脚下的国家基因库
国家基因库是目前全球最大的基因库
国家基因库位于深圳市大鹏新区观音山脚下,占地面积超过5万平方米,建筑总面积11.6万平方米,其中一期面积为4.75万平方米。
2011年,该基因库由国家发展改革委、财政部、工业和信息化部、国家卫生和计划生育委员会联合批复,并由华大基因最终负责承建运营。
深圳国家基因库主任、华大农业集团董事长兼总裁梅永红曾对媒体表示,国家基因库选址深圳主要考虑三个因素:
一是方便利用临近的LNG(液化天然气)码头气化过程中产生的大量冷能,用于冷却样品,节能环保;
二是国家基因库的主体建筑是倚山体的自然坡度建设的,每一层都相当于是第一层,都有山体结构的支撑,稳固性好,可摆放大型设备;
三是深圳正在全力推进“东进战略”,将在深圳东部的大鹏半岛规划建设国际生物谷,并将其打造成为国际领先的生物科技创新中心,国家基因库是大鹏新区的重要产业基础设施,有助于生物产业提升创新能力。
官网资料显示,深圳国家基因库初步建成“三库两平台”的结构业务和功能,“三库”由生物资源样本库、生物信息数据库和生物活体库组成,“两平台”为数字化平台、合成与编辑平台。
国家基因库搭建起基因资源挖掘的基础性支撑及公共服务平台,以具备对海量生物资源的存、读、懂、写、用能力为基础,构建起检测、管理、认证、基础应用体系,促进基因组学在精准健康、精准农业、海洋开发、微生物应用等方面的前沿探索与产业转化,催生新技术、新产品和新模式。
深圳国家基因库是继NCBI(美国国立生物技术信息中心)、EMBL-EBI(欧洲生物信息研究所)、DDBJ(日本DNA数据库)全球三大国家级基因库后的第四个国家级基因库,但它与另外三个数据库有着自己独特的地方。
国家基因库执行主任、华大基因研究院院长徐讯在接受央视新闻采访时称,与其他三大国家数据库以保存数据为主要功能不同的是,深圳国家数据库不仅有数字化平台积累别人产生的数据,还可以保存样品等,是一个综合的数据库。
深圳国家数据库不仅源源不断地产生数据,而且更加注重对于数据的研发、利用,用于产业发展。未来,国家基因库还将依照相关规则开放样本、数据资源,成为一个公共服务平台。
同时,深圳国家基因库还与NCBI(美国国立生物技术信息中心)、EMBL-EBI(欧洲生物信息研究所)、DDBJ(日本DNA数据库)国际知名的数据库、样本库开展数据交换与资源共享共享,与末日种子库、德国海德堡大学、美国史密斯森尼学会等形成全球联盟体系。
技术人员在进行研究工作
基因技术与人类生活息息相关
在人类资源方面,基因库主要保存血液样本、组织样本、细胞系、细胞和尿液等,将为重大疾病的前瞻性研究提供样本资源支撑,为疾病诊断与预测及个性化医疗等奠定基础。
在动物资源方面,基因库主要保存珍稀动物及具有重要经济价值的动物组织、细胞等。
此外,国家基因库除了存储人类资源、动物资源以外,还存储植物资源、海洋资源和微生物资源。这些都可以为日后的研究工作收集大量的信息。国家基因库一年有5PB的数据量,相当于是1000万个孕妇产前诊断的数据。
如今,国家基因库已实现对基因信息数据总量达65PB的访问支持。在9月22日正式营业前,国家基因库已实现对基因信息数据60PB的访问支持,正式运营当天有5PB的数据正式对外发布,提供数据检索和查询功能。
澎湃新闻也注意到,国际基因库的官网在9月22日当天也已焕然一新,首页就是数据库检所查询的页面。
如果以一部电影500MB计算,65PB(1TB=1024GB,1PB=1024TB)相当于1.28亿部电影,一个人一天看一部电影需要38万年才能看完。
徐讯称,基因技术看似高大上,大家以为会很少和自己有关,但大家在日常生活中已经无形中接触到了很多基因技术。
比如,罕见病诊断治疗方面,可以从基因数据上实现集中管理和追本溯源。比如国家正在肠道的精准医疗就是建立在对人和跟人相关的外源性生物物种认知的基础上,要通过基因测序来了解遗传规律、医学范式,这时能否拥有更多基因资源、能否掌握更多遗传规律就非常关键,未来精准医学的发展和竞争某种程度上取决于具有的基因资源以及认知基因资源的能力。
再比如,中国现在的出生缺陷发生率大概为5.6%,怎么预防出生缺陷就是一个很大的问题,所以做产前检测、孕前监测也都是通过基因的方法来排除的。
同时,最近网上炒得比较火的基因编辑,如果没有“读懂”基因,那么基因编辑技术也就没办法进一步发展,而“读懂”的前提就是要有一个强大的基因库。
此外,在农业育种方面,基因库也大有作为。比如,袁隆平的超级水稻就是选择合适的基因组进行的组合。
徐讯曾对媒体表示,期待1期建成后,综合能力世界第一,包括可访问数据量和数据存储能力是世界第一,可访问样本量和样本存储能力也是世界第一。
对于拥有国家基因库的重要性,梅永红曾对南方日报称,在农业时代,一个国家拥有的耕地越多优势越大;在工业时代,拥有的石油、矿产等能源越多优势越大;而在生命时代,拥有更多的基因资源同时能对基因资源进行认知和利用,则意味着更大的优势。
梅永红称:“希望搭建起基因资源挖掘的基础性支撑平台,形成‘生命密码’的存、读、懂、写、用能力于一体,聚焦生物医药、生物农业、微生物和海洋生物等领域,极大地缩短基础科研到科技成果转化应用周期。”
梅永红说,国家基因库不仅要获得更多基因资源,对基因资源进行数字化、研发利用,还要与国内外机构开展合作,是一个浩大的系统工程。
据了解,国家基因库已与国外多个国家级自然历史博物馆、挪威世界末日种子库等机构建立合作,正式运营以后,也将与国际DNA数据库三方组织一样开放数据共享平台。
公共性与商业性是否冲突?
不过,针对公共性和商业性的问题,一位业内人士告诉澎湃新闻,基因库相对来说是偏公共性的事。目前国外的前三家国家级的基因库以及生物样本库都是由政府成立相关机构来独立运营的,而深圳基因库是由具有商业性质的企业运营。
该人士还称,其实中国对于基因库和生物样本的保存很早就有所重视,而且国内很多家科研院所和相关机构也已有了相当多关于基因的数据,而这些机构中很多并不愿意将数据提供给基因库。同时,国家基因库将以怎样的模式运营目前还不并不是很清楚。