软件目录(www.cnosoft.com)5月20日讯:“他们为什么要把资料交给你?”马俊才是中国科学院微生物科学数据中心的负责人。
“数据中心不是资料库,我们又不是政府官员,必须为他们提供必要的服务。”
中国微生物科学数据中心的前身是中国科学院微生物科学数据中心,其前身是30多年前建立的微生物科学数据库。
近几年,数据库的更新和升级都在持续进行。“变”这个词,大概就是微生物研究所马俊才这几年的感受了:数据平台变了,数据来源变了,工作内容变了,但一切都变了。
在“变”中提升
数据和物质资源共存,这也是我国微生物科研数据中心不同于其他数据库的一大特色。“微生物是需要实际操作的,大部分的数据都是有相应的微生物资源的。”马俊才说道。
80年代,我国的信息化建设才刚刚起步。一九八七年,微生物所顺应时代的呼唤,成立了一个微生物科学资料库。
经过35年的发展,这个资料库得到了政府的大力扶持,芝麻“节节高”。
1994年,建立了中国代表性培养物保藏委员会信息中心,完成了全国范围内所有生物资源的收集工作。
2010年,世界微生物信息中心(WDCM)在全球众多机构的激烈角逐中落户了。在此基础上,建立了一套由国家实验室主导的国内外科研项目及数据管理规范,在世界范围内“领跑”。
国家微生物科学数据中心在20个国家级科研数据中心中启动,由微生物所主导,职能发生了重大变化。
“从原来的科研资料分享平台,到现在的国家权威资料管理与发行平台;把自己的资料管理转换为国家整体范围内的科研项目资料的汇总;从过去的数据共享,到现在的管理、挖掘和应用,”马俊才是这个数据库发展的见证者。
转型既是机遇,又是挑战。
马俊才说,国家微生物数据中心肩负着两个主要任务:建立微生物数据的整合、分析、应用和安全保护系统;建立一个自主、安全、易用、有国际影响的生态系统。
想要变得更强,就必须变得更强。为了达到这个目的,我们一直在探索新的发展方式。
为了吸引中国的用户主动提供数据,中心率先采用了一种与国际数据汇交系统相适应的全程数据提交方式,它的数据编号可以直接用于国际期刊,支持中国科学家的论文的存储和共享,为我国科学家的科学数据提供了便利。
在专业技术人员的培养上,为解决人员编制、经费不足等问题,建立了一套较现有员工工资更高的人员派遣机制,确保了队伍的稳定,并增加了人员的输送能力。
数据中心不仅是一个独立的数据中心,在过去十年间,已建立包括6个中心、应用微生物联盟、病原大数据联合中心、食品安全大数据联合中心等多个合作联盟在内的数据资源体系架构,在数据管理、应用与挖掘方面不断向更深、更实迈进。
比“有用”更多
2020年2月20号,在新冠爆发初期,齐建勋将一系列有关新冠病毒 S蛋白和ACE2受体复合体的高分辨率晶体结构的资料递交给了美国微生物研究所。仅仅半天的功夫,这份资料就上线了,下载量就突破了一万。
而齐建勋于二月十九日向 PDB国际生物资料库提交的资料,则是在一个月之后。
“在这种情况下,我们必须做出最快的反应。要是再迟一天,恐怕就会被其他国家抢走了。”吴林寰是国家微生物科学数据中心的副主任,他说,这个中心通常会在一到三个工作天内完成审核和编号。
“最近五年,我们国家进行了一次重大的改革,所有的研究课题,都要将数据提交到国家的数据中心。马俊才表示,资料中心要超出档案管理这个最基础的“有用之用”。
据了解,国家微生物数据中心除了提供“基础”的数据管理、数据汇流和集成外,还提供数据调用、下载和分析等功能;“增值”的服务,如报表输出。从2020年至2021年,中心已提交302项国家科技计划项目,涵盖合成生物学、食品安全关键技术研发、公共安全风险防范等19个方面,已收集到的菌种数量逾3.9万份,实物标本数量达5.8万份。
在国家急需的情况下,这个平台更加迅速。
新年三十号,是2020年的元旦。当日,全国微生物研究所建立了新型冠状病毒的国家科技资源库,向全世界公布了第一张新型冠状病毒的电子显微镜图像和毒株的资料。目前,中国在全球177个国家、地区拥有240783个用户,数据访问和检索超过1千万人次,为开展国际合作、实现全球数据共享开辟了“一扇窗”。
在抗疫“火线”方面,中心曾多次将北京新发地疫情、基因变异等情况上报给有关部门,并作为全国有关疫情报告的重要内容;建立的新型冠状病毒的虚拟突变库,通过人工智能技术对潜在的遗传变异进行预测,为进一步的疾病传播机制和途径、疫苗和药物的辅助预测奠定了基础;建立了一个关键病毒的虚拟突变库,一个以人工智能为基础的风险预警系统,可以实时更新世界各地的病毒、病毒、病毒等信息,并对全世界的使用者开放,这些都是我国“十三五”科技创新成果之一,而国家微生物研究中心,也因此荣获了科技部抗击新冠肺炎疫情先进集体的表彰。
据了解,目前,该中心汇集了大量优质的资料,包括中科院42个研究所76个馆藏单位843万馆藏实物资源的数据,来自国家科技计划以及期刊、测序公司等不同领域的数万份微生物数据和实物资源,以及来自51个国家143个图书馆的520,000种微生物资源。
为“盘点”我国乃至世界范围内的微生物和基因“家底”提供了基础。
因此,“增值”的服务向海外扩展。该机构集合十余个国内有关领域的专家,共同制订了世界上首个标准化组织(ISO)微生物资源数据标准。同时,也促进了国内微生物工业 ISO标准用菌种的“零的突破”,使得44个菌种全部转化为 ISO标准菌种,从而保证了国内生物工业的发展。
由中心领导的全球上万种微生物模型序列测定项目,目前已经有25个来自16个国家的微生物保存组织参加。据了解,目前全球已公布的模式细菌共有17800个,而已完成排序的只有8000个。“这次的一万个品种的序列分析,无疑会为我们提供一个国际上亟需的鉴定平台,为所有的微生物研究和发展奠定了坚实的基础。”Ipek Kurtboke是世界微生物保藏联盟的会长,以及日本 DNA资料库的前任负责人 Hideaki Sugawara这样评价。
“虹吸效应”在全国微生物科学数据中心得到了突出体现,其中91.5%的全球微生物实物资源是由国际合作机构提供的。这与马俊才和他的团队一直以来都在为客户提供“个人化”的理念密不可分,比如,他们向各国际数据提交机构提供关于全球微生物资源的数据的分析,并对它们在世界范围内做出的贡献进行汇总,以引起有关国家的注意和认同;同时,还举办了学术研讨会和国际培训班,为今后的国际合作打下了良好的基础。
他的努力没有白费。这些工作使得这个数据中心的全球微生物资源共享平台被列入了去年乌镇世界互联网会议的第一批12个“共同建设网络空间命运共同体精品案例”。马俊才是国际微生物资料标准联合工作组主席,联合国教科文组织公开科学顾问委员会成员,吴林寰荣获国际科学委员会数据管理世界大奖。
重新谱写新的篇章
“微生物有自己的知识。”微生物研究所的主任钱韦表示,自从人类首次发现噬菌体X174的基因组序列,在过去的半个多世纪里,微生物组的研究资料出现了爆炸性的发展。同时,分析微生物多样性和多样性的多样性,也需要大数据的支持。
钱韦相信,大数据的推动,将会推动科技模式的变革,未来的研究,将不会局限于以前的科学家可以利用的微生物资源,也不会像以前那样,在实验室中进行大规模的实验,而是要将世界范围内的微生物资料,与人工智能进行融合;更前沿的新的科研。
“例如,防范病毒的天然变异,筛选出必要的人为变异,根据大数据,进行针对性的、具有针对性的、具有前瞻性的、具有前瞻性的、面向世界的前沿研究。”
目前,微生物所在全国微生物科学数据中心的支持下,在全行业开展了相关的合作和研究。建立了与疾病控制中心合作的病原微生物数据库,对病原体数据进行了全面的集成和深入的挖掘;通过与国家有关部门的协作,构建了我国食源性致病微生物全基因组测序数据库,并将国内31个省市60个品种的60种样品进行了序列分析,无缝对接到了各个溯源网络体系;为了保障国内的生物安全,与国家霉菌学重点实验室合作,设立了检疫性真菌参考物质和标准库,并截获了6个新的病原真菌,这是在我国实行口岸检疫83年以来第一次发现的真菌新物种。
“中国微生物科学数据中心”和“中国科学院微生物科学数据中心”系统的建成,使我国微生物技术的发展达到了一个新的高度。新起点也有了新的任务,我们下一步的任务就是从数据整合到知识开发。”马俊才表示,他和他的同事们期望把这个中心建设成为国内一流的科研支撑中心、服务中心和数据中心。