以组学数据为代表的生命科学数据呈指数增长.与高能物理、气象、地质、地理和环境科学等其他数据密集型学科一样,现代生命科学已经进入了高度信息化的时代——第四范式时代.国家跨组学信息工程大设施(China Information Engineering Infrastructure for Pan.OmicsStudies,C1EIPOS)已经成为推动中国生命科学进一步发展、并使海量数据转化成知识与应用的必不可少的国家生命科学基础设施.本文介绍国内外生物数据收集、管理与利用的现状,提出建设CIEIPOS生物信息“集散地”的重要性与迫切性,阐述实现数据整合、搜索与可视化的挑战与可能方案.CIEIPOS的另外一个重要功能是支持对组学数据的管理、分析、挖掘与利用,这使得CIEIPOS不同于传统的国际生物信息中心,如美国国家生物信息技术中心(National Center for Biotechnology Information)-9欧洲生物信息学研究所(European Bioinformatics Institute).本文以质谱平台产出的高通量蛋白质组数据为例,说明组学数据分析的复杂性.通过对跨组学数据在不同时空的模拟分析,进一步说明CIEIPOS的实际应用对计算机硬件与网络的要求.
展开▼