友情链接

成立声明

 


        2011年2月,美国国家生物技术信息中心(National Center for Biotechnology Information, NCBI)主要收集检索第二代测序数据(包括454,Solexa,SOLiD和Helicos等测序仪)的仓储式序列数据管理系统(Sequence Reads Archive, SRA)在其首页发表声明称:由于缺少财政预算,NCBI计划不再继续保留SRA系统,不同类型的数据将会按一定的时间表逐步停止接收,第一批停止接收数据的类型在几个星期内开始执行,全部数据都将在未来的12个月内停止接收。消息发布之后,世界各地的多个组织和机构都纷纷表示愿意继续SRA系统的数据管理和接收工作。


        鉴于二代测序数据积累速度之快、影响面之广、情况之紧急,中国科学院北京基因组研究所和中国科学院计算机网络信息中心共同筹建了联合生物信息中心(Center for Biological Information at Chinese Academy of Sciences, CAS-CBI)。该中心将建立中国的SRA型二代测序数据仓储式管理系统,以满足国内生物学家对第二代测序数据的获取、存储、检索、分析和共享需求。目的是以基因组学、生物信息学研究为重点,面向国家战略需求和世界科学前沿,着眼重大基础科学问题,坚持科学发现的原创性、以规模化高通量的数据产出和处理为出发点,运用生物信息学手段和方法,建立和维护具有我国自己原创性工作的仓储式二代测序数据集成管理系统,系统研究基因组生物学各个分子层面的概念和信息,实现"数据-信息-知识"的有效获取、转化和利用。目前的工作主要包括:

  1. 建立与SRA相同的系统设计模型和代码库;
  2. 加入国际核酸序列数据库联盟(International Nucleotide Sequence Database Collaboration, INSDC),获得支持;
  3. 提供二代测序数据的集中仓储服务,采用归一化的数据结构管理数据,提供集成检索功能;
  4. 提供灵活的面向所有主流二代测序数据格式的提交方式,提供同其他参考数据资源的连接,建立用户互动的提交和检索模式。

        随着高通量DNA测序技术的不断发展和超级计算能力的持续提高,基因组科学正在以前所未有的速度产生着难以计数的基因组数据和生物学信息。联合生物信息中心的成立将积累大量我国自主知识产权的二代测序数据,发展大量生物信息分析技术和方法,为我国生命科学研究、生物技术和生物医药产业提供大量宝贵的原始资源,以及更为全面的技术支持和保障。



中国科学院北京基因组研究所
中国科学院计算机网络信息中心

2011年5月24日