“数据工程”拉动科研信息化应用与创新服务
作者: 发稿时间:2014-11-02

  【原文刊载于《中国科学院信息化工作动态》20148月刊(总第50期)「交流园地」栏目】 

  “数据工程”拉动科研信息化应用与创新服务 

  随着云计算、云存储和灾备系统陆续上线,中国科学院计算机网络信息中心海量存储环境逐步投入使用,数据中心服务能力得到了全面提升。目前,每月新增备份数据50TB,总存储数据量达3PB,数据中心存储服务已成为中国科学院科研信息化应用与发展的基本公共服务。 

  数据中心是以数据资产为核心的信息化基础设施,也是现代科研创新体系的重要组成部分。“十二五”期间,中国科学院计算机网络信息中心承担中科院信息化专项“科技数据资源整合与共享工程”(简称“数据工程”)和国家发改委“基于下一代互联网科研信息基础设施建设和应用示范工程”,面向创新战略和科研信息化深入发展需求,建设全院统一服务的海量存储环境,规划总容量为50PB,并利用云计算技术将数据中心资源与服务整合为“数据云”服务。目前已为40家单位提供数据存储备份,为60多家用户提供云计算应用服务,为来自院内外的6万多数据云注册用户提供数据查询下载。 

  实施数据工程,加强了中国科学院海量存储能力,数据中心不仅向全院提供云存储、云计算等信息化基础设施服务,同时,面向科研与社会需求,还积极推动和支撑了数据应用创新服务。 

  根据院“十二五”信息化发展规划,数据工程的海量存储架构包括北京中关村数据中心、怀柔备份中心和12个布局全国的区域分中心,形成覆盖全院的数据存储网络。其中,分中心可以就近为区域内的存储需求提供服务,总中心和备份中心将为重要数据提供长期的安全保障。通过统一管理和运行,将这些分布式存储设施形成为统一的存储资源池,以云存储、云归档、云灾备等形式提升数据中心公共服务。云存储提供按需使用、弹性扩展的存储空间,云归档提供数据长期保存服务,云灾备提供较高等级的数据容灾备份,保障业务连续性。目前,中国科学院科学数据库、ARP系统、网站群等运行数据,天文、空间、遥感、高能物理等大科学装置的数据,中国科学院档案馆数字化资料,以及来自科研院所和课题组的重要数据等都已开通或开始使用数据中心存储备份服务。 

  “数据工程”围绕海量存储、云计算、数据云等关键技术,目前已申请相关专利10余项、取得软件著作权12项,基本实现了存储、处理与应用等资源整合服务的“数据云”一站式服务。近年来,中国科学院计算机网络信息中心结合科研实际需求,开发建立了生物信息学分子数据分析环境、大气科学数据分析环境、地理空间数据云等服务,将数据下载处理升级为让用户按需选择数据源、选择处理模型的云服务模式。通过研发部署云计算系统,“数据工程”已为中国科学院信息化专项、先导专项、重点基金、科技支撑计划等20多个重点项目提供了应用支持,推动了数据应用的创新服务。 

  此外,“数据工程”发挥中国科学院信息化自身优势,面向科研与社会需求,积极参与云服务产业发展。近年来,中国科学院计算机网络信息中心已经与国内三十多家企事业单位成功开展了技术合作与服务,与东莞市人民政府、南京江宁经济技术开发区管委会、长春高新技术产业开发区管理委员会等单位达成战略合作,共同营建数据云中心,2012年获得中国产学研创新合作奖。以中国科学院信息化建设重要成果为依托,面向大数据时代公共领域如交通管理、食品安全、新材料研发等挑战,2013年获批成立大数据应用服务技术北京工程实验室,启航大数据创新事业。随着“数据工程”异地多中心特色的高等级灾备环境竣工使用,中国科学院计算机网络信息中心2014年成功竞标北京市地方税务局容灾服务项目,以及在南京组织“凌云计划”服务,在东莞成立“云灾备宏达实验基地”,在服务科研的同时,积极开展面向电子政务、中小企业需求的创新服务。 

(中国科学院计算机网络信息中心科学数据中心  供稿)
附件下载