目前,中科院计算机网络信息中心承担建设和运行的中科院数据资源中心海量存储环境整体框架已经形成,由在线盘阵、近线盘阵和近线磁带库三级存储构成,是服务科研活动的海量存储基础设施。根据中科院“十一五”信息化规划并通过“数据应用环境建设与服务”重大专项,在“十一五”期间建成6PB的海量存储环境,并具有高扩展性,为全院重要数据资产存储、备份和长期保存提供服务。
现已建成总存储容量2.3PB,包括高端盘阵、中低端盘阵和磁带库设备容量分别达到180TB、711TB、1.6PB,服务器处理节点110个,总内存达到2.4TB,院内连接总带宽2Gb/s,并通过分级存储管理系统实现了对存储环境的整体管理和数据自动迁移。同时边建设、边服务,数据资源中心2009下半年起已针对中科院重大科研项目、信息化建设以及研究所等相关需求,开展了数据存储服务。
目前中科院数据资源中心的海量存储环境已经与中科院科研网络环境、超级计算环境实现优化联通,面向全院提供基于IPv4和IPv6的海量数据传输和存储服务。
(1)在线存储服务:针对重要的数据资源和重大科研项目提供直接存储空间,用户不需要自建存储环境或寻找其他存储方案。例如国家天文台某研究员开展的宇宙演算项目,申请存储空间30TB,计算数据将直接从超算环境传到数据中心存储。
(2)异地备份服务:针对重要数据资源提供用户在本地外的异地存储,实现数据容灾备份。院网站群项目/ARP项目均规划了在科学数据中心异地备份方案,定期进行不同安全级别的异地备份存储,目前已使用8TB。
(3)长期保存服务:对重要数据资源在科学数据中心做长期的保管,本地不再保留副本,以便释放本地的有效存储空间。例如中科院对地观测中心根据需要已陆续将部分数据迁移到科学数据中心,已使用6.6TB容量。
(4)数据库应用托管和镜像服务:为保障稳定、宽带的网络连接,同时减少在存储、服务器等设施的投入和运维,在科学数据中心申请存储和服务器资源直接部署数据库应用系统,或建立镜像服务系统。目前,中国科大、贵阳地化所、国家纳米科学中心等单位建设的专业数据库部署运行在科学数据中心,国家天文台SDSS镜像数据库在科学数据中心同步备份。
(5)业务系统托管:针对部署在科学数据中心的业务系统进行全面的运维支撑,提供专属的业务运行环境,保障业务系统的稳定服务。目前科学出版集团的科学院期刊编辑管理系统已迁移到科学数据中心并上线稳定运行。
(6)网络中转存储,针对用户大量数据交换的需求,科学数据中心提供相应的存储空间,供用户自行传输、管理和分发数据,起到数据传递、中转作用,也可以满足一般用户管理自己个人科学数据的需求。目前为昆明动物所、大化所等单位的有关用户开通了存储账号。

图:中科院科学数据中心海量数据存储设施