其他>
广东省物质科学数据中心
广东省物质科学数据中心
广东省物质科学数据中心是广东省科学技术厅于2024年1月正式认证的省级科学数据基础设施,其前身为 “国家高能物理科学数据中心大湾区分中心”,现纳入广东省科学数据中心体系统一管理。


定位与功能
广东省科技厅通过专项经费支持数据中心建设运营,同时履行监管职责,推动其聚焦物质科学数据存储、数据管理、数据加工及开放共享服务,构建适配省内物质科学研究与产业升级的科学数据治理体系,是广东省夯实科学数据基础、驱动科技创新与产业融合的核心枢纽之一。
主要功能包括:
(1)为粤港澳大湾区的物质科学相关的大科学装置及科学研究提供直接的数据服务,承担数据汇交、数据存储、数据分级分类、数据共享等数据全生命周期的管理工作,形成 “汇交-分类-存储-管理-共享” 的闭环服务体系。
(2)推动科学数据服务本地化落地与数据产品交易市场化发展,通过数据要素流通带动工业制造、药物研发等产业转型升级,全面提升数据服务效能并释放数据对产业的赋能价值。
(3)推动物质科学数据资源开放共享与科普传播,助力公众直观理解前沿科研成果,提升全民对物质科学领域的认知度与探索热情。
科学数据治理体系与基础设施
广东省物质科学数据中心构建的物质科学数据治理体系以全生命周期闭环为架构、元数据与标准规范为基石、FAIR 原则与 AI 赋能为引擎,形成了 “产生-管理-挖掘-服务” 的科学数据治理范式。此治理范式为物质科学领域的跨学科研究与产业转化提供了系统性数据支撑。
(1)数据生产层通过模拟计算和大科学装置实验生成含元数据的原始数据,这些数据是省数据中心构建数据资源库的核心源头。
(2)管理域以元数据标准、数据格式规范及共享策略对数据规范化组织,此环节保障数据的标准合规及高可用性。
(3)智能体层遵循FAIR原则,经数据加工、分析、融合、对齐形成高质量科学数据集,此为数据中心提升数据价值的关键环节,将原始数据转化为可复用的数据产品。
(4)服务层通过 API访问、直接访问、数据传输等接口开放数据,最终为物质科学跨学科研究与产业转化提供系统性数据支撑,实现数据中心激活数据要素,赋能产业升级的目的。

中心采用“一平台多中心”的架构管理2个位于不同地域的数据中心机房,通过技术手段将位于不同地理位置的数据中心资源互联互通,在逻辑上形成统一的数据服务平台。目前中心拥有700个计算节点,2.5万CPU核,80张Nvidia V100 GPU卡的计算资源,以及7PB的数据存储能力,可实现科学数据及数据产品的长期保存、用户的透明访问及在线分析。
服务内容与用户群体
服务内容
1.数据存储与管理:提供分级存储系统并配套全流程规范管理系统,为物质科学实验数据提供长期可靠安全的存储和管理服务
2.数据共享与流通:搭建开放协同的科学数据共享平台,促进科学数据产品的开放共享和跨机构交流
3.数据分析与计算:提供高性能计算环境和数据分析工具,助力科研人员挖掘数据价值、加速科研进程
4.数据标准与规范:推动物质科学数据领域的标准体系建设,全面提升提高数据质量
5.数据应用服务:打造高质量数据集,为材料科学、工业制造、新能源等领域提供专业数据支持
6. 数据安全与合规:构建全链路数据安全防护体系,覆盖数据的全生命周期管理流程,落实分级分类保护、访问权限管控、等措施,保障数据合规使用与隐私保护
用户群体
截至2025年,数据中心已服务数百个大学及科研机构的近万名用户,主要包括:
(1)国内外从事材料科学、化学、生物科学、高能物理等科研团队
(2)粤港澳大湾区内的科研机构和高校
(3)从事材料工程、工业制造、医药等领域研究的产业化创新团队
建设意义与未来发展
广东省物质科学数据中心的建设具有重要战略意义,主要体现在以下三点:
1.支撑粤港澳大湾区科技创新:为大湾区打造世界级原始创新高地提供关键数据基础设施支撑
2.推动科学数据开放共享:促进科学数据资源的高效利用,加速科研成果产出,提升产业赋能价值
3.筑牢AI发展的核心底座:提供物质科学高质量数据供给,为 AI for Science 场景提供精准训练素材,培育“AI+Data”应用
未来,数据中心将继续扩大数据资源规模,提升服务能力,加强与大湾区其他科学数据中心的协同,构建全链条、一体化的科学数据服务体系,形成“数据-算法-算力-场景”四维协同的技术生态,为大湾区材料科学、生命健康等交叉学科及产业发展提供技术创新平台。

