ICS 35.040 CCS A 00 团 体 标 准 T/CSTM 00837—2022 材料基因工程数据 元数据标准化基本原则与方法 Materials genome engineering data — Metadata standardization principle and method 2022-08-31发布 2022-11-30 实施 中关村材料试验技术联盟 发布 CSTMhQÆSÑ^Ou( 全国团体标准信息平台 T/CSTM 00837 —2022 I 前 言 本文件参照 GB/T 1.1—2020 《标准化工作导则 第1部分:标准化文件的结构和起草规则》的规定 起草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。 本文件由中国材料与试验团体标准委员会 材料基因 工程领域委员会( CSTM/FC97 )提出。 本文件由中国材料与试验团体标准委员会 材料基因工程领域委员会通则技术委员会( CSTM/FC97/TC01 )归 口。 CSTMhQÆSÑ^Ou( 全国团体标准信息平台 T/CSTM 00837 —2022 1 引 言 材料基因工程通过数据驱动模式来加速材料研究,而当前材料数据离散分布、多源异构的现状特点 使得数据的访问、获取、集成和再利用极为不便,严重制约了材料基因工程的高效推进。为此,中国材 料与试验团体标准委员材料基因工程领域委员会( CSTM/FC9 7)制定了 T/CSTM 00120 《材料基因工程 数据通则》 (以下简称《通则》 ) ,以 FAIR(Findable,Accessible , Interoperable ,Reusable,可发现、 可获取、可互操作、可再利用)原则为目标来对材料数据进行标准化。 《通则》 将数据分为样品信息、 原始数据(未经处理的数据)与衍生数据(经分析处理得到的数据)三类,以操作(样品制备/ 表征 /计 算/数据处理)为条目单位, 在每条数据中需包含数据唯一标识、丰富的元数据记录及原始结果数据来 保证其符合 FAIR原则要求。 这里, 样品可以是实验产生 的实物, 也可以是经计算产生的虚拟物。 同理, 原始数据可以来自于表征或是直接的测量,也可以通过模拟计算产生。 《通则》明确了材料基因工程数 据的标准化内容和基本方向,仍需明确具体的标准化原则与方法作为标准编制的指导依据。 元数据是用于描述数据的数据,可对数据的产生背景、内容、过程及其它特征进行全面性描述,构 成了数据访问和利用的实际承载基础,因此,材料数据标准化实现的关键在于其元数据的标准化。为促 进材料数据标准化目标的切实落地和全面性开展,本文件基于《通则》要求,对材料基因工程数据 (样 品信息/原始数据/ 衍生数据) 的元数据标准制定原则与方法进行明确, 确保各元数据标准细则内容完整、 形式一致,使其有效保障数据符合 FAIR原则要求。 CSTMhQÆSÑ^Ou( 全国团体标准信息平台 T/CSTM 00837 —2022 2 材料基因工程数据 元数据标准化基本原则与方法 1 范围 本文件规定了材料基因工程数据元数据(以下简称元数据)的 术语和定义、 标准化原则、 分类和组 成、标准化方法和标准化 文件编写要求 等。 本文件适用于材料数据采集、数据库存储模板结构、数据汇交和集成等数据规范化文件、设施的编 制和开发等。 2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。 其中, 注日期的引用文件, 仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本 文件。 GB/T 18391.1 信息技术 元数据注册系统( MDR) 第一部分:框架 GB/T 19710 地理信息 元数据 GB/T 30522 科技平台 元数据标准化基本原则与方法 T/CSTM 00120 材料基因工程数据通则 T/CSTM 00839 材料基因工程术语 3 术语和定义 GB/T 18391.1 、GB/T 19 710、T/CSTM 00839 和T/CSTM 00120 界定的以及下列术语和定义适用于本 文件。 3.1 元数据 metadata 定义和描述其他数据的数据。 [来源:GB/T 18391.1 -2009,3.2.16] 3.2 元数据元素 metadata element 元数据的基本单元。 注1:元数据元素在元数据实体中是唯一的。 注2:与 UML术语中的属性同义。 [来源:GB/T 19710 -2005,4.6] 3.3 元数据模式 metadata schema 从某种角度对资源整体进行描述所形成的元数据元素集合。 3.4 元数据实体 metadata entity 一组说明数据相同特性的元数据元素。 CSTMhQÆSÑ^Ou( 全国团体标准信息平台 T/CSTM 00837 —2022 3 注1:可以包含一个或多个元数据实体。 注2:与 UML术语中的类同义。 [来源:GB/T 19710 -2005,4.7] 3.5 标识元数据 identification metadata 对数据进行识别、区分的元数据。 3.6 管理元数据 management metadata 对数据的产生背景、概况进行描述的元数据。 3.7 技术元数据 technical metadata 对数据产生的技术条件、结果进行描述的元数据。 3.8 描述单元 description unit 单个描述模式所覆盖的数据对象的特征范围。 3.9 元数据模式描述单元 metadata schema description unit 单个元数据模式所描述的对象。 3.11 样品信息 sample information 材料真实样品制备或加工过程产生的数据, 或者虚拟样品以计算、 仿真方式构建过程所产生的数据。 3.12 原始数据 source data 测量或计算产生的未经处理的表征数据。 [来源:T/CSTM 00120 -2022,3.8] 3.13 衍生数据 derived data 对原始数据或者衍生数据进行分析后产生的结果数据。 [来源:T/CSTM 00120 -2019,3.5] 4 标准化原则 元数据标准化的基本原则如下: a) 遵循科学数据管理的可发现、可获取、可互操作、可再利用原则设计 元数据; b) 按CSTM 00120 ,以样品制备 /表征 /数据处理为条目单位描述元数据单元 。元数据标准以可独立存在 的条目单位(样品制备 /表征 /数据处理)所采用的方法为载体,以其数据产出操作为描述对象进行 建设。 5 分类及组成 5.1 分类 元数据分为以下三类: a) 标识元数据:对数据进行唯一性标识,保证数据能够被查询解析到 ; CSTMhQÆSÑ^Ou( 全国团体标准信息平台 T/CSTM 00837 —2022 4 b) 管理元数据:对数据的产生者、产生目的、产生环境、数据主题进行基本描述,为数据使用者提供 数据概况和获取途径; c) 技术元数据:对数据产生的详细条件、结果进行完整描述,使数据使用者能够完整理解和重复利用 数据。 5.2 组成 元数据模式由标识元数据、管理元数据和技术元数据三部分组成。 元数据模式应以标准化的形式来表达。明确其包含的元数据元素的详细定义,清晰表达元数据元素 彼此间的相互关系,保障同主题不同来源数据在产生、采集、存储、交换和使用表达形式一致,具备互 操作性。 6 标准化方法 6.1 标准化流程 元数据标准化流程见图 1。 图1 元数据标准化流程 6.2 标准化步骤 确定描述对象及 类别 确定标识元数据 元素 确定技术元数据 元素 编制元数据标准 文件 生成元数据模式 确定管理元数据 元素 CSTMhQÆSÑ^Ou( 全国团体标准信息平台 T/CSTM 00837 —2022 5 6.2.1 确定描述对象及类型 按第 4章的原则,确定拟建设元数据标准的描述对象; 按CSTM 00120 中数据分类,确定所描述数 据的类型。 以离子束沉积 ( IBD) 薄膜制备为例 :元数据模式的描述对象为 IBD样品的制备操作, 所描述的 IBD 制备数据属于样品信息;以 X射线衍射 (XRD)表征为例,元数据模式描述对象为 XRD的表征操作, 所描述的 XRD表征数据属于原始数据;以物相分析为例,元数据模式描述对象为基于 XRD原始数据 的物相分析操作,所描述的物相分析数据属于衍生数据。 6.2.2 确定元数据元素 6.2.2.1 确定标识元数据元素 标识元数据元素包括如下元素: a ) 数据唯一标识元素,在所有类型数据的元数据模式 中必须存在 ; b ) 关联数据标

pdf文档 T-CSTM 00837—2022 材料基因工程数据 元数据标准化基本原则与方法

文档预览
中文文档 29 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共29页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
T-CSTM 00837—2022 材料基因工程数据  元数据标准化基本原则与方法 第 1 页 T-CSTM 00837—2022 材料基因工程数据  元数据标准化基本原则与方法 第 2 页 T-CSTM 00837—2022 材料基因工程数据  元数据标准化基本原则与方法 第 3 页
下载文档到电脑,方便使用
本文档由 思安 于 2022-12-18 17:31:12上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。