Westdc Logo

黑河计划:如何提高科学数据描述质量

[2013-05-25]  来源 : 黑河计划数据管理中心

在黑河计划中,我们实行了数据评审制度,即项目组在提交元数据和数据实体后,黑河计划数据管理中心将首先对元数据进行初审,通过初审后再提交给项目的跟踪专家进行数据质量审核,通过后才可以对外发布。

一、数据中心对元数据的理解

  • 标题

标题应体现时间、地点以及核心要素集。同时也应同时提供中文标题和英文标题。(在数据引用以及DOI申请中都需要用到)

  • 数据集序列

在黑河计划项目中,所有的数据集序列都应该是“黑河计划”。

  • 联系人

在元数据中涉及多个不同类型的联系人,数据中心根据ISO 19115标准,就以下几类角色进行了定制。每个角色都可以是多个人,也可以是单位。

1. 元数据作者

是撰写元数据的人,主要是指撰写元数据摘要的人。

2. 数据服务联系人

在黑河计划中,数据服务联系人统一为黑河计划数据管理中心。用户请不要更改此信息。

3. 资源提供者

黑河计划中的资源提供者多数是指提供数据的项目负责人。同时,用户在申请此数据时,数据中心将发送审核邮件给资源提供者的email。

4. 主要调查者

是指数据的主要调查或生产者。视实际情况,可以空缺。

5. 数据联系人

是指对数据负责的相关联系人。视实际情况,可以空缺。

  • 关键词

1. 时间关键词

即描述时间信息的关键词,此处是描述性质的词语,是比较模糊的时间词,如“第四纪”、“80年代”等。精确的时间范围请参考下面的时间范围。同时若有可以精确到年的日期信息,请在此处也添加对应年份的关键词。

2. 地点关键词

即描述地点信息的关键词,如“黑河中游”、“祁连山”等。可以是多个,表述的地点可以从大到小。

3. 主题关键词

即描述数据内容的关键词。建议主题关键词至少3个以上,多多益善。

4. 学科关键词

即描述学科范围的关键词。

5. 地层关键词

即描述地层信息的关键词。此类关键词在数据中心暂时未用到。

  • 空间范围

表达数据的空间四至范围,是数据的粗略框架范围。若数据是一个观测点,则空间范围为此点位。空间范围的表达方式是10进制的经纬度方式。
  • 时间范围

数据表征的时间信息。对于观测数据而言,是指数据的起始观测到结束观测的时间范围。时间范围要精确到日。

若存在可以精确到日的时间信息,则必须填写时间范围。

  • 数据引用方式

数据中心目前支持两类引用方式,一类是针对数据发表的文献进行引用,一类是针对数据的直接引用。详细信息可以参考:数据引用帮助

简单而言,若您的数据已经有正式的文献发表,而且您想让用户引用您的文献,您可以在元数据的引用方式中直接填写您文献的标准引用方式。数据中心在审核数据并且申请数据DOI号后,您的数据引用方式将同时显示文献的引用和数据的引用。

同时,您也可以将您的多篇相关文献作为数据的建议参考文献列出,具体见下面的数据的补充信息填写。

  • 摘要

摘要是表达数据内容的核心要素,我们建议用户应详细填写数据的摘要信息。数据的摘要只能是文本。因此,您若需要用富文本格式(如word)来表达数据信息,建议您可以通过补充数据文档的形式进行补充说明。

建议良好的摘要至少包括如下方面的信息:简单背景说明、数据的观测或处理过程、数据内容说明、数据使用说明。

  • 缩略图

缩略图是表达数据的一个重要方式。在撰写元数据的时候,从本地选择一个图片作为数据的缩略图上传,在geonetwork中“other actions”选择缩略图(thumbnail),通过大图的方式上传缩略图。若数据之前已有缩略图,需要先删除。大图上传完后,小图可以自动生成。

  • 数据格式、大小、投影、比例尺

数据的格式是指该数据存贮的具体文件格式,如观测表格的excel、空间数据的shapefile等。大小是指文件的大小,以Mb为单位的浮点数。投影是针对空间数据的一种投影编码方式,常见的4326编码是指经纬度方式的投影。比例尺是数据表征的对比信息,如栅格影像的一个点代表多少。

  • 数据服务方式

在数据中心中,支持两种数据服务方式,即在线服务和离线服务。在线服务对于用户而言,数据获取是即时的。离线数据是需用数据作者进行审核的,建议在数据发布的前期,采用离线服务方式,经过一段时间(1-2年)的服务后,逐步采用在线方式扩展用户的服务范围。

若采用在线方式,则在数据传输方式中选择为download,离线方式则选择offline。

二、其他常见问题

时间关键词与时间范围

在撰写元数据过程中,时间关键词和时间范围是比较容易产生歧义的一个地方。对于数据而言,若该数据有明确的时间范围(至少可以精确到日),则该数据应该填写时间范围。时间关键词是对时间范围的一个信息补充。

缩略图

数据要不要缩略图?用什么样的图片来作为缩略图?这也是经常困惑用户的另外一个问题。

数据中心建议所有的数据都应该有缩略图。同时数据的缩略图应该有明确的含义,和数据应该紧密相关。比如,在野外某个观测点,得到的观测数据,您可以用这个观测点的照片作为数据的缩略图,也可以将数据用二维图表方式生成一个缩略图。

三、如何填写数据的补充要素?

数据中心对元数据的核心要素做了一些补充,主要包括项目 的支持信息、数据申请DOI所需要的作者及其单位信息、数据相关的文献发表信息等。同时在前台也根据对应的信息实现了不同的功能性分类浏览,包括基于项目 的浏览、基于DOI信息的浏览、基于文献的浏览以及文献与数据的关联等。同时也提供了单独的数据文档支持,即每条数据也可以补充多个数据文档。

元数据提交到数据中心后,数据中心在接收后,用户就可以补充这些对应的信息。

如何填写项目支持信息?

每条数据也可以填写具体的项目支持信息,原则上建议每条数据不要超过3个支持项目。数据作者可以针对每条数据修改其项目支持信息。


从网站首页:数据作者-》我的数据,找到具体的数据后,选择:支持项目。然后在输入框中输入项目的标题、类型以及编号(包括对应的英文信息)以及次序信息。


如何填写DOI补充信息?


数据的DOI信息在正式申请前,用户可以修改申请DOI的信息。其中,申请的DOI号由数据中心确定,大概的形式为doi: 10.3972/heihe.xxxx.2013.db(其中的xxxx为数字流水号,2013为申请年份)。其中的相关信息,包括中文标题和英文标题,是从元数据中提取出来的。doi、uuid、url都是由数据中心生成的。数据作者需要确定的是该数据的所有作者信息及其排序(包括姓名信息和单位信息,以及对应的英文信息)。

从网站首页:数据作者-》我的数据,找到具体的数据后,选择:DOI。然后在输入框中输入作者及其单位的相关信息、作者的次序信息。


如何填写文献发表信息?


从网站首页:数据作者-》我的数据,找到具体的数据后,选择:添加文献。然后在输入框中输入文献的具体引用方式,同时也可以将该文献的pdf上传到网站。

如何修改数据的文献次序?

若您想修改数据的文献的显示次序,可以从网站首页:数据作者-》我的数据,找到具体的数据后,选择:文献。然后在输入框中确定文献的具体排序。


已提交审核的数据如何进行修改?

从网站首页:数据作者-》我的数据-》修改元数据。

已提交审核的数据修改后如何再次提交审核?

从网站首页:数据作者-》我的数据-》数据版本-》选择最新的版本进行提交审核发布。再次提交审核发布需要标注您所做的更新情况,若忘记了具体的更新的情况,可以通过不同版本之间的对比查看发现所有的变化情况。

如何上传数据文档?

若数据存在数据文档,也可以通过网站直接上传,从网站首页:数据作者-》我的数据-》数据文档-》选择本地的数据文档上传数据中心网站。