整理 CSV 批处理文件

(本文档中的关键词“必须”、“不得”、“必需”、“应”、“不应”、“应该”、“不应”、“推荐”、“可以”和“可选”应按照 RFC 2119 中的描述进行解释。)

这些说明旨在帮助您使用 IRD 服务向您(作为负责组织)提供的 CSV 文件,以便您可以更新文件中列出的存储库的一些信息。

此 CSV 已从 IRD 导出。它包含 IRD 已知的有关您负责范围内的存储库的最新信息。 它包含 13 列。其中几列受到限制。有些仅接受受控允许值列表中的值。所有这些都在表格(下表)中详细说明。

该文件的每一行中的值都可以编辑,并受表中规则的约束。然后可以将该文件发送回 IRD 以更新那里的记录。当您收到 CSV 文件时,它将包含 IRD 已知的存储库记录。这意味着第一列 - ID - 包含每个存储库的 ID。如果您编辑具有其中一个 ID 的行中的任何值,则 IRD 中具有该 ID 的记录将使用这些值进行更新。

如果您认为存在 IRD 尚不知道的存储库,您也可以向 CSV 文件添加新行。这些行也将具有值,并受下表中相同规则的约束,但它们不得具有 ID。如果没有 ID,IRD 将为该存储库创建新记录。

当您将 CSV 文件提交回 IRD 以更新记录时,它将在处理之前自动进行检查。文件的结构必须与原始文件完全匹配(例如,列数、列顺序、行中允许的值等)。

如果有些行不需要更新,您可以添加这些行(但这是可选的)。当 IRD 处理 CSV 文件时,任何不需要更新 IRD 记录的行都会被忽略。

如果 CSV 文件包含您认为不再存在的存储库行,那么您必须通过在 record_status 列中输入值“已存档”来表明这一点。

使用 CSV 文件更新的流程摘要

  1. 从 IRD 接收 CSV 文件
  2. 检查文件中的每一行(存储库)以确保信息的准确性 - 根据下表中描述的约束和规则,可选择更新此行中的任何值
  3. 为您认为应包含在 IRD 中的任何新存储库添加新行 - 根据表中的规则,在每个新行中添加值。
  4. 更新每行的 record_status 列: - 如果您认为存储库记录完整且准确,请将此值设置为“已审核” - 如果您认为此存储库已失效或由于某种原因不应再在 IRD 中显示,请将此值设置为“已存档”

在下表中,使用了以下术语

CSV 文件中的列

列名称 类型 说明 要求 约束和规则 示例
id UUID 或 nil 此存储库的 IRD ID(新存储库将为空白) 可选 - 如果此存储库的 IRD 中已有记录,则此字段为必填项
- 如果此存储库的 IRD 中尚无记录,则此字段必须为 nil
1b74aa75-db97-4ea3-a344-baafc0911ee8
name 自由文本 存储库的名称 必填项   Zenodo
homepage URL 存储库主页的 URL 必填项 此字段必须是有效的 HTTP 或 HTTPS URI。 https://zenodo.org/
contact 自由文本 用户联系存储库服务的方式。 推荐 此字段通常为支持电子邮件地址,但也可能是“帮助台”或联系表单的 URL,甚至只是自由文本说明 [email protected]
owner_ror HTTPS URL 这是拥有此存储库的组织的 研究组织注册表 (ROR) 标识符 推荐 这必须是 HTTPS URI 格式的有效 ROR。 https://ror.org/01ggx4157
owner_name 自由文本 拥有此存储库的组织的名称 可选 当 IRD 处理 CSV 时,此字段不使用 - 它仅为了方便您识别拥有组织而提供。该组织仅通过 owner_ror 列中的值来标识。 欧洲核研究组织
repository_type term 这描述了存储库的“范围”。 必需 此字段必须包含列表 存储库类型 中的一个值(见下文) generalist_repository
software term 这标识了存储库运行的软件平台。 推荐 此字段必须包含列表 软件平台 中的一个值(见下文) invenio
software_version 自由文本 这是存储库运行的软件平台的版本号或标签。 可选   3
oai_pmh_base_url URL 这是存储库的 OAI-PMH 接口的基本 URL 必需 这必须是有效的 HTTP 或 HTTPS URI https://zenodo.org/oai2d
media_types 列表(术语) 这描述了存储库中内容的类型。 必需 此字段必须包含列表 媒体类型 中的一个或多个值(见下文)。
用“管道”字符分隔每个值:“|”
research-articles|conference-papers|research-data
primary_subject term 这描述了存储库中内容的主要主题/学科。 必需 此字段必须包含来自列表 主要主题一个值(见下文) 多学科
record_status term 这标识了 IRD 记录的状态 必需 此字段必须包含来自列表 记录状态一个值(见下文)。
- 如果存储库不再有效,不能包含在 IRD 中,请使用值“archived”
- 如果存储库已经过检查,并且所有信息都是最新的,则使用值“reviewed”
- 否则,使用值“under_review”。
已验证

受控术语列表

存储库类型

媒体类型

主要科目

软件平台

记录状态