CSV バッチファイルのキュレーション

(このドキュメント内のキーワード「MUST」、「MUST NOT」、「REQUIRED」、「SHALL」、「SHALL NOT」、「SHOULD」、「SHOULD NOT」、「RECOMMENDED」、「MAY」、「OPTIONAL」は、RFC 2119 で説明されているとおりに解釈されます。)

これらの手順は、IRD サービスによって (責任組織として) 提供される CSV ファイルの使用を支援することを目的としています。これにより、ファイルにリストされているリポジトリに関する情報を更新できます。

この CSV は IRD からエクスポートされています。これには、IRD が把握している、担当領域内のリポジトリに関する最新の情報が含まれています。

13 の列が含まれています。いくつかの列は制約されています。一部の列は、許可された値の制限されたリストからの値のみを受け入れます。これらはすべて、表 (以下) に詳細に示されています。

このファイルの各行の値は、表のルールに従って編集できます。その後、ファイルを IRD に送り返して、そこでレコードを更新できます。CSV ファイルを受け取ると、IRD が認識しているリポジトリのレコードが含まれます。つまり、最初の列 (「ID」) には、それぞれの ID が含まれます。これらの ID のいずれかを持つ行の値を編集すると、その ID を持つ IRD のレコードがその値で更新されます。

IRD がまだ認識していないリポジトリがあると思われる場合は、CSV ファイルに新しい行を追加することもできます。そのような行にも、以下の表と同じルールに従って値が設定されますが、ID があってはなりません。ID がない場合、IRD はそのリポジトリの新しいレコードを作成します。

レコードを更新するために CSV ファイルを IRD に送り返すと、処理される前に自動的にチェックされます。ファイルの構造は、元のファイルと完全に一致している必要があります (列の数、列の順序、行に許可されている値など)。

更新が不要な行がある場合は、それらの行を含めることができます (ただし、これはオプションです)。CSV ファイルが IRD によって処理されるとき、IRD レコードの更新を必要としない行は無視されます。

CSV ファイルに、もう存在しないと思われるリポジトリの行が含まれている場合は、record_status 列に値「archived」を入力して、そのことを示す必要があります。

CSV ファイル更新を使用するプロセスの概要

  1. IRD から CSV ファイルを受け取ります

  2. ファイル内の各行 (リポジトリ) の情報の正確性を確認します

  1. IRD に含める必要があると思われる新しいリポジトリの新しい行を追加します - 表のルールに従って、新しい行ごとに値を追加します。

  2. 各行の record_status 列を更新します:

以下の表では、次の用語が使用されています

CSV ファイル内の列

列名 タイプ 説明 要件 制約とルール
id UUID または nil このリポジトリの IRD ID (新しいリポジトリの場合は空白になります) オプション - このリポジトリの IRD にすでにレコードがある場合、これは必須です
- このリポジトリの IRD にまだレコードがない場合、これは nil でなければなりません
1b74aa75-db97-4ea3-a344-baafc0911ee8
name フリー テキスト リポジトリの名前 必須   Zenodo
homepage URL リポジトリのホームページの URL 必須 これは有効な HTTP または HTTPS URI でなければなりません。 https://zenodo.org/
contact フリー テキスト ユーザーがリポジトリ サービスに連絡する方法。 推奨 これは多くの場合、サポート メール アドレスですが、「ヘルプデスク」または連絡フォームへの URL、またはフリー テキストの指示であってもかまいません [email protected]
owner_ror HTTPS URL これは、このリポジトリを所有する組織の 研究組織レジストリ (ROR) 識別子です 推奨 これは、HTTPS URI 形式の有効な ROR である必要があります。 https://ror.org/01ggx4157
owner_name フリー テキスト このリポジトリを所有する組織の名前 オプション このフィールドは、CSV が IRD によって処理されるときには 使用されません。所有組織を認識できるようにするための便宜上のみ提供されています。組織は、owner_ror 列の値によってのみ識別されます。 欧州原子核研究機構
repository_type term これは、リポジトリの「範囲」を説明します。 必須 このフィールドには、リポジトリ タイプ のリストから 1 つの 値が含まれている必要があります (以下を参照) generalist_repository
software term これは、リポジトリが実行されるソフトウェア プラットフォームを識別します。 推奨 このフィールドには、リスト ソフトウェア プラットフォーム1 つの 値が含まれている必要があります (下記参照) invenio
software_version フリー テキスト これは、リポジトリが実行されるソフトウェア プラットフォームのバージョン番号またはラベルです。 オプション   3
oai_pmh_base_url URL これは、リポジトリの OAI-PMH インターフェイスのベース URL です 必須 これは、有効な HTTP または HTTPS URI である必要があります https://zenodo.org/oai2d
media_types リスト (用語) これは、リポジトリ内のコンテンツの種類を説明します。 必須 このフィールドには、リスト メディア タイプ1 つ以上の 値が含まれている必要があります (下記参照)。
各値は「パイプ」文字で区切ります: “|”
research-articles|conference-papers|research-data
primary_subject term これはリポジトリ内のコンテンツの主な主題/分野を説明します。 必須 このフィールドには、Primary Subjects リストから 1 つの 値が含まれている必要があります (下記参照) multidisciplinary
record_status term これは IRD レコードのステータスを識別します 必須 このフィールドには、Record Statuses リストから 1 つの 値が含まれている必要があります (下記参照)。
- リポジトリが IRD に含めるのに有効でなくなった場合は、値 “archived” を使用します
- リポジトリがチェックされ、すべての情報が最新である場合は、値 “reviewed” を使用します
- それ以外の場合は、値 “under_review” を使用します。
verified

管理された用語リスト

リポジトリの種類

メディアタイプ

主な科目

ソフトウェアプラットフォーム

レコードステータス