• キャリア
    必要とする人に最適な広告を!株式会社GeeeN若手エンジニアインタビュー
    2018年4月9日
  • キャリア
    全ての業界で求められるデータサイエンティストの最先端と魅力に迫る ARISE analytics様インタビュー
    2018年4月5日
  • 学術
    狙い目は「先輩の少ない分野」―AidemyCEOが語る「今、AIプログラミングを学べばトップに立てる理由」とは
    2018年2月24日
  • キャリア
    いま理系×広告業界が熱い! 採用にもデータをフル活用するセプテーニグループ
    2018年4月2日
データジャーナル『Scientific Data』がオープンサイエンスの未来を開く 〜LabTech海外事例最前線〜

科学研究の設備やデータを研究コミュニティ内外と共有する「オープンサイエンス」の潮流が、勢いを強めている。科学的に貴重なデータについて詳細に記述し他の研究者が再利用することを助けるのが、データジャーナルという形態の論文誌だ。科学論文雑誌を発行するNature Publishing Groupは2014年、新たにデータジャーナル『Scientific Data』を創刊した。

研究データ再利用の必要性

学術出版の業界では、研究を社会に還元するために成果を無料で公開するオープンアクセスの動きが加速しつつある。また、そうした社会貢献のみならず、研究者であれば、自身が残した科学的に価値の高いデータを他の研究者に再利用してもらうことで新たな科学的発見に繋げたいと考えるだろう。

論文投稿の際には、論文誌から研究データの公開を求められることが多い。しかしその研究データを管理する労力は個々の研究者に委ねられるのが一般的だ。分野によっては研究者が自身のwebサイトで公開するか、個別の要請に応じてデータを提供するという形を取ることになる。また、すでに出版されたデータを再利用可能な状態にすること自体は研究業績にカウントされないことが多いため、データを作成した研究者には公開のためのインセンティブが働きにくい。

このように、今までは研究コミュニティ内外で効率的にデータを共有するためのインフラが整備されていない状態が続いていた。

データジャーナルが「データ」を引用可能にする

研究者や産業界、政策決定者が科学的に貴重なデータの再利用・引用を促すことで、最終的には科学的発見のサイクルを加速させることに繋がる。そのための方策として近年登場したのが、研究データを詳細に記述する「データ論文」というフォーマットと、データ論文を出版する「データジャーナル」という形態の論文誌だ。

データジャーナルの主な役割の一つは、研究データの品質の検証である。データの生成プロセスや統計処理などに対して専門家が査読を行うことで、実験手法や観測手法の厳密性とデータ記述の完全性を検証する。

もう一つ重要なデータジャーナルの役割は、研究データをデータ論文の形式で引用可能な出版物にすることだ。他の研究者から引用可能な状態にすることで、データ論文の著者は貴重なデータの作成者としてクレジットされる。研究データを再利用可能にすることが、研究者の業績として可視化されるのだ。

Natureがデータジャーナルを創刊

科学雑誌Natureを擁するNature Publishing Groupは2014年5月、データジャーナルの理想形を実現するためオープンアクセス誌Scientific Dataを創刊した。Scientific Dataでは “Data Descriptor” と呼ばれるデータ論文が査読を経て出版される。

具体的に見てみよう。以下のURL先が、実際にScientific Dataで出版された論文だ。
https://www.nature.com/articles/sdata2018189
Data Descriptor内で記述されているMethodsやData Recordsの内容は研究機関のデータベースに保存された研究データにリンクされており、研究の目的や対象、データの取得方法について詳細を確認することができる。また、研究データに関する基本的な説明に加えて、データの再利用を可能にするための様々なメタデータも付与される。

これによりデータ形式や研究分野を超えた横断検索、他のデータとの関連付け、データマイニングなどの処理ができるようになるのがScientific Dataの特徴だ(下図)。このようなプラットフォームがあると、産官学連携や学際的な研究の現場において、情報を収集・分析するためのコストを大きく引き下げることが可能になる。

Scientific Dataにデータ論文を投稿すると、研究者はデータの記述方法について査読者から助言を得られるため、データの再現性や有効性の向上が期待できる。

また、Scientific Dataは研究データの作成者が正当に評価されることを重視している。普段はあまり意識されていないが、研究プロジェクトには最終的な解析や理論を考える研究者以外にも、実験や観測を担当する技術者など、多くの専門家が関わる。Scientific Dataは、従来の学術出版システムでは著者資格が与えられなかった貢献者をデータ論文の著者としてクレジットし、通常の研究論文と同様に研究業績としてカウントされるようになることを見込んでいる。

日本への波及効果

Scientific Dataは、創刊当初は主に生命科学と環境科学の分野のデータ論文が対象だったが、現在では自然科学、社会科学に属する幅広い分野からも投稿を受け付けている。

データ論文の著者は、Scientific Dataへの投稿時に “figshare” または “Dryad” のリポジトリにデータセットを登録することができる。研究コミュニティが比較的小さいために既存のデータベースがない研究分野は日本国内にもいまだ多く、そのような分野の研究者でも迅速にデータ論文を公開し、データ再利用の促進が可能であることも大きな利点だ。

Scientific Dataに続いて、多くの学会や研究機関がデータジャーナルを新たに創刊している。国内においては、国立極地研究所が2017年に極域科学に関するデータジャーナルPolar Data Journalを創刊した。南極や北極に関する研究は実験や観測に多額の費用がかかるために希少性が高く、そこで得られたデータを共有することは極域研究の進歩に直結する。

まとめ

研究データを共有・再利用するための基盤となるデータジャーナルは、オープンサイエンスを促進するうえで重要な役割を担う。Scientific Dataを筆頭とするデータジャーナルによって、公開される研究データの品質が高まること、そしてデータの公開に対してインセンティブを与えるという考えが科学全般に浸透することが期待できる。

LabTech海外事例最前線

研究の未来をデザインするメディアLab-Onが、研究を加速させる様々なLabTechを紹介する本連載「LabTech海外事例最前線」は毎月新しい調査を報告しています。バックナンバーはこちらから。

[参考文献]
・Nature Asia https://www.natureasia.com/ja-jp/scientificdata/about
・ヒリナスキエヴィッチ, 新谷, 2014: Scientific Data データの再利用を促進するオープンアクセス・オープンデータジャーナル. 情報管理, vol. 57, no. 9 https://doi.org/10.1241/johokanri.57.629

関連キーワード
ハウツーの関連記事
  • 研究室運営は試行錯誤の連続 稲見昌彦先生に聞くラボマネジメントのあれこれ
  • 『Sim Daltonism』『Chromatic Vision Simulator』で色覚の多様さに配慮したプレゼンテーションを〜LabTech海外事例最前線〜
  • 学会運営の新しいインフラ!イベントアプリ『Whova』の実力〜LabTech海外事例最前線〜
  • データジャーナル『Scientific Data』がオープンサイエンスの未来を開く 〜LabTech海外事例最前線〜
  • 『OSF』で社会に開かれた研究室へ〜LabTech海外事例最前線〜
  • 資金提供者の意思決定をスムーズに。「Dimensions」〜LabTech海外事例最前線〜
おすすめの記事