サイトアイコン DG Lab Haus

日本産業界の“虎の子”「材料データ」の流出をどう防ぐのか

国立研究開発法人 物質・材料研究機構(NIMS) 総合型材料開発・情報基盤部門(MaDIS)部門長の出村雅彦氏

国立研究開発法人 物質・材料研究機構(NIMS) 総合型材料開発・情報基盤部門(MaDIS)部門長の出村雅彦氏

「もっと強くて軽い材料がほしい」とか「もっと耐熱性に優れた材料が必要だ」など、産業界や社会のさまざまなニーズに応えるため、材料科学者は物質(元素)の組み合わせや製造プロセスなどを日々研究している。材料開発は、日本の産業を支える重要な研究領域のひとつなのだ。

 近年、この材料開発の世界に、AI(人工知能)やビッグデータを活用して作業を効率化する「データ駆動型」の研究開発スタイルが広まっている。そのなかで、情報科学の手法を取り入れ、高機能な材料を短期間で探索する「マテリアルズ・インフォマティクス」などの新手法に大きな期待が集まるようになった。

 こうした背景のもとで、にわかに注目されるようになったのが材料データのビジネス転用だ。

 エルゼビア(Elsevier : オランダ)をはじめとする科学出版社や米国化学会を母体とするケミカル・アブストラクツ・サービス(CAS)などが、論文からデータを抜き出して企業や研究機関に提供するサービスをはじめたほか、GoogleやIBMなどデータ関連企業が、企業が持つ材料関連のデータを集め、AI解析などで価値を高めたうえで販売しようと試みるなど、これまで企業の研究成果や論文中に埋もれていた材料データをビジネスにつなげる動きが活発化している。

材料データをめぐる世界情勢について解説する出村氏

 これまで「材料開発」に特に力を入れてきた日本は、こうした海外の新たな動きにどう向き合おうとしているのか。国立研究開発法人 物質・材料研究機構(NIMS)の総合型材料開発・情報基盤部門(MaDIS)部門長の出村雅彦博士(工学)に、材料データをめぐる世界情勢やデータ戦略について聞いた。

欧米科学出版社や学会が狙う「プラットフォーム化」

 出村氏によると材料データは、論文などに掲載される学術データが主となる「オープンデータ」と、企業などが所有する「クローズドデータ」(※)に大きくわかれる。まずオープンデータについては、「注目度が非常に高まり、(データ収集の)競争が激化している」と出村氏は話す。

※複数の企業や研究機関が共有する「シェアードデータ」もあるが、本稿ではこれを「クローズドデータ」に含める。

 例えば米国化学会(CAS)は、論文から大量のデータを収集・整理(キュレーション)し、それを販売するサービス(SciFinder:サイファインダー)を提供している。また学術雑誌を多数発行する出版社エルゼビアは、論文内のデータにタグ付けし検索できるようにすることで、データベースのように利用できるサービス(Reaxys:リアクシス)を開始した。

 これらのサービスは「すでに多くの企業や研究機関で利用されている」と出村氏は危機感を抱く。

「米国化学会(CAS)もエルゼビアの動きも、まだデータを売るというデータビジネスの段階にとどまります。しかしその先には、こうしたサービスがないと研究や開発が立ち行かない状況、すなわちプラットフォーム化を狙っていると我々はにらんでいます」(出村氏)

 こうした動きに対してどのような対策がとられているのだろうか。NIMSでは2017年から「材料プラットフォーム」事業を開始。そのなかで、専門家による論文からのデータ収集活動の強化や、AIによるデータ収集の効率化を進めることで、同機構が持つ世界最大級の材料データベース(「MatNavi」※)の拡充を図っている。

※専門家のキュレーションにより集められた材料データベース。「無機材料」「高分子」「金属・合金」など12ジャンルで構成される。

 さらに「日々生み出されている実験データを自動収集するシステムも構築している」と出村氏は続ける。

 現在NIMSでは1000人近い研究者が日々実験や測定を行っているが、そこで生み出される材料データの多くが、論文発表後には「各自のパソコンのハードディスクで眠った」状態になる。そこでNIMSでは、各実験装置にデータの出力装置(IoT)を取り付け、計測データが中央サーバーに集まるシステムを構築。合わせて、AI解析などで再利用しやすいよう、計測条件などの情報(メタデータ)とセットでデータを貯めることができるソフトウェア(M-DaC)を作り上げた。

「こういうことを2017年から進めており、今年(2020年)6月からNIMS研究者の実験データを掲載した『マテリアルデータリポリトジ(MDR)』を公開し、企業や一般の人にも使ってもらえるようにしました」(出村氏)

 出村氏はこのシステムをプロトタイプと捉え、全国の研究機関に広める構想を持っている。欧米の学会や出版社のサービスがプラットフォーム化を狙う流れに一石を投じたい考えだ。

企業が求めるのは「解析力」と「整理力」

 企業などの「クローズドデータ」については、それを利用するためにデータ解析などを外注すると、「企業の“虎の子”データを抜き取られてしまう危険がある」と出村氏は指摘する。つまり自前のAIを持たない企業が、外部のAIサービスを使う場合に、解析のため渡したデータを先方企業に蓄積される可能性がある。

 しかしその一方で「材料データは一般的なビッグデータとは性質が違う」と出村氏は解説する。データ量そのものが少ないうえ、種類が多く、ひとつのデータセットを手に入れてもそれを他の用途に転用するのが難しいという。

「例えばAI解析を得意とする巨大IT企業がある医療分野の研究所と組んだ場合、そこで得たデータを他の事業にまわすことで、投資分を回収できるケースも多いでしょう。しかし、材料データの場合は、もし鉄鋼メーカーと組んだとしても、そこで得たデータを化学メーカーとの事業に転用するのは難しい。つまり横展開しづらい。こうしたことから、IBM やGoogleなどは、現時点では材料データに対して大きなアクションを起こしきれていないように見えます」(出村氏)

 一方で、シトリン・インフォマティクス(Citrine Informatics)など材料開発関連のスタートアップが、ここ数年で従来のデータ収集型から、データ解析を支援するビジネスモデルに転換したことに出村氏は着目する。

 現在、自社で材料データを持つ企業の多くが、データ解析を行う際に、データフォーマットやデータ構造の設計で迷うケースが増えており、シトリン・インフォマティクスらはそこに目を付け、ビジネスモデルを転換したのではないかと分析する。

「NIMSでは早くから、『データ解析力』だけでなく、『データ整理力』が重要になると考え、取り組みを強化してきた」と出村氏は述べる。これら2つを公的サービスで提供できれば、「海外のデータ関連企業に日本の材料データが流れるのを防げる可能性がある」と持論を続けた。

 データ解析力については、NIMSをはじめ日本中にデータ駆動型の研究を行う機関が増えており、企業ニーズにも十分対応できる形になりつつある。データ整理力についても、データ解析を行いやすいデータ構造をNIMSで設計し、それに基づく共通のデータフォーマットを企業に提供する構想があるとのことだ。

「材料開発の分野で日本は、間違いなく世界トップの集団にいます。日本の材料開発企業は、世界的に見ても少し異例なくらいR&Dの人員を多数擁しています。それは裏返すと、各企業にいい材料データがたくさんあるということ。それを使える形にするため各企業で一生懸命努力されていると思いますが、そこに我々がどんなお手伝いができるか、それを考えることが今後ますます重要になると思います」(出村氏)。

モバイルバージョンを終了