Open Innovation Platform
FOLLOW US

DNAデータ、暗号化技術向上で「共有利用」可能に?

顕微鏡をのぞく科学者(2018年8月29日撮影、資料写真)。(c)MARCO BERTORELLO / AFP

顕微鏡をのぞく科学者(2018年8月29日撮影、資料写真)。(c)MARCO BERTORELLO / AFP

【AFP=時事】家系調査サイトに蓄積されているのは、利用者それぞれの唾液から得られた膨大な量のDNA特性データだ。

 だが現状では、この大量のデータを遺伝学分野の研究に利用するのは実質的に不可能となっている。信頼性の点で大きな代償を被る恐れのある情報漏えいを懸念する各サイトが、データベースを慎重に保護しているからだ。

 このデータ活用の問題について、米マサチューセッツ工科大学(MIT)のボニー・ベルガー(Bonnie Berger)教授(数学)と研究チームは、情報を保護する最新の暗号化システムを用いることで解決できると考えている。

 ベルガー教授は、AFPの取材に「現在、このゲノム(全遺伝情報)データを共有利用することについては足踏み状態にある」「研究者らが各サイトのデータを入手するのは実に困難であり、実際に科学の助けになっていない」と指摘する。

 また、「遺伝子変異と疾病との関連性を見つける目的でデータを利用することは誰にもできない」「だが、各サイトですでに蓄積されている膨大なゲノムデータの活用ができればどうだろうか」と、その潜在性について触れた。

 米科学誌サイエンス(Science)で発表された最新の暗号化技術のアイデアは、製薬会社が提供するデータ群から薬剤候補を見つけることに関連して開発されたものだ。

 先行研究では、このアイデアをDNA特性データに適用できることが示されていた。

 各研究室では、特定の薬剤に適した候補を見つけるために、数百万の薬剤化合物と人体に存在する数万種のタンパク質との関連性を特定する試みが常に行われている。

 ただ、取り組んでいる研究内容をライバルに知られるのは困る。薬剤化合物は特許権の対象で秘密扱いとなっている場合が多いため、情報共有はあまり行われない。

■「秘密分散」

 だが、研究チームが開発した最新の拡張可能な技術を用いると、各研究組織が所有する秘密データの共有利用が可能になるかもしれない。「安全な『ニューラルネットワーク』に基づく初のシステム」とベルガー教授が説明するこの技術は、秘密データを複数のサーバー間に分割して処理することで、全体としてのデータサンプルに基づく新たな関連性を見つけることを目的とする。

 だが、互いに共謀しない限り、専有情報を含む可能性のある初期入力データに各組織がアクセスすることはできない。それぞれ、寄与に基づいて処理結果を得ることができる仕組みだ。

 今回の技術について、ベルガー教授は「秘密分散」と呼ばれる暗号化の枠組みに基づくものと話す。

 研究チームは分析を要する膨大な数の化合物やゲノムの処理を可能にするために、最適化された最新の手法と人工知能技術を導入した。

 ベルガー教授は「これまでは完全に不可能だったことを実行できる」としながら、既存の暗号化の手法では膨大な計算量と通信コストとが必要となることを指摘した。その上、数百万個ではなく数千個のデータ点に対してしか機能しないという部分もある。

 この新たな技術を採用することで、「Ancestry.com」や「23andMe」などの主要な家系調査サイトが所有するデータベースを研究者らに公開したり共有したりすることも可能になると考えられる。

 登録されているDNA特性データは、Ancestryで1000万件以上、23andMeは500万件以上に上る。ベルガー教授は、今回の研究結果について両社と連絡を取っていることを明らかにした。

 Ancestry、23andMe、MyHeritageなどの家系調査サイトは、身体データや系図データのほかに家系内のがんの病歴などの医療データも提供する。研究者らが特定の遺伝子変異との照合研究を行いたいと考えているのが、この種の情報だ。

 だが、これらのデータが「悪者」の手に渡るとどうなるか。ハッカーらが不正目的で情報を悪用するかもしれない。もしくは保険会社などが顧客を差別待遇するために情報を使用したらどうなるだろうか。

 米国立衛生研究所(NIH)の生命倫理学研究者ベンジャミン・バークマン(Benjamin Berkman)氏は「人々はゲノムのプライバシーに関して大きな不安を抱いている。遺伝子検査を受けたり研究に参加したりするつもりがない人々はこの点を理由として挙げている」とコメントした。【翻訳編集】 AFPBB News |使用条件