はじめに
近年、金融分野をはじめとするさまざまな分野において、クラウド上で提供されているサービスが普及しているとともに、分散型台帳技術(ブロックチェーンなど)の活用に向けた検討も盛んに進められております。こうした動きに伴い、顧客へ提供するサービスの質や既存業務の効率性向上を目的に、データを複数の組織や異分野の間で共有・活用する動きが活発化しています。一方、取り扱われるデータに機微な情報(企業の知的情報や営業機密、顧客のプライバシー情報など)が含まれている場合、各種情報保護の観点からデータ共有を見送らざるを得ないケースも散見されます。
こうした状況において、最近、秘匿性を確保したままデータの共有・活用が可能となるプライバシー強化技術(Privacy Enhancing Technologies、PETs)が、新たなデータ共有・活用におけるセキュリティ/プライバシーの確保に資する技術として注目されており、研究開発や応用に向けた動きが活発化しています。
この記事では、PETsの概要について俯瞰して説明するとともに、代表的なPETsであるフェデレーテッド分析、差分プライバシー、秘密計算、ゼロ知識証明について、それぞれの概要を紹介いたします。
こうした状況において、最近、秘匿性を確保したままデータの共有・活用が可能となるプライバシー強化技術(Privacy Enhancing Technologies、PETs)が、新たなデータ共有・活用におけるセキュリティ/プライバシーの確保に資する技術として注目されており、研究開発や応用に向けた動きが活発化しています。
この記事では、PETsの概要について俯瞰して説明するとともに、代表的なPETsであるフェデレーテッド分析、差分プライバシー、秘密計算、ゼロ知識証明について、それぞれの概要を紹介いたします。
プライバシー強化技術とは?
プライバシー強化技術とは、データの秘匿性を確保したまま、当該データを利用した分析(統計解析など)や機械学習を行ったり、それらのデータの属性を第三者が検証したりできるなどの仕組みを実現する技術の総称です。
金融取引や既存業務において取り扱われるデータの秘匿性を確保するために広く利用されている従来の暗号技術(公開鍵暗号やデジタル署名など)を利用した場合、上記のような分析や検証などの処理を行うためには、データの内容を見ることができる(すなわち秘匿化されていない)状態となっている必要があります。従って、分析や検証などを行う環境によっては、外部へのデータ漏えいが懸念されます。
一方、プライバシー強化技術を利用した場合、データを秘匿化したまま分析や検証などができるため、外部へのデータ漏えいを防ぐことができます。そのため、例えば、金融機関における既存業務の一部をクラウド上で提供されているサービスへ外部委託することによるコスト削減や、複数の組織間でデータを共有・活用することによる新たなサービスの創出などが期待されます。
ここで、本記事で注目するPETsとその概要を図1にまとめます。以降の章では、それぞれの技術の概要について説明します。
金融取引や既存業務において取り扱われるデータの秘匿性を確保するために広く利用されている従来の暗号技術(公開鍵暗号やデジタル署名など)を利用した場合、上記のような分析や検証などの処理を行うためには、データの内容を見ることができる(すなわち秘匿化されていない)状態となっている必要があります。従って、分析や検証などを行う環境によっては、外部へのデータ漏えいが懸念されます。
一方、プライバシー強化技術を利用した場合、データを秘匿化したまま分析や検証などができるため、外部へのデータ漏えいを防ぐことができます。そのため、例えば、金融機関における既存業務の一部をクラウド上で提供されているサービスへ外部委託することによるコスト削減や、複数の組織間でデータを共有・活用することによる新たなサービスの創出などが期待されます。
ここで、本記事で注目するPETsとその概要を図1にまとめます。以降の章では、それぞれの技術の概要について説明します。
【図1】PETsの概要
『デロイト トーマツ 金融ビジネスセミナー2021講演資料』より引用
フェデレーテッド分析
従来、機械学習においては、モデルの学習に利用するデータセット(データの集合)は、当該学習を行う環境(データベースなど)に集約されていることが前提となっていました。そのため、複数の組織が協力して所持するデータセットを利用してモデルの学習を行う場合、それらのデータセットを一箇所に集約する必要がありました。
また、一般的に、モデルの学習を行うためには、データセットの内容を見ることができる(秘匿化されていない)ことが求められるため、学習を行う環境の状況によっては、データセットの漏えいリスクが課題となっていました。こうした課題を解決する技術がフェデレーテッド分析です(※1)。
フェデレーテッド分析は、複数の異なる箇所に分散して管理されているデータセットを一箇所に集約することなく、それらのデータセットの特性を反映した学習モデルを生成できる技術です。こうして生成した学習モデルを各組織で共有することにより、データセットの秘匿性を確保したままそれらに基づく学習モデルのみ共有できるというメリットがあります。
例えば、複数の金融機関がフェデレーテッド分析を利用して、アンチマネーロンダリング業務で使用する学習モデルを生成・共有することにより、不正な取引の検知精度の向上や、不正でない取引に対するアラートの削減など、当該業務の高度化や効率化といった効果が期待されます。
また、一般的に、モデルの学習を行うためには、データセットの内容を見ることができる(秘匿化されていない)ことが求められるため、学習を行う環境の状況によっては、データセットの漏えいリスクが課題となっていました。こうした課題を解決する技術がフェデレーテッド分析です(※1)。
フェデレーテッド分析は、複数の異なる箇所に分散して管理されているデータセットを一箇所に集約することなく、それらのデータセットの特性を反映した学習モデルを生成できる技術です。こうして生成した学習モデルを各組織で共有することにより、データセットの秘匿性を確保したままそれらに基づく学習モデルのみ共有できるというメリットがあります。
例えば、複数の金融機関がフェデレーテッド分析を利用して、アンチマネーロンダリング業務で使用する学習モデルを生成・共有することにより、不正な取引の検知精度の向上や、不正でない取引に対するアラートの削減など、当該業務の高度化や効率化といった効果が期待されます。
【図2】フェデレーテッド分析のイメージ
(※1)この技術は、機械学習と親和性の高い技術であるため、フェデレーテッド学習と呼ばれることもあります。
差分プライバシー
一般に、社内でデータを分析する場合、データそのもの(秘匿化されていないもの)を用いて分析を行います(※2)。
しかし、データの分析を外部の高度な分析ノウハウを有する企業へ委託する場合や、顧客企業に情報提供する場合などに、データそのものを渡してしまうと、当該外部企業からのデータ漏えいリスクや、目的外利用されるリスクが課題となります。こうした課題を解決するのが差分プライバシー技術です。
この技術は、分析結果に影響を与えない程度の加工(ランダムな値の付加など)を行うことにより、元のデータの秘匿性を確保したまま、ほぼ正しい分析結果を得ることができるものです。この技術を、例えばアンケートで利用した場合、アンケート回答者の真の回答を加工して秘匿にしつつ、集計結果を得ることが可能となります。
(※2)暗号化したデータはほぼランダムな値となっており、当該データの特性を表していないため。
しかし、データの分析を外部の高度な分析ノウハウを有する企業へ委託する場合や、顧客企業に情報提供する場合などに、データそのものを渡してしまうと、当該外部企業からのデータ漏えいリスクや、目的外利用されるリスクが課題となります。こうした課題を解決するのが差分プライバシー技術です。
この技術は、分析結果に影響を与えない程度の加工(ランダムな値の付加など)を行うことにより、元のデータの秘匿性を確保したまま、ほぼ正しい分析結果を得ることができるものです。この技術を、例えばアンケートで利用した場合、アンケート回答者の真の回答を加工して秘匿にしつつ、集計結果を得ることが可能となります。
(※2)暗号化したデータはほぼランダムな値となっており、当該データの特性を表していないため。
秘密計算
従来の暗号技術(公開鍵暗号、共通鍵暗号)においては、暗号化したデータに対して分析などを行う場合には、一度データを見られる(秘匿化されていない)状態に復号する必要がありました。
そのため、これまでの事例と同様、分析などを行う環境の状況によっては、データ漏えいリスクが課題となります。こうした課題を解決することができる技術として秘密計算があります。秘密計算は、暗号化したデータを復号せずに分析などの処理が可能な技術です。秘密計算を利用することにより、外部の企業/クラウドサービスなどへデータの秘匿性を確保したまま、分析業務を委託できるため、当該業務の業務コスト/システムコスト削減が期待されます。
秘密計算には、秘密分散型と準同型暗号型の2つの実現手法が存在します。これらの手法はそれぞれ、実現できる処理の複雑さや処理速度においてメリット・デメリットがあり、利用するシステム環境や処理の内容に応じて方式を選択するのが望ましいです。
そのため、これまでの事例と同様、分析などを行う環境の状況によっては、データ漏えいリスクが課題となります。こうした課題を解決することができる技術として秘密計算があります。秘密計算は、暗号化したデータを復号せずに分析などの処理が可能な技術です。秘密計算を利用することにより、外部の企業/クラウドサービスなどへデータの秘匿性を確保したまま、分析業務を委託できるため、当該業務の業務コスト/システムコスト削減が期待されます。
秘密計算には、秘密分散型と準同型暗号型の2つの実現手法が存在します。これらの手法はそれぞれ、実現できる処理の複雑さや処理速度においてメリット・デメリットがあり、利用するシステム環境や処理の内容に応じて方式を選択するのが望ましいです。
ゼロ知識証明
一般に、ある個人に紐づいているさまざまなデータが持つ属性(年齢や収入など)が一定の条件を満たしていること(例えば、年収が500万以上)を第三者が確認するためには、それらを証明するための情報(例えば源泉徴収票のコピーや銀行口座の給与振込情報など)を第三者へ開示する必要があります。
ゼロ知識証明は、こうしたデータの内容を明かすことなく(秘匿化したまま)、そのデータが持つ属性が一定の条件を満たしていることを数学的に証明できる技術です。
例えば、賃貸物件の契約の際、借主が不動産会社に対して「年収が500万円以上」であることを証明する必要がある場合、借主は自身が口座を持っている銀行から上記条件を満たすことの証明をゼロ知識証明の仕組みを利用して発行してもらった後、不動産会社へ証明のみを提出します。不動産会社は、借主が上記条件を満たすことを銀行が発行した証明のみを検証することで確認でき、借主の個人的なデータは秘匿することが可能となります。
ゼロ知識証明は、こうしたデータの内容を明かすことなく(秘匿化したまま)、そのデータが持つ属性が一定の条件を満たしていることを数学的に証明できる技術です。
例えば、賃貸物件の契約の際、借主が不動産会社に対して「年収が500万円以上」であることを証明する必要がある場合、借主は自身が口座を持っている銀行から上記条件を満たすことの証明をゼロ知識証明の仕組みを利用して発行してもらった後、不動産会社へ証明のみを提出します。不動産会社は、借主が上記条件を満たすことを銀行が発行した証明のみを検証することで確認でき、借主の個人的なデータは秘匿することが可能となります。
【図3】ゼロ知識証明のユースケース
おわりに
本記事の冒頭でも述べたとおり、近年、さまざまな分野におけるクラウドの普及や、分散台帳技術(ブロックチェーンなど)の利用検討の推進など、異なる企業や業種間でのデータ共有・活用の基盤が整備されつつあります。また、こうした環境でやり取りされるデータのセキュリティ/プライバシーの確保が可能となるPETsについても、研究開発が活発化しているほか、実用化に向けたソリューションの提供も始まっております。
そのため、企業・業界を超えたデータ共有・活用により、ビジネスに新たな価値を創出し、大きなイノベーションに挑戦する時が到来したと考えております。
そのため、企業・業界を超えたデータ共有・活用により、ビジネスに新たな価値を創出し、大きなイノベーションに挑戦する時が到来したと考えております。
【この記事を書いた方】
有限責任監査法人トーマツ リスクアドバイザリー事業本部
FSIリスクアドバイザリー マネジャー
清藤 武暢(セイトウ タケノブ)さん
日本銀行において、主に新たな情報技術(暗号技術、量子コンピュータ、機械学習など)が金融サービスへ与える影響やその対策に関する調査研究業務に従事。その後、2019年9月より有限責任監査法人トーマツへ転職。転職後は、主に金融サービスへのPETs(フェデレーテッド分析、秘密計算、ゼロ知識証明など)の利活用にかかる調査研究やアセット開発などの業務に従事するほか、PETsの啓蒙活動を積極的に推進。2020年10月より、横浜国立大学先端高等研究院客員助教を兼務。博士(工学)。
有限責任監査法人トーマツ リスクアドバイザリー事業本部
FSIリスクアドバイザリー マネジャー
清藤 武暢(セイトウ タケノブ)さん
日本銀行において、主に新たな情報技術(暗号技術、量子コンピュータ、機械学習など)が金融サービスへ与える影響やその対策に関する調査研究業務に従事。その後、2019年9月より有限責任監査法人トーマツへ転職。転職後は、主に金融サービスへのPETs(フェデレーテッド分析、秘密計算、ゼロ知識証明など)の利活用にかかる調査研究やアセット開発などの業務に従事するほか、PETsの啓蒙活動を積極的に推進。2020年10月より、横浜国立大学先端高等研究院客員助教を兼務。博士(工学)。