https://www.boj.or.jp/research/bigdata/index.htm/
広がり始めたオルタナティブデータの活用
和泉さん(東京大学) まず金融機関が資産運用やトレードに使いたいというニーズがありそこからオルタナティブデータに関する共同研究をいくつか始めています。有価証券報告書、決算短信などのテキストデータと経済指標などの関係を人間がどう認識しているかを明らかにするところから始まりました。その後テーマが徐々に他のオルタナティブデータにシフトしていきました。
テキストや画像などを含む非構造化データ(※2)の特性を持ったオルタナティブデータと数値データを中心とした構造化データ(※3)であるトラディショナルデータを組み合わせることで経済状況を分析しています。10年前であれば構造化データを機械学習させ何らかの予測をしていましたが、近年はオルタナティブデータを含めデータのバリエーションが広がっています。またここ数年で金融機関以外の企業でも非構造化データを使いたいというニーズがありトレンドが変わってきています。
(※2)非構造化データ:音声や画像、自然言語など構造化されず使用時まで処理されないデータ
(※3)構造化データ:あらかじめ定義され、ある定められた構造となるよう成形されたデータ
資産運用にオルタナティブデータを活用して的確な予測ができた場合のリターンはたいへん大きいです。一方、通常の融資など現在の低金利の時代では、収集や活用にコストがかかるオルタナティブデータを大々的に活用する投資は難しいです。そこでさまざまなセンサーからのデータもオルタナティブデータとして活用することを一般化し、これをセンシングファイナンスとして提唱しています。構造化データと非構造化データを組み合わせるというところだけではなく、例えばこれまで使ってこなかった構造化データを使って、金融事業を高度化するためのビジネスができないかということを考えています。
(※4)センシングファイナンス:金融機関が今まで利用してこなかったデータを取り込むことで、新しいサービスを生み出したり、既存サービスを高度化したりすることを指すNTTデータの造語
山本さん 和泉さんは資産運用の高度化をきっかけにオルタナティブデータの活用を開始され、多くのデータを分析の対象としていることがわかりました。私たちは、金融事業全般を高度化、一般化するためにオルタナティブデータを含めた多くのデータを分析対象としています。きっかけは異なりますがよく似た活動ですね。
和泉さん 市場や消費者のニーズも研究開始当初から変わってきています。最初はクレジットカードの利用傾向など経済・金融との関連性が明らかで勝ち筋が見えるテーマを分析したいというニーズが多くありました。現在は一見しただけでは勝ち筋が分かりにくくても企業が持っている複数データを組み合わせて新しい価値を出していきたいというニーズが高まっています。複数のデータの融合は最近のトレンドと言えます。
山本さん 金融機関がサプライチェーンに関心を高めていることを感じています。自社にある利用していないデータだけでなく、自社にない取引先のデータを能動的に取りに行く動きをしないと取引先の状態が分からないのです。そこにグリーンなどの環境保護に対する動きも加味されてきます。サプライチェーンの中にあるCO2の排出量にも関心を持つ必要があります。技術的にもデータがあればいろいろとできるという確信も出てきています。
和泉さん データのサイズと種類が増えたことで、企業間の関係がデータ分析を通じてリアルにわかるようになってきており、リスクを予見したいという動きもあります。
山本さん 中小企業のデータ活用やデジタル化の程度はなかなか差がある状態です。その差を、融資などのサービスでどのように吸収して同じように扱っていくかという課題はありますね。
── 多種多様なデータの活用が期待されます。実務に有効なオルタナティブデータとしてどのようなものをお考えですか?
山本さん 3-40年くらい前の銀行員は取引先に行って非財務情報を集めてくることが重要な仕事でした。経営者の顔色とか、オフィスの整理され具合などです。それを貸倒率と結び付けて考えるようなノウハウがありました。このような融資のノウハウをデジタルデータで補うような流れが出てきています。法人、個人の実態を表象しているものであればいかなるものでも、オルタナティブデータとして有効となりえます。
データをスカウトする役割
和泉さん さまざまなレイヤーで社会は変わるでしょう。データを確認することで社会のあらゆる場面でフィードバックのサイクルが高速に適切に回せます。個人の消費傾向や企業の経営方針を変化させることで何が起きるかすぐにフィードバックが得られます。その時に組織の中で人間が求められる価値が大きく変わります。例えば、決まりきった統計的な処理を得意とする人のパフォーマンスの価値は大きく下がるでしょう。
これまで使っていなかったけれど、これから使えそうなデータを探してきて試行錯誤を通じ新たな手段を作る人の価値は上がると思います。データをスカウトする能力、データスカウトと言っていいと思います。海外の金融機関では、アメリカン・フットボールのチームのように役割が分かれています。データを探す(データスカウト)、データを処理する人、データを分析する人などの役割です。統計も一般化した技術を使い続けるのではなく最新の技術に精通している必要があります。さらにデータをスカウトし絶妙なおもしろいデータを見つけてくることができる人の価値がぐっと上がります。
和泉さん 収集するオルタナティブデータによって苦労する点は変わります。ケースバイケースです。半分もデジタル化できていない状態のものあります。紙に表が書いてありこれを読み取ってほしいという要望もあり、OCRを使うところから始まるものもあります。管理上セキュリティが高いデータを扱うこともあり、記録媒体を持ち込めない鍵のかかる部屋で分析することもありました。活用面で苦労することは「データは社内にあるのですが、これを何かにうまく使えませんか?」というご要望です。これはとても苦労します。こちらからは「何かやりたいことがあるのですよね?」というニーズの探索から始まることになります。
山本さん ビッグデータというワードが出た時からそういったことはありますね。社内にデータあるから何か分析してください。でも目的がないと何ともできないんですよね。企業の上層部からのオーダーだけを重視して実施しているとこういうことになります。
和泉さん 企業がお持ちのデータを使って、できることを擦り合わせていくというのが大事だと思います。またデータがあってもそのデータに偏りやバイアスがある場合も苦労します。偏りやバイアスを補うもの、分析手法や別のデータは何かを探すのが大事です。データ数は十分あることを主張されてもデータに偏りがあり、ご希望の分析ができないこともあります。例えば、短期のトレーダーの分析をしたいのに、保持している資産運用のデータは長期保有をなさっている方のデータしかないといったようなケースもありました。
山本さん データが現在あるこのカタチに至ったインセンティブや経緯を考慮することが大事ですね。アンケートデータだと年齢をきちんと入力して欲しいけど、一番押しやすいところにチェックを入れてしまうこともあり、データ入力のインセンティブを考慮したデータの成り立ち方にも注意を向ける必要はあるでしょう。誤ったデータを入力する強い悪意があるわけではないけど間違ったデータが入っていることもあります。これに最初に気付くのはとても難しいです。困っていたのはオイルショックの時期のデータをどのように分析の対象とするかでした。このまま使うか、平年並みのデータで補正して埋めるのかという点は悩みました。意図せずに適当でない偏ったデータを使っていることはそれなりにあると思います。
和泉さん データを調べるときに、その業界なりに経験が豊富な方と協力する場合はおもしろい分析ができます。生鮮食料品の物流を見たいときに、小売業の業務視点だけで見ると適切なデータ分析ができないことがあります。卸売業などの事情やロジックが価格に影響を与えることもあります。畑などの生産地からスーパーまでの一連の流れに詳しい人がいると、必要なデータについてしっかり議論できます。
── 業務に沿った分析を行うためのデータの取得が重要であることについてお話しいただきました。金融分野では、どのような領域でオルタナティブデータの活用が期待されていますでしょうか。
山本さん 金融機関のトップラインに効いてくるところでのオルタナティブデータの活用が最も大きいです。また利益の改善でもオルタナティブデータは活用されます。金融機関は社内データを用いた利益改善などの対策は行っており企業内で改善できる点は既に実施している認識をお持ちです。さらなる改善を求め金融機関が別の法人や取引先のデータを活用するニーズは今後増えてくると思われます。
オルタナティブデータの構造化とサステナビリティ
和泉さん 最も必要なのはオルタナティブデータ同士の構造化だと思います。Webに例えると、現在のオルタナティブデータはハイパーリンクがなく、Webサーバーだけが別々に乱立している状態です。A社のオルタナティブデータとB社のオルタナティブデータの関係を明らかにするような構造化が必要です。あるデータ群は広くて浅いデータ特性だが、別のデータは狭いが深いなど、データ間で特性が異なる場合があります。こうした補完関係も含めた構造化がないとオルタナティブデータ活用は持続しないでしょう。
経済指標の中に、人の移動を捕捉するためのGPSのデータを利用していた場合に、もともと利用していたGPSのデータが使えなくなると、経済指標の発表自体が終わることもあります。使えなくなってしまったオルタナティブデータの代替をするオルタナティブデータを探すためにも構造化が必要です。こうした構造化がないと、あるデータが取得できなくなった際の継続性がないことになり、利用もはばかられると思われます。
和泉さん 電気の使用量が分からなくなったら従業員の移動データをGPSから取得するなどの代替手段をとることができます。あるデータが取得できなくなった時に補完できるし、複数のデータがあればより精度の高い分析ができることも考えられます。あるデータの裏取りを別のデータでして付け合せることでより高い信頼性が得られることも想定できます。
山本さん オルタナティブデータのサステナビリティという観点ですね。ビジネスの継続性の観点からも継続的な使用を考えることは必要です。Web連携やAPI連携で起きている事象と近い印象がありますね。APIを利用する側、される側の仕様変更の影響がものすごく大きくなることがあります。構造化というアプローチで解決されることもありますが、それに加えデータの作られ方がどうであったのか、データの持つ意味を表現するセマンティクス、オントロジーなど、データの収集時にメタデータ的なものを考慮することの重要性を改めて認識しました。これによりデータの取得の状態がおかしくなった時に気づくとともに代替プランをしっかり作ることができますね。
オルタナティブデータが「ザ・データ」となる時代
山本さん オルタナティブデータをオルタナティブデータと言わない世界が到来すると思います。金融機関はお金を流通させる上で情報を一か所に集めた方が効率的なので今の金融機関の形になっています。しかし現在は単純にお金を分配する機能そのものに価値がなくなり始めています。金融機能がなくなるわけではないですが、情報の精査、情報の再構成をして付加価値を作っていく必要があります。
そうしないと融資はクラウドファンディングで実行されるなど、決済のフロントは銀行でなくてもよくなる可能性があります。情報をどう集め、どう使うのだという発想を入れないと、ビジネスの優位性を持つことができなくなるかもしれません。お金の流通だけでなく、情報の流通が必要となりその実現が、将来の金融の機能に影響すると思います。
和泉さん 金融も含めた社会活動全般において、今オルタナティブデータと呼ばれているものが「ザ・データ」(普通に使われるデータ)として広まることで、データの活用が原点回帰すると思います。現在は、投資ひとつとってもデイ・トレーディングのようにテクニックでトレードする方向に向かっています。投資の原点とは、自分が生活を通じて知っている産業について、この企業はこういう技術持っているんだよね、とかそういうことを考えながらストーリーを考えて投資をしていた状態です。ごく短期ではなく、1年後2年後どうなるかをデータを使って考える、そういうところに回帰するのではないかと思います。
山本さん 現在、感染症拡大の状況で非対面が増えていますね。その分対面の機会が減少しており、逆説的に対面の価値は上がっています。貴重な対面の機会をより有効に活かすためにオルタナティブデータ、「ザ・データ」をうまく使うような社会になると思います。
和泉さん 対面でやるところもあれば、非対面で行動ログとか、自分が気づかないところからその人にマッチする行動を提案する感じになるでしょうね。対面/非対面両方あって補完してくイメージです。自分が何年後に結婚するというようなライフデザインがあって、それに直結する形で投資できるようにあらゆるデータを活用していくことが一般化するといいですね。これまで直感的に行っていた行動のひとつひとつをエビデンスで導いて生活の質を上げていくような、きちんとデザインされたダイエットのような活動が日常的に行われる社会が来ると思います。
── ありがとうございます。最後にさまざまなデータを駆使することになる、若い方々へのメッセージをお願いします。
和泉さん まず、個人の立場では投資などに関するテクニックを駆使する前に、自分がどうしたいかをしっかり考えて、データと向き合ってほしいと思います。大量のデータに溺れずに、自分にマッチするものを選び取って生活に役立てていく、そういう原点回帰をしてほしいですね。
山本さん 和泉さんのおっしゃる通りです。オルタナティブデータが「ザ・データ」となり、データがどう扱われるかを知るという基礎的な学びをしないと騙されてしまうこともあり得ます。お客様が「この業務は紙でやっているので紙でやってください」と言っているからといって紙でやり続ける必要はありません。世の中がデータ中心の世界になるので、紙の利用を早くやめたほうがいいということを知っている上でお客様の業務に提言をしないと、有効な助言ができません。本質的なデータの活用を広めていってほしいと思います。
<執筆者:神戸 雅一>
東京大学大学院 工学系研究科 システム創成学専攻 教授
1998年より2010年まで電子技術総合研究所(現 産業技術総合研究所) 勤務。2010年より東京大学大学院工学系研究科 システム創成学専攻 准教授、2015年より同教授。金融情報学、経済社会データ分析や金融市場シミュレーションを研究テーマとしている。
NTTデータ 金融事業推進部 デジタル戦略推進部長
NTTデータ入社後、システム開発を経験した後、金融機関のITグランドデザインなどの多くのコンサルティング案件に従事、現在は金融分野でのITトレンドの情報発信からITグランドデザイン・先進技術領域(AI、ビッグデータ、RPA、クラウド、量子コンピュータ)のコンサルティングなど幅広く担当。
※記事中の所属・役職名は取材当時のものです。
※感染防止対策を講じた上で取材を行っています。