Aflac innovation Lab

MEMBERS

2022.02.21

アフラックのデータサイエンティストたちが目指す、持続可能性のあるデータ分析組織とは

データ分析においては、日々収集される膨大なデータを統合的に管理しながら、いかにして継続的に高いパフォーマンスを発揮できるかが重要課題のひとつです。

アフラックには2,400万件超の保有契約が存在し、膨大な量の顧客データが蓄積されています。それらのデータを活用するため、アフラックのデータサイエンティストチームはどのような考えのもと、どのようなデータ分析環境を構築しているのでしょうか。

アフラックでデータ分析・AIモデル開発およびその開発基盤の構築を担う、データサイエンティストの松田康隆さんに話を聞きました。

PROFILE

デジタルイノベーション推進部
データアナリティクス課
データサイエンティスト
松田康隆

大手監査法人にて、公認会計士として外資系金融機関の会計監査・内部統制監査を担当。その後、外資系コンサルティング会社にて、主に金融機関に対するデータ分析・モデル開発・ツール構築・ITシステム導入支援等を数多く実施。2019年11月よりアフラックに入社。データサイエンティストとして社内外の広範なデータの解析やAIモデル開発、その開発基盤の構築を担う。

------------------------------------------------------------

データ分析環境は社員主導でつくる

——松田さんは、データ分析だけでなく、開発環境の整備も担っていらっしゃいますが、アフラックではどのようなデータ分析環境を構築しているのでしょうか?

基本的にはMLOpsなど、データサイエンスの世界でグローバルスタンダードとなっているアプローチを採用しています。

例えば、ソースコードは資源管理サーバ上に集約し更新管理を徹底するとともに、本番環境へのリリース判定も機動的に行っています。またAIモデル管理については、学習実行者や学習に使ったデータ、設定したパラメータ、精度指標等を統一的に管理し、管理状況を可視化できる仕組みを作っています。

——品質管理の仕組みづくりを徹底されているのですね。

はい。管理の甘さから誤ったソースコードやモデルが独り歩きしてしまうことを避けるため、様々なツールを活用して、管理主体やステータスが明確になるようにしています。また個別プロジェクトでの開発内容の汎用化・横展開も促進しています。

これらの手法は、システム開発の現場では当然の仕組みだと思われるかもしれませんが、私の経験上、我々のようなDX組織において実現できている企業はまだ少ない印象です。

——そうなんですね。つまり、その実現は容易ではない。一体なぜでしょうか?

一つは、DXの取り組みの特性にあると思います。

最近ではDXの重要性が広く認識され、多くの企業が我々のようなDX組織を設立し、全社的なデータ活用を目指した取り組みを進めています。しかし、データの仕様や粒度がまちまちであったりメンバーの入れ替わりが激しかったりするため、取り組み間に横串が通らず、個々の取り組みでサイロ化しがちです。

また、DXにおいてはビジネス部門の要望に応じて試行錯誤を繰り返すアジャイル的なアプローチをとることが多く、その結果大量の中間生成物が作成され、誰が管理しているのか不明確なモデルやモジュールが氾濫してしまうのです。

もう一つは、自社の統一的な仕組みを構築しづらい組織体制もあると思います。これはDX組織の立ち上げ時、データを保有する企業に分析の知見がなく、全てを外部コンサルティング会社に委託してしまう場合に起こりやすい問題です。

各ベンダーの流儀で分析やモデルの管理が行われるため、自社の統一的な方法論や仕組みが定着せず、その結果様々な形式のデータやモデルが乱立してしまったり、ベンダー交代により管理主体が曖昧になったりしがちです。

そのような環境だと、データ分析の開始に時間がかかったり、過去に実施したものと同内容の分析を繰り返したりして、結果、データサイエンティストが価値を発揮しにくい状況になってしまいます。

アフラックでも複数のコンサルティング会社にパートナーとしてご協力いただいていますが、データ分析環境は極力統一し、アフラックに適した環境・プロセスの構築を進めています。

------------------------------------------------------------

誰もがパフォーマンス発揮できる「再現性」ある環境づくり

——そうした環境は、当初から徹底していたのでしょうか?

そんなことはありません。アフラックでDX組織が発足しデータ分析チームが立ち上がった当初は、社員のデータサイエンティストは少なく分析基盤も整備されていなかったため、個々のプロジェクトでの単発的な開発が中心でした。

私含め新しいメンバーが加わるたびに、そのメンバーの経験値を付け足したり、最先端のプラクティスを取り入れたりして、徐々に整えてきたという感じです。

その際はガラパゴス化した仕組みにならないよう、できるだけ業界の先進的かつ標準的なプラクティスを参照しています。

——その背景には、どのような意図があるのでしょうか?

新たに参画するデータサイエンティストが、初日からパフォーマンスを発揮してもらえるようにしたいと考えています。

データ分析では、分析環境やプロセスが整備されていないと、過去の経緯や属人化した情報にキャッチアップしなければパフォーマンス発揮できないということがあります。そういう組織にならないよう、一人ひとりが意識高く取り組んでいると思っています。

——そこに共通意識があるのは素晴らしいですね。

アフラックにいるデータサイエンティストの多くは中途入社メンバーです。管理主体が曖昧なデータやモデルが散在しているような分析環境では、価値発揮まで時間がかかってしまうということを全員が認識しています。

だからこそ、「次にジョインする人に初日からストレスなくパフォーマンスを発揮してほしい」という思いをみな共通で持っているのだと思います。

——みなさんがデータに真摯に向き合っているのが伝わってきます。

私自身、データ分析業務に向き合うにあたっては「再現性」や「汎用性」が大事だと思っています。

誰かが「私の経験上こうだと思います」とか「なんとなくそう思います」と言って結論を出すようなアプローチを取るなら、わざわざデータ分析チームを立ち上げた意味がありません。

データとロジックに基づく再現性の高い推論によって結論を出すことで、社内外へのステークホルダーへの説得力が増しますし、ダイバーシティ向上にもつながっていくと思っています。そのために、情報の属人化・暗黙知化を極力避けるような環境づくりを心掛けています。

------------------------------------------------------------

本当のビックデータに向き合うために

——松田さんは以前、コンサルティング会社で金融機関向けのデータ分析支援を担当されていたそうですが、なぜアフラックに転職されたのですか?

コンサルタントは良くも悪くも、参画するプロジェクトのサイクルが短いことが多いです。ひとつのクライアントを半年間担当したら、次の半年はまた別のクライアントというように、コンスタントに担当先が変わります。

扱うデータの幅と量は増えるので、多様な経験を積むという意味では良いのですが、その分、ひとつの企業やデータと深く向き合う経験が不足しがちです。個人的に、目標に対して腰を据えて取り組む機会やメンタリティを失ってしまっているような感覚がありました。

また、コンサルタントという立場では、触れるデータに限りがある場合も多いです。クライアントは必ずしも、自社の重要データを全て開示してくれるわけではありません。そのためデータ分析の自由度が低く、データ活用の検討や提案の可能性が拡げにくいと感じたことがありました。それであれば一度事業会社に転職して、腰を据えてデータに向き合おうと決めました。

——アフラックの決め手は何だったのでしょうか?

保有契約件数にして2,400万件超と、膨大な顧客データが存在していること。これはデータサイエンティストにとって、非常に魅力的でやりがいのある環境だと思いました。

——まさにビッグデータ。アフラックでデータ分析するようになって、いかがですか?

これまで活用できていなかったデータも数多く存在しますし、データサイエンティストとして価値発揮しやすい環境だと感じます。データを掘り起こして付加価値をつけることでビジネスに貢献していくことに、やりがいを感じています。

例えばデータに基づいて新商品の戦略を立て、発売開始時からリアルタイムで更新されるデータを即座に分析し、その結果を販売サイドにフィードバックして次の一手に役立ててもらう。そうしたスピード感や影響力の大きさからくる面白さは常に実感しています。

------------------------------------------------------------

データ活用でビジネス利益を生み出すために

——アフラックにデータサイエンティストとして、今後力を入れていきたいこと考えていることはありますか?

データ分析環境をより高度化していく方に軸足を向けています。

例えば、計算資源についてです。多くの企業がそうであるように、アフラックもデータ分析基盤をクラウド上に構築しているのですが、膨大な契約件数がある上に、そこに日々、契約異動や顧客コンタクト情報など多種多様なデータが上乗せされていきます。

よって、何をするにしても計算リソースへの負荷が高くなりがちで、その結果、必要な時にCPUやメモリなどの計算資源が足りずモデルを即時に実行できないということもあります。

これに対処するため、動的な計算資源確保の仕組みを導入するなど、より効率的で先進的な分析インフラ環境を作っていきたいと考えています。

あともう一つ。アフラック内での発信も強化して行けたらと思っています。

——アフラック内での発信の強化とは、どういうことですか?

データ分析結果やAIモデルを、日常のビジネスの中で社員や代理店にもっと活用してもらうためには、アフラック社内での情報発信や、興味を持ってもらえる仕組み、気軽に使ってもらえる仕組みが必要だと思っています。

例えば、社内システムからAPI経由で誰もが自由度高くモデルを使えるようにするなど、データ活用を社内に浸透させる仕組みづくりも充実させていきたいと考えています。

——そうした仕組みがあると、データドリブンなビジネスが加速しそうですね。そうしたデジタルイノベーションをもたらすために、どんなデータサイエンティストを求めていますか?

データ分析で価値発揮する以上、どの領域でもある程度のドメイン知識は必要になるので、向学心やビジネスに対する好奇心の強さは重要です。

一方で金融機関である以上、常に情報セキュリティや個人情報保護が最優先事項として求められるので、そういった事柄に対応する粘り強さも大事ですね。

とはいえ、基本的にはデータサイエンスのスキルさえあれば、多様なバックグラウンドの方が活躍できるような環境を作っています。アフラックに蓄積された膨大なデータの分析がもたらす社会的な意義は非常に大きいと感じているので、ぜひ仲間になってもらいたいですね。

  • TOP
  • MEMBERS
  • アフラックのデータサイエン...