2021.10.1

データドリブンにビジネスを推進!
AIを用いたデータ利活用はどう進めて行けばいいのか?

「データの利活用を推進せよ」と言われているが、どう進めていけば良いかご検討されている方へ、AIを用いたデータ利活用に関する2つのポイントを解説

AIを用いたデータ利活用はどう進めて行けばいいのか?

AIを用いたデータを分析/活用に必要不可欠な2つのポイント

ISIDでは、2016年からAI/データ分析専任組織を作り、多くのAI/データ活用のプロジェクトを推進してきておりますが、「AIを用いてデータを分析/活用し、データドリブンにビジネスを推進していきたいけど、どう進めて行ったら良いか?」というような相談をよくいただきます。

本コラムは、そのようなお客様向けのコラムとなります。

まず結論からいいますと、以下の2つがポイントです。

ポイント1.データサイエンスそのものの考え方を相互理解し、お客様のビジネス状況を踏まえて、データサイエンスの知見が豊富なメンバーが、お客様とOneチーム(データサイエンス:DSチーム)を作ること

ポイント2.DSチームはビジネスを踏まえて、まずは実データを元にやってみること。やった結果を踏まえて、次に進むべき道を考え、提言することを繰り返し、前進していく

それぞれ、説明していきます。

データサイエンスそのものの考え方を相互理解したOneチーム

ポイント1.に関して、まずAI/データ活用において、優秀なデータサイエンティストがいれば、それで企業のデータ活用が推進されるでしょうか?それだけではなかなか難しいと言えます。

以下の図をご覧ください。

データサイエンスそのものの考え方を相互理解したOneチーム

AI/データ分析は、データと目的から、分析手法やデータ加工処理方法が決まります。そのため、データを価値に変えるためには、目的や課題設定の明確化と、対応するデータ準備を並行して検討することが重要です。例えば、ビジネスの戦略を決めるためのデータ分析と、判定を自動化するAI、それぞれ利用するデータも、手法も全く異なります。

AI/データ活用では、ビジネス的に実現すべきことが複数出てきます。その複数実現したいことに対して、「どのような技術を利用すると素早く確実に実現出来るか」、「この仕組みを作ればこれもこれも同じように実現出来ることで、コスト的に実現可能になるのか」など、ビジネスの観点と技術の観点を並行して検討していくことが重要です。

逆の観点で、技術だけはなんとかできました、しかし実現するのには非常にコストがかかりますという話だと、実施したけど結局ビジネスには何も貢献しませんでした、ということになってしまいます。したがって以下のような、大きく2つのタイプ・ 4種類の人材が、データサイエンスプロジェクトには必要となります。

データ活用に必要な2つのタイプ・ 4種類の人材

このような人材が、社内で充足されるのであれば問題ないですが、社内では十分なスキルの人材がいないお客様が多いです。そのため、②のエンジニア部分や、①のプロジェクトマネージャーを支援するPMOの部分を、外部ベンダーに支援依頼するということが、データドリブンにビジネスを推進していくには有効です。

まずはやってみて。やった結果を踏まえて、次に進むべき道を考える、を繰り返しながら前進

次はポイント2に関してです。AI/データ活用は、通常お客様が用意出来るデータに対して分析するアプローチになるため、やってみないとお客様の期待値に届くかわからないということです。

具体的には、例えば、ある製品の需要予測を実施したいとします。与えられた学習データ、例えば過去3年分のデータを元に予測しようとしたときに、その予測誤差が何パーセントになるかは、実際にAIモデルを作って、実施してみないとわかりません。

AIモデルの予測してみたときに、最大誤差が4%だったとします。その4%という誤差は、実際に該当業務で実運用できるかどうかは、お客様にとって、許容範囲なのか、許容範囲では無いのか、お客様の中の皆様(例えば、推進チームはOKだと思っても、現場の実担当者はNGとか)の判断によりますし、お客様の業務フローにもよります。

分かりやすい例としては、二人体制でダブルチェックしていた業務に対して、一人をAI、一人を人間がチェックするという業務フローにすれば、AIの結果が100%でなくても、問題なく業務に適用できた事例もあります。

そのような背景を踏まえると、AI/データ活用は“探索的段階型”なプロセスで進めることが重要です。

一般的には、CRIPS-DM(Cross-industry standard process for data mining)やTDSP(Team Data Science Process)と呼ばれているプロセス(そんなプロセスがあるんだなというような理解で十分です)で進めましょうという話があります、このような内容は、経産省のAI・データの利用に関する契約ガイドラインでも記載されています。

データ利活用におけるAIプロジェクトの進め方

つまり、AI/データ活用のシステム構築を一括で発注というようなことは、発注側、受注側双方によって良いことではありません。各プロジェクトで、探索的段階型に進めることを前提に、実運用に向けて外部ベンダーと進めるには、以下のように複数回のステップを踏みながら推進することを推奨します。

データ利活用におけるAIプロジェクトの各ステップ

最近、PoC(Proof of Concept)に関する否定的な発言があったりしますが、弊社は、上記にあるとおり、PoCは重要なリスクマネジメントプロセスだと考えております。そもそも実現できそうな精度やコストが、ビジネスと合わなければ、そこでプロジェクトはストップできるよう考えておくべきです。

PoCを行う前の課題設定や、そもそもProofしたいConceptの定義がきちんとなされておらず、問題がある状態でプロジェクトを開始し、実施したけど、どのような内容をどう評価しようかがわからないまま完了してしまったというような問題プロジェクトが起こったため、一部否定的な議論に繋がっていると想像します。

ここまで本コラムをお読みいただいた皆様には、PoCを行う上で、ProofしたいConceptの定義をしっかり実施してから行って実施したPoCは、AI/データ活用を行う上で、通るべきプロセスとご理解頂けると思います。

「やってみないとわからない」なんて、ベンダー側の責任を果たしていないのでは?

まず、「やってみないとわからない」というのは、「全然できるかどうかわからない」ことではない状態に、契約前、実施してみる前にしなければいけません。それはアセスメントの部分で、お客様とコミュニケーションをとることである程度できることの検討をつけておくが必要があります。

その上で、現在与えられたデータセットに対して、トライアル&エラーして出来上がるAIモデルの精度が、90%なのか、99%でるのか、実業務の適用を考えたときに、90%で実業務適用OKなのか、99%でもNGなのか、もちろん全体の精度だけで語られることでもないので、各分類クラスの偏りに問題はないか?(この議論はそれだけで非常に長い話になるので、詳しい話はここでは割愛します)という観点で、「やってみないとわからない」訳です。

実際のお客様とのプロジェクトでは、”ビジネス的に実現すべきことが複数“あることが通常であり、その中には、PoCで良い結果がすぐ出る物もあれば、逆に結果が不充分な物も存在します。ISIDのAIトランフォーメーションセンターでは、お客様のビジネス期待値に対して十分な精度がでないような場合でも、きちっと分析を行い、それがなぜそうなっているか、どうしていけば良いか、というような“提言“をしっかりやっています。

そういう部分でも、われわれを評価していただいている部分かと思っております。

本コラムの最後に

本コラムでは、“AIも含めて、データを分析/活用し、データドリブンにビジネスを推進していきたいけど、どう進めて行ったら良いか?”という問いに対するISIDのアプローチの概要についてお話ししました。

次回のコラムでは、今回のような活動を、実際に進めるために有益である、我々のAI/データ活用メソドロジである、AusIcal(オーシカル)に関して、説明をしますので、そちらも別途見ていただけるとうれしいです。

AITCは、お客様のAI/データ活用を実運用する集団です。データ活用は、実際に活用されないとビジネスの価値には全く繋がりませんので、実運用を目指している方は、いつでもご相談ください。

執筆
AITC AIコンサルティンググループ
深谷 勇次