なぜ多くの組織が AI と機械学習について誤解しているのか

データサイエンスを最大限に活用して成果を上げるためには、できること、できないことを明確に理解する必要があります。そうでなければ、多くの時間とお金が無駄になります。

テクノロジー   |   David Sweenor   |   2022年1月24日 読了時間の目安:9
読了時間の目安:9

ビジネスのさまざまな問題を解決する万能薬として期待される人工知能(AI)ですが、必ずしもポジティブで実践的な結果をもたらすとは限りません。

今日、多くの企業が、AIや機械学習 (ML)、データ分析などを業務に取り入れていますが、その多くが「思うような導入効果を得られていない」とフラストレーションを感じています。

AI の活用が進まない理由はさまざまですが、

多くの人々が AI でできること、できないことを理解できずに苦しんでいます。 また、メディアのセンセーショナルな報道や、詳細に欠ける情報などが多くの誤解を生み出しています。 さらに、専門家を自称する人々がまことしやかに語る「データサイエンス神話」も、誤った情報が広がる元凶となっています。

AI にまつわる 8 つの誤解

1. AI は魔法のようにすべての問題を解決してくれる

AI は、収益の向上、コストの削減、不正行為の未然の特定、反復的で単調な作業の排除など、多大なメリットをもたらします。 しかし、壮大な夢を抱いて AI や ML に取り組んだ企業は、期待していたほどの価値が得られないと落胆しがちです。

AIは、一気に取り組むものではなく、徐々に、段階的に進められるプロセスであるべきです。まずは、作業プロセスの改善や顧客満足度の向上、業務プロセスの自動化といった身近なプロジェクトから始めてみることをおすすめします。時間の経過とともに社員のAIのスキルが高まれば、財務上の課題の解決など、より大きな課題に取り組めるようになります。

成果の 80% が全体の 20% から生み出されているという、パレートの法則を思い出してみてください。 目に見える効果を得られないような、細かい問題を突き詰めていく必要はありませんし、 そうした行為は、システムや社員を疲弊させるだけです。

2. 機械学習は「人間のように考えている」

人間は複雑な頭脳を備えた複雑な生物です。私たちは、日ごろから長年の経験から学んだ「経験則」を活用しています。固定観念は、物事のスピーディーな判断には役立ちますが、その判断は必ずしも正しいとは限りません。人間の思考は完璧ではないゆえに、コンピューターが人間のように考えるようになったとしたら困った事態になってしまいます。

機械学習はデータから予測を立てますが、 データの品質が低ければ、有益な結果は得られません。

ゴミを入れてもゴミのまま

機械学習は、データの偏りや、チームの思い込みを学習してしまいます。恐ろしいことに、アルゴリズム、データ、チームに存在するバイアスは、企業に大きな損失をもたらしかねません。

多くの銀行が融資の可否の判断にAIを利用しています。リスクの高い顧客、ローンを期限内に返済してくれそうな顧客などをデータによって見定めるのです。しかし、そうしたデータには多くの場合において偏りがあり、そのデータをもとにした機械学習にも判断ミスが生じることとなります。

かつて、住宅ローンを組むのは主に男性の役割でした。女性がローンを申し込んでも、経済的余裕や返済能力とは関係のない理不尽な理由で断られることが日常茶飯事でした。もしAIがそのデータを見たら、「昔の銀行は男性ばかりを優遇していた」とは考えず、「女性の方がローンを断られることが多いから、女性の住宅ローンの申し込みは断るべきだ」と結論づけてしまうでしょう。妻が夫の20分の1の与信枠しか得られなかった Apple クレジットカード騒動をご存知でしょうか。

残念なことに、女性はあらゆる指標において、男性よりも信用リスクが低いのです。 女性は期限内に返済を行い、債務不履行も少ない傾向があるにもかかわらずです。 もし銀行が精度に不安が残る ML を導入すれば、高リスクの男性に融資するだけでなく、低リスクの女性から得られたはずの収益を逃してしまうことになりかねません。

一方で、法律では性差別が禁じられています。信用度の判断に性別を考慮することは違法のはずですが、 信用貸しは女性に差別的です。

機械学習はデータから学習しますが、そのデータに欠陥や偏りがあり、客観性が失われてしまうことは珍しくありません。 ほとんどの場合、それはあからさまなものではなく、学習データセットに含まれる微妙なニュアンスが影響しています。

3. AI はプラグアンドプレイである

多ソフトウェア企業が謳うSaaSプログラムや多大なメリットを目にして、AIは便利だと思うのも無理はありません。データを入力するだけで、機械が情報を処理し、知りたいことを教えてくれますし、コーディングの知識不要で簡単に扱うことができます。

しかし、たとえ社員がこうしたプログラムのメリットを理解したとしても、その前に済ませなければならない作業は山のように存在します。

例えば、データクレンジングはデータの良し悪しを左右する重要な工程です。 誤りがあったり、不完全だったり、サンプルが少なすぎたり、不正確な情報が含まれる膨大なデータを投入しても意味がありません。

タスクの成果を理解する: 優れたデータサイエンティストは、クライアントが「ドリルが欲しい」と言ったら、実際に求められているのは「穴」であるとすぐに理解できます。また、データでそうした情報を得らえるどうかも知っています。

分野に関する知識: データサイエンスの業界は、慢性的な人財不足に陥っており、高度なスキルを備えたデータアナリストやデータサイエンティストへのニーズは高まる一方です。また、トレーニング済みの経験豊富なスタッフも不足しており、AIの利活用や普及の妨げとなっています。多くの企業が、適切なスキルを持つデータサイエンティストを擁していないめ、サードパーティのプロバイダーにアウトソーシングしています。外部のベンダーに頼ることは短期的な解決策に過ぎず、正確な結果を出すには関連分野に関する知識が不可欠です。

4. 機械学習は未来を予測する

もし、未来が過去とまったく同じであるならば、その通りです。MLは過去のデータから学習し、まったく同じことが再び起こる可能性に基づいて予測を行います。

MLは予測だけでなく、ビジネスインサイトの構築やプロセスの簡素化、新製品や新機能の追加などにも役立ちます。しかし、MLの最大のメリットは、ビジネスの意思決定に役立つデータを得て、適切なアクションを起こせるようになることにあります。

5. 予測の精度が時間経過とともに自動的に向上

MLは、モデルと呼ばれるさまざまなアルゴリズムを使用して予測を行います。モデルは本番環境で稼働し始めた途端に、劣化し始めます。データは変わり、環境も変わり、人も変わりますが、モデルは一貫性を保ったままです。そのため、モデルを変化に適応させるために再度トレーニングを行うか、より最適なモデルを見つけて使用する必要があります。

モデルの劣化は、データドリフト (時間の経過によるデータのズレ) の影響によるものです。これは、モデルの予測対象が、予期せぬ変数によって変化してしまうことを意味します。たとえば、実店舗での売上を予測する場合、天候、祝日の有無、競合他社の動向などを考慮する必要がありますが、これらは非常に流動的な変数となっています。

例えば、皮膚がんの診断システムが、変数を無視したために皮膚がんを見落とすケースがあります。 この診断システムは、皮膚の隆起部分や、その形状の不規則さ、経時的な変化などを認識し、臨床医にがんの疑いを警告します。 しかし、システムが、日焼けや人種による肌の色を考慮しなければ、見落としにつながり、偽陰性となってしまう可能性があります。

一般化、つまり共変量のシフトも、モデルを悩ませる問題の 1 つとなっています。 モデルのトレーニングに使用されたデータがある集団、たとえば西洋の裕福な国のものであった場合、そのデータグループに対して過剰に適合してしまうのです。 一方で、他のグループや見たことのないデータについては、うまく一般化できないため、予測の精度が低下してしまいます。

このようなモデルの劣化を防ぐためには、事前に対策を講じる必要があります。 そして、稼働後の ML のパフォーマンスを定期的にモニタリングすることも重要です。 モデルの劣化が見られた場合は、モデルを再構築するか、より適合性の高い別のモデルを試すかの二択になりますが、 新しい機能の追加やパラメーターの変更が必要になるかもしれません。 こうしたプロセスは継続的学習と呼ばれ、予測の精度を保つためには、定期的なチェックと調整が不可欠です。

6. 機械学習とは、より高い精度を実現することである

精度の高さは重要ですが、精度の高いモデルが抜群のパフォーマンスを発揮するというわけでもありません。 精度 51% のモデルが宝くじの番号を正しく予測し、1,000 万ドルを勝ち取ることができるかもしれませんし、 精度 99% のモデルが、ローン申請の不正を予測する際に偽陰性を出し、莫大な損失が生まれるかもしれません。

MLはあくまで確率に基づいて動作するのであって、確実性に基づいて動作するものではありません。

モデルの再評価に加え、結果の精度も定期的にチェックする必要があります: 偽陽性と偽陰性の割合は?これらのエラーによるビジネスへのインパクトは?潜在的な収益がどれくらい失われたのか?システムの判定の精度に問題があり、営業チームに必要以上のリードを割り当てたり、システムがリードを拒否し続けており、営業チームが時間を持て余したりしていないか?

7. AI と ML が人に取って代わる

悲観論者はそう声高に騒いでいます。大きな脅威となる変化があるたびに、人々は雇用が失われるのではないかとパニックに陥ります。こうした不安が、AIの導入への抵抗を生み出しています。ある調査では、38%の人が今後3年以内にテクノロジーによって仕事がなくなると考えているという結果が出ています。2030年までに、製造業で最大2,000万人の業務がロボットに置き換えられると予測されています。何とも恐ろしい数字です。
しかし、実のところAIとMLは人間を補完しています。

退屈で反復的な作業をマシンが代行することによって、人間がクリエイティブで予測不可能な、より複雑な仕事に従事できるような仕組みを整えてくれるのです。職場にポジティブな変化をもたらすためには、AIが人間と手を取り合う必要があります。

産業革命を振り返れば、AI革命の未来が見えてきます。18世紀から19世紀にかけてそれまでの労働環境を一変させた産業革命ですが、長期にわたる大規模な失業と苦しみを生み出したわけではありません。多くの人々が、失業期間を乗り越えて、新たな職を手にしています。大量失業の恐怖はまさに事実無根であり、

AI によって一時的に雇用が失われるかもしれませんが、そのような損失は、より強力で豊かな経済圏で創出される新しい雇用によって置き換えられると予想されます。

自動化やAIが、私たちの仕事や生活を激変させることは間違いありませんが、ほとんどの場合、その変化はポジティブなものとなっています。

8. 機械学習はデータが多ければ多いほど良い

ゴミからはゴミしか生まれません。無関係な情報、クレンジングされていないデータ、不正確なデータを機械学習に与え続けていると、結果がそれを反映するようになってしまいます。データサイエンティストは、業務時間の約50%をデータのクレンジングに費やしているといわれていますが、これには理由があります。

どんなに優秀なマシンであったとしても、欠陥のあるデータからインサイトを得ることはできません。

データサイエンスがもたらすメリットは膨大

これは事実です。データサイエンスをうまく活用すれば、期待通りのビジネス成果が得られるかもしれません。 誰よりも早く、より良い成果を上げられる、組織のスーパーマンともいえるべき存在になれるかもしれません。

しかし、AIを全社的に活用するためには、AIでできること、できないことをより深く理解する必要があります。これを怠れば、頓挫する80%以上のデータサイエンスプロジェクトの1つになるのが落ちです。データサイエンスの導入効果を最大化するためには、AIで何ができるかを現実的に考え、適切なデータを適切なプロジェクトに活用することが不可欠です。これは、プラグアンドプレイで未来を予測するほど魅力的にも簡単にも聞こえませんが、AIの活用によって成果を上げるために、極めて成功率の高い戦略だといえます。

こちらもおすすめ

さらに興味のある方は、「機械学習にまつわる7つの誤解を払拭」をお読みください。

タグ