AutoMLとは

自動機械学習(AutoML)では、自動化されたプロセスを通じてML(機械学習)モデルの構築、検証、反復、探索を行えるため、専門的なスキル不要で誰もがMLを活用できます。AutoMLを利用すれば、データの準備とクリーニング、特徴量の作成と選択、最適なモデル群の選択、ハイパーパラメーターの最適化、結果の分析などを簡単に自動化できます。また、データの可視化、インサイトの生成、モデルの説明可能性、モデルの導入にも役立ちます。

AutoMLの重要性

MLモデルは企業に貴重な洞察を提供しますが、そのモデルを構築する担当者にMLの専門知識がないことは珍しくありません。AutoMLはデータサイエンティストに取って代わるものではありませんが、作業者の生産性を大幅に向上させ、データサイエンティストやその他のユーザーがコード必須とされていたステップを自動化し、モデルのテストや分析情報に集中できる環境を提供してくれます。シチズンデータサイエンティストなどの経験が十分ではないユーザーであっても、AutoMLを使用すればデータから簡単にインサイトを引き出したり、データサイエンスについてすばやく理解を深めたりすることができます。

AutoMLの仕組み

AutoMLでは、次のような機能を利用することができます。

 

データの評価と前処理 - 自動機械学習
データ評価と前処理:有用なモデル学習用データセットを作成するために、データを準備し、クレンジングし、変換します。

 

特徴量エンジニアリング - 自動機械学習
特徴量エンジニアリング:新しいデータ列を既存のモデル学習データ内で作成し、データによって記述される現象における予測因子をよりよく表すか、あるいは単にMLのアルゴリズムでよりよく機能するかを確認します。

 

特徴量選択 - 自動機械学習
特徴量の選択:新しい特徴量が作成された際に、AutoMLによってモデルの生成に有用な特徴量のみを選択することができます。

 

アルゴリズムの選択 - 自動機械学習
アルゴリズムの選択:競合する候補モデルをレビューし、目的の指標に関して最も高いパフォーマンスを発揮するモデルを選択します(例:正解率、再現率、正解率のバランスなどを最適化)。

 

ハイパーパラメータのチューニング - 自動機械学習
ハイパーパラメーターのチューニング:学習アルゴリズムに最適なハイパーパラメーターが選択されます。

AutoMLの活用例

AutoMLは、次のような多様なビジネス課題の解決に役立ちます。

パーソナライゼーション

ビジネスを成功させるためには、お客様に語りかけるだけではもはや十分ではなく、お客様一人ひとりのニーズに細やかに応えることが不可欠となっています。AutoMLは、お客様の一人ひとりの嗜好や行動を学習することで、より効果的でスケーラブルなパーソナライゼーションを実現します。これにより、パーソナライズされたコンテンツやレコメンデーションの提供が可能となり、お客様の関心を引き出し、売上の向上へとつなげられるようになります。

顧客記録のクリーニング

スペルミス、更新時のエラー、一貫性のない情報などによって、企業の顧客データベースに重複が生じてしまうことがありますが、AutoMLを用いれば、こうした異常値を簡単に特定・修正し、データの精度を改善し、価値を高められるようになります。

顧客離反の抑制

新たなお客様の獲得はどんなビジネスにおいても重要ですが、既存のお客様の維持も言うまでもなく重要です。AutoMLでは、顧客活動のパターンを見つけ出し、どのお客様が競合他社に乗り換える可能性が高いかを予測することができます。これにより、離反の可能性が高いお客様に絞りこんでキャンペーンを実施し、利益とブランド価値を高めることが可能となります。

不正の検知

米国政府が被る経済的損失は年間約800億ドルに上ると言われています。あらゆる連邦政府機関が不正の脅威にさらされていますが、そうした不正の疑いが高い請求書などを入念に調査するためのリソースは恒常的に不足している状態です。しかしながら、年々巧妙化する不正行為に対処するため、ソリューションも加速度的に進化しています。AutoMLを既存の業務システムに組み込めば、過去の不正行為に関するデータを利用して危険な兆候を察知し、問題に迅速に対処できるようになります。

AutoMLを活用しませんか?

Alteryx Machine Learningでは、製品に含まれるチュートリアルモードを利用して、誰もがデータサイエンティストと同じようにAutoMLなどの強力な手法を活用することができます。Alteryx Machine Learningでは、データの準備、ブレンディング、強化などのあらゆるデータ分析のプロセスでAutoMLを活用し、以下のようなことを実現できます。

以下のようなことを実現できます。

  • データサイエンス・MLプロセスのステップを自動化
  • そのデータについて多数の予測モデルをトレーニング
  • トレーニングしたモデルのパフォーマンス(受信者操作特性、適合率、
    再現率、正解率、均衡のとれた正解率など)

さらには以下のようなことも実現できます。

  • インタラクティブな可視化
  • ビジネスのステークホルダーが容易に理解できるレポートの作成
  • 業務システムにモデルを導入
  • トレーニングや用語集の統合
  • トレーニングデータの評価プロセスを自動化
  • トレーニングデータの改善や自動調整