機械学習モデルとは,未知のデータセットからパターンを発見したり,判断を導き出すプログラムのことです。例えば,自然言語処理では,機械学習モデルにより,これまで聞き取れなかった文章や単語の組み合わせの背後にある意図を解析し,正しく認識できます。また,画像認識では,機械学習モデルを学習させることで,車や犬などのオブジェクトを認識できます機械学習モデルは、大規模なデータセットを用いて「トレーニング」することで、上述のようなタスクの実行が可能になります。トレーニングでは、機械学習アルゴリズムはデータセットから特定のパターンやアウトプットを発見するように最適化されます。このプロセスによるアウトプットは、多くの場合、特定のルールとデータ構造を持つコンピュータプログラムであり、機械学習モデルと呼ばれます。
機械学習アルゴリズムとは,デタセットからパタンを見けるための数学的手法です。機械学習アルゴリズムは、統計学、微積分学、線形代数学の知識が用いられていることが多く、代表的な例には、線形回帰、決定木、ランダムフォレスト、XGBoost があります。
トレーニングデータと呼ばれるデータセット上で機械学習アルゴリズムを実行し,特定のパターンやアウトプットを発見するためにアルゴリズムを最適化するプロセスを,モデルのトレーニングと呼びます。また,その結果として得られるルールとデータ構造を持つ関数を,トレーニング済み機械学習モデルと呼びます。
機械学習の手法は主に,教師あり学習,教師なし学習,強化学習に分類されます
教師あり学習では,アルゴリズムは提供されたインプットデータセットに対して特定のアウトプットのセットを満たすように正解を与えられ,最適化されます。例えば,画像認識には,教師あり学習の分類と呼ばれる手法が広く用いられています。また,人口増加や健康状態などの人口統計の予測には,教師あり学習の回帰と呼ばれる手法が利用されています。
教師なし学習では,アルゴリズムは入力データセットを提供されますが,特定のアウトプットに対する正解は与えられず,共通の特性によってデータセット内のオブジェクトをグループ化するようにトレーニングされます。例えば,オンラインショップの推薦エンジンには,教師なし学習のクラスタリングと呼ばれる手法が用いられています。
強化学習では,アルゴリズムは多くの試行錯誤を繰り返しながら,自らトレ,ニングを行います。強化学習は、アルゴリズムがトレーニングデータに依存するのではなく、環境と継続的に相互作用することで実現されます。強化学習の代表的な例として、自律走行が挙げられます。
機械学習モデルは数多く存在しますが,そのほとんどが特定の機械学習アルゴリズムに基づくものです。一般的な分類アルゴリズムと回帰アルゴリズムは教師あり学習に該当し,クラスタリングアルゴリズムは教師なし学習のシナリオで利用されます。
決定木は,機械学習における予測手法の1で,オブジェクトがどのクラスに属するかを示すものです。特定の条件を用いてオブジェクトのクラスを段階的に決定する,リ状のフロチャトです。数据库のレ电子词典クハウスで可視化された決定木
出典:ブログ”機械学習モデル,決定木(ディシジョンリ)による分析を活用した金融詐欺検知の大規模展開」
データサイエンスや機械学習における回帰は,入力変数のセットに基づいて結果を予測できる統計的手法です。結果として得られる値は,多くの場合,入力変数の組み合わせに依存します。数据库のレ电子词典クハウスで実行された線形回帰モデル
出典:ブログ”DatabricksのApache Sparkで機械学習を簡素化」
分類器とは,あるカテゴリーやグループの1つとしてオブジェクトを割り当てる機械学習アルゴリズムです。例えば,スパムメ,ルや不正取引の検知に分類器が使われています。
機械学習のモデルは,数多く存在します。機械学習は進化している分野であり、常に多くの機械学習モデルが開発されています。
特定の状況に最も適した機械学習モデルは,期待する結果によって異なります。例えば,ある都市の自動車購入台数を過去のデータから予測する場合,線形回帰のような教師あり学習が最も有効であると考えられます。一方,その都市に住む潜在的な顧客が,収入や通勤の履歴から自動車を購入するかどうかを特定するには,決定木が最も効果的かもしれません。
モデルのデプロイメントとは,機械学習モデルをテスト環境または本番環境で使用できるようにするプロセスを指します。機械学習モデルは、通常、API を通じて環境内にあるデータベースや UI などの他のアプリケーションと統合されています。デプロイメントを経て、組織はモデル開発への多大な投資に対し、実際に利益を得られるようになります。Databricksのレaapl . exeクハウスにおける機械学習モデルのラaapl . exeフサaapl . exeクルの全容
出典:ブログ”機械学習の本番化:デプロ化学键からドリフト検出まで」
深層学習モデルは,人間が情報を処理する方法を模倣した機械学習モデルの一種です。このモデルは,提供されたデータからハイレベルな特徴を抽出するために,多数の処理層で構成されています。これが“深層”と呼ばれる所以です。各処理層は,より抽象的なデ,タ表現を次の層に伝え,最終層はより人間に近い知見を導き出します。深層学習モデルは、ラベル付けされたデータを必要とする従来の機械学習モデルとは異なり、膨大な量の非構造化データを取り込めるため、顔認識や自然言語処理などのより人間に近い機能の実現に利用されています。
深層学習の簡略図
出典:Aiと深層学習の民主化
時系列機械学習モデルとは,独立変数に連続した時間の長さ(分、日、年など)を含み,従属変数または予測変数に関係するモデルです。時系列機械学習モデルは、翌週の天気、翌月の予想顧客数、翌年の収益ガイダンスといった時間的制限のある事象を予測するために使用されます。