ページの本文へ

Hitachi
お問い合わせお問い合わせ

用語集

関連する用語をまとめました。

AIカタログ#DataRobot特有

データおよび関連アセットを操作するための一元化されたコラボレーションハブです。データの検索、共有、タグ付け、再使用をシームレスに行うことができるため、運用化までの時間短縮に役立ちます。 カタログによって、ビジネスの問題に対処するために必要なデータに容易にアクセスできると同時に、セキュリティ、コンプライアンス、および一貫性が保証されます。 AIカタログでは以下の操作が可能です。

AutoML

AutoML(自動機械学習)は、予測モデルの設計・構築・調整を自動化し、非専門家でも効果的に予測モデルを構築できる技術です。

EDA(探索的データ分析)

データを視覚化・統計手法で確認して、予測モデルに使用するデータの特徴や傾向を見つける過程(ステップ)のことです。ここで得た洞察を活用してモデリングを行います。

Location AI#DataRobot特有

DataRobotは、一般的な地理空間形式のネイティブな取込みと座標の認識、 探索的空間データ分析(ESDA)、空間的に明示的なモデリングタスクと可視化の提供により、地理空間分析をサポートします。

Visual Artificial Intelligence (AI)#DataRobot特有

DataRobotの機能。サポートされている画像タイプだけを使用するか、サポートされている他の特徴量型と組み合わせて、画像を入力として使用するモデルを作成できます。 この機能には、モデルのパフォーマンスを視覚的に評価するのに役立つ専門的なインサイト(画像埋め込み、アクティベーションマップ、ニューラルネットワークビジュアライザーなど)も含まれています。

アンサンブル(ブレンダー)#DataRobot特有

2つから8つのモデルの予測を組み合わせることで、精度が高まる可能性があるモデル。 DataRobotでは、オートパイロットの一部として、通常のリーダーボードモデル(AVG、GLM、ENETアンサンブル用)の上位3つに基づいて、アンサンブルモデルを自動作成するように設定できます。 アンサンブルモデルは手動で作成することもできます。

異常検知

機械学習の異常検知は、正常なパターンから外れるデータ(異常)を検出する技術です。
セキュリティ侵害や機械の故障を監視する際に活用されます。

回帰問題

機械学習の回帰問題は、データの関係性を分析し、連続的な値を予測するタスクです。
例えば不動産価格の予測や売上予測、R&Dにおける物性値の予測などに活用されます。

学習

機械学習の学習(train)は、訓練データを使用して、データから関連性や特徴を学び未知のデータに対して予測を行うための予測モデルを構築するステップです。

機械学習

機械学習は、コンピュータがデータを分析し、パターンや規則を自動的に学ぶ技術です。これにより、新しいデータに対しても適用(予測・推論)できるシステムが構築できます。

教師あり学習

分類問題や回帰問題を解決するためにしばしば利用される方法であり、教師ラベル(正解のデータ)が付いたデータからモデルを訓練し、未知のデータに対する予測を行う機械学習手法です。

教師無し学習

異常検知やクラスタリングを行う際に利用される方法であり、教師ラベルがないデータからモデルを訓練し、未知のデータに対する予測を行う機械学習手法です。

クラスタリング

似ているデータをグループ化し、パターンを見つける手法です。例えば、商品やユーザを共通(近しい)の特徴でまとめます。

サンプルサイズ

予測モデルを学習させるための使用されるデータの個数。十分なデータが無いと完成した予測モデルの信頼性が低くなってしまう可能性があります。

時系列問題

機械学習の時系列問題は、データが時間的な順序を持つ場合の予測タスクです。
例えば株価予測や気温変動予測、需要予測など、過去のデータからトレンドや季節性を把握し未来を予測する場合に活用されます。

ターゲットリーケージ

予測モデルが未来の情報を使用して学習し、実際に未知のデータで予測する際には、その情報(データ)が利用できない状態のことです。これは現実的な予測を妨げ、予測モデルの性能を過大評価する可能性があります。

デプロイ

作成した予測モデルをユーザへ展開(利用可能な状態にする)ために行われるプロセスのこと。予測専用サーバなどインフラ構築、API設計、セキュリティ確保、監視、メンテナンス、スケーリングの検討などが行われる。

特徴量

特徴量は、データの属性や情報を表す、数値・テキスト・カテゴリデータ・画像などのことで、予測モデルを学習するための入力として使用されます。
例えば、日々の気温(数値)、報告書の文章(テキスト)、年代などの属性データ(カテゴリ)、画像のピクセル値(画像)などが特徴量です。

特徴量エンジニアリング

機械学習の予測モデル精度(性能)向上を目指して、元のデータから新しい特徴を創造・変換するプロセスのこと。ドメイン知識(業務知識)や統計手法などを駆使して、予測モデルがより良い予測を行えるように特徴を調整する。

特徴量ごとの作用#DataRobot特有

各特徴量の値の変化がモデルの予測に与える影響を示します。 特徴量ごとの作用では、各特徴量とターゲットの間の関係性がモデルでどのように「理解」されているかを示すグラフが表示されます。特徴量は、特徴量のインパクトでソートされます。

特徴量のインパクト#DataRobot特有

データセット内のどの特徴量がモデルの決定に最大のインパクトを与えるかを明らかにする測定値。 DataRobotでは、測定値はリーダーボードで視覚化されて報告されます。

ブループリント#DataRobot特有

入力された予測変数と目標値を、モデルに変換するために必要な多くのステップをグラフィック表示します。 ブループリントは、前処理のステップ、アルゴリズム、後処理など、モデルを学習させる際のエンドツーエンドの手順の概要を表します。

分類問題

機械学習の分類問題は、データを異なるカテゴリに選り分けるタスクです。
例えばメールのスパム判定、金融の貸し倒れ判断、製造業の不良品判定などに活用されます。

モデル(予測モデル)

機械学習の予測モデルは、訓練データから学んだパターンを元に、未知のデータに対して予測を行う仕組です。
データの特徴を把握し、関連性を抽出し、新しい入力データに基づいて出力や判断を行います。語弊を恐れずに言えば、AIの頭脳のようなイメージです。

予測(推論)

機械学習の推論(prediction)は、訓練済みの予測モデルを用いて、新しいデータに対する予測や判断を行うステップです。予測モデルは学習済みのパターンをもとに予測結果を生成します。

予測ターゲット

機械学習で予測しようとする対象の変数(データ)のこと。例えば、分類問題における不良の発生確率や、回帰問題における販売数量などが予測ターゲットになり得えます。予測モデルはこの予測ターゲットを学習し、未知のデータに対して予測を行います。

用語集についての質問事項やデモなどのご相談は、
下記お問い合わせよりお気軽にご連絡ください。

30日間の無料トライアルも実施中です。

無料トライアルの詳細を確認する

*DataRobot特有の名称については、DataRobot社サイトより引用・編集しております。

* 本ページに記載されている会社名、製品名は、それぞれの会社の商標または登録商標です。

日立システムズは、システムのコンサルティングから構築、導入、運用、そして保守まで、ITライフサイクルの全領域をカバーした真のワンストップサービスを提供します。