データサイエンスとデータアナリティクスに関する用語解説

すべて
  • また、
  • B
  • C
  • D
  • E
  • F
  • G
  • H
  • I
  • J
  • K
  • L
  • M
  • N
  • O
  • P
  • Q
  • R
  • S
  • T
  • U
  • V
  • W
  • X
  • Y
  • Z

高度な分析では、精緻な分析テクニックを使用して、インサイトの発見、パターンの特定、結果の予測、推奨事項の作成を行うことができます。


続きを読む

組織における分析の成熟度が高ければ高いほど、データを活用してビジネス成果を上げる能力が高くなります。


続きを読む

自動機械学習(AutoML)では、自動化されたプロセスを通じて ML(機械学習)モデルの構築、検証、反復、探索を行えるため、専門的なスキル不要で誰もが ML を活用できます。


続きを読む

バッチ処理とは、大量のデータを同時にスケジューリングして処理することを指し、一般的にはコンピューティングリソースの需要が少ない時間帯に行われます。多くの場合、バッチ処理は反復的であり、一定の間隔で実行されるようにスケジュール(自動化)されています。


詳しく読む

ビジネスアナリティクスとは、より良いビジネス成果を導く意思決定を行うために統計的・定量的手法を用いてデータを分析するプロセスです。


続きを読む

ビジネスインテリジェンスは、組織のデータ、ソフトウェア、インフラ、ビジネスプロセス、人間の直感などによってもたらされる累積的な結果であり、実用的なインサイトの提供を可能にします。


続きを読む

クラウド分析を利用することで、クラウドに保存されたデータを分析処理に利用したり、クラウドの高速コンピューティングパワーを活用して、分析をスピードアップしたりできるようになります。


続きを読む

クラウドデータウェアハウスは、Google Cloud Platform (GCP)、Amazon Web Services (AWS)、Microsoft Azureなどのサードパーティがサービスとして管理・提供するデータベースのことです。クラウドデータのアーキテクチャは、組織が独自で物理データベースインフラを管理するオンプレミスのデータアーキテクチャとは異なります。


詳しく読む

データ集計とは、統計分析に使用できるハイレベルな要約情報を提供するために、データ(多くの場合、複数のデータソースからのデータ)を集約させるプロセスです。簡単な例として、各販売地域における特定の商品カテゴリーの総売上高を求めるといったことが挙げられます。


詳しく読む

データアナリティクスとは、データを調査、変換、分析して、重要なインサイトを明らかにし、意思決定の効率性を高めるためのプロセスです。


続きを読む

データアプリケーションは、データベース上に構築されたアプリケーションであり、特定のデータの問題の解決に役立ち、視覚的なインターフェースを介して、同時に複数のクエリを実行し、データを探索・操作することができます。データアプリケーションを使えば、コード不要でデータを入手したり理解したりできるため、...


詳しく読む

データブレンディングは、さまざまなソースから取得したデータを 1 つの有用なデータセットにまとめるプロセスであり、より深く、より複雑な分析を可能にします。


続きを読む

データカタログとは、組織のデータ資産を包括的に収集し、組織全体の専門家が必要なデータを簡単に見つけられるように編集されたものです。いわば図書館の図書目録のようなもので、データカタログを使うことで、データの検索スピードを大幅にアップできます。...


詳しく読む

データクレンジングは、データクリーニングやスクラビングとも呼ばれ、生のデータセットからエラーや重複、無関係なデータを特定して修正するプロセスです。


続きを読む

データエンリッチメントとは、内部ソースからのファーストパーティデータと、他の内部システムからの異種データや外部ソースからのサードパーティデータを組み合わせるプロセスです。データエンリッチメントによって強化されたデータは、より有用で洞察に富んだものになり、どんな組織にとっても貴重な資産となります。...


詳しく読む

データ探索は、分析プロセスの最初のステップの1つであり、データセットにどのようなパターンや傾向が見られるかを掘り下げ、特定するために使用されます。データ探索は通常、データの可視化ツールなどのツールを用いて、データの特徴を説明することから始まります。


詳しく読む

データガバナンスとは、組織内でデータ資産をどのように利用し、誰にその権限があるのかというルールを定め、そのプロセスや標準を監督する一連の活動を指します。誰がどのデータをどのような方法で使用できるかを規定することによって、データ資産の安全性が保たれ、合意された要件が遵守されるなどの効果が望めます。


詳しく読む

データの取り込みとは、データをソースから収集し、アクセス、使用、分析が可能なターゲット環境へと移動させるプロセスです。


続きを読む

データの完全性とは、ライフサイクル全体にわたるデータの正確性と一貫性、および必要な権限に対する制約やその他のセキュリティ対策への準拠を指します。つまり、データの信頼性を確保するということです。


続きを読む

データレイクハウスとは、データレイクとデータウェアハウスのそれぞれの長所を取り入れたデータ管理アーキテクチャです。

 


続きを読む

データ系列の追跡により、企業がデータの取得元やシステム内のプロセスを追跡し、ビジネスデータのコンプライアンスと正確性を維持することが可能になります。


続きを読む

データメッシュは、データアーキテクチャの設計における新しいアプローチであり、データの保存と管理に分散型のアプローチをとることで、組織の全データを一元的に所有するデータレイクに流すのではなく、個々のビジネスドメインがデータセットの所有権を保持することとなります。データへのアクセスは、...


詳しく読む

データマンジングとは、分析の前に手作業でデータをクレンジングする工程を指しますが、時間がかかるうえに、データから真の価値と可能性を引き出す妨げになりがちです。また、多くの企業で、データ分析に費やされる時間の80%が、IT部門が手作業でデータをクリーンアップするデータマンジングの作業に費やされていることも明らかになっています。


詳しく読む

データオブザーバビリティとは、システムの健全性を維持し、ダウンタイムを削減するために、データシステム内で何が起こっているかを監視、追跡、および推奨する組織の能力を指し、その目的は、データパイプラインの生産性を高め、実行を継続できるようにすることにあります。


詳しく読む

データオンボーディングは、顧客データを準備してオンライン環境にアップロードするプロセスを指し、これにより、オフラインで収集された顧客レコードをCRMなどのオンラインシステムに取り込むことが可能になります。データオンボーディングの際には、エラーを修正するための大がかりなデータクレンジングが必要となります。


詳しく読む

データパイプラインは、ストレージ、分析、機械学習、その他の用途のために、データを収集、処理、およびソース間で移動させる一連のステップであり、主にアプリケーションからデータウェアハウスやデータレイクなどのストレージデバイスにデータを送信する際に利用されます。データパイプラインは...


詳しく読む

データ準備はビジネス分析や機械学習に使用する生データのクレンジングと統合を行うステップであり、「前処理」とも呼ばれます。


続きを読む

データプロファイリングは、データの特性を把握し、その品質を評価することによって、データに対する新たな発見や理解を得て、データを整理するためのプロセスです。


続きを読む

データサイエンスとは、応用統計学の一種で、コンピューターサイエンスと数学の要素を組み込み、定量的・定性的なデータからインサイトを抽出します。


続きを読む

テクノロジーの世界ですっかりおなじみの存在となった、「データサイエンス」と「機械学習」。 どちらも、ビジネスや業界のあらゆる分野での AI の運用を強化するものですが、 両者にはどのような違いがあるのでしょうか?


続きを読む

データソースとは、データの出所やデータが保存されているデジタルまたは物理的な場所を指し、その場所(データテーブルやデータオブジェクトなど)や接続性の特性によって、データの保存方法に影響が生じます。


続きを読む

データの標準化は、データの取得、標準化、統合に関する複雑なセマンティクスをすべて抽象化し、ビジネスにより迅速・正確な分析を提供します。


続きを読む

データ変換とは、データをあるフォーマットから別のフォーマットに変換するプロセスであり、データセット間でデータを標準化したり、データを分析や機械学習に役立てたりするために行われます。最も一般的なデータ変換には、生データをクリーンで使用可能な形式に変換すること、...


詳しく読む

データ検証は、データが正確でクリーンであることを確認するプロセスであり、アプリケーションの開発からファイル転送、データの準備作業にいたるまでの、データプロジェクトのあらゆるライフサイクルで正確性を確保するために不可欠なステップとなります初期段階から反復してデータの検証を行わなければ、…


詳しく読む

データの視覚化とは、グラフ、チャート、プロット、インフォグラフィックなどを用いてデータを視覚的に表現することです。


続きを読む

データトラングリングは、より良いビジネス上の意思決定を行うために、データを変換、クレンジング、強化して、より適切で使いやすい形に整えるプロセスです。


続きを読む

意思決定インテリジェンスは、分析、AI、自動化を意思決定に適用するためのプロセスです。 活動成果
詳しく読む

需要予測は、製品やサービスに対する今後の需要を予測し、ビジネスの意思決定に役立てる分析手法であり、 詳細なデータ、過去の販売データ、アンケートなどが用いられます。


続きを読む

記述的分析は、大規模な生データを集計・分析することで、過去に何が起きたのかを探り、その結果をグラフ(折れ線/円/棒グラフ)や表などに落とし込んで可視化する分析手法です。


続きを読む
ETL

ETL とは、さまざまなソースやフォーマットからのデータをコピー、結合、変換し、データウェアハウスやデータレイクなどの新たな保存先に書き出すために使用するプロセスです。


続きを読む

ETL開発者は、データを抽出、変換、およびロードするための高度なアプリケーションを設計、開発、自動化、およびサポートするITスペシャリストです。ETL開発者は、組織のデータストレージのニーズを決定するうえで重要な役割を果たします。


続きを読む

特徴量エンジニアリングを用いることで、データをより良く理解し、有益な情報に変えることが可能になります。


続きを読む

機械学習 (machine learning) とは、コンピューターが特定の制約を持つデータセットを反復的に処理することで、内在するパターンを見つけ出すプロセスです。


続きを読む

機械学習(Machine Learning、ML)モデルは、ビジネスに価値あるインサイトをもたらします。しかしながら、機械学習モデルが効果を発揮するためには、継続的に組織のデータにアクセスして分析を行う必要があります。MLOpsは、その実現に不可欠となるプロセスです。


続きを読む

予測分析は、統計学、データサイエンス、機械学習などの手法を用いて、将来何が起こるかを予測するデータ分析の一種です。


続きを読む

処方的分析は、機械学習、グラフ分析、シミュレーション、発見的手法など通じて、「何をすべきか、何ができるか」という問いに答える分析手法です。


続きを読む

正規表現(regular expression)とは、検索パターンの指定に用いられる文字列です。正規表現を使うことで、特定の条件に一致する検索を簡単に行い、定期的にテキストを操作したり、大量のデータを分析したりするユーザーの時間を大幅に節約することができます。例えば...


詳しく読む

売上分析とは、データから洞察を生み出し、目標や指標、より大きな戦略を設定するために使用される手法です。


続きを読む

ソースからターゲットへのマッピングは、ソースシステム内のデータの構造と内容を、ターゲットシステムで必要とされる構造と内容に変換する方法を決定する一連のデータ変換命令を指します。


続きを読む

空間分析は、地理的モデリングを用いて、地理空間データに含まれる位置、関係、属性、近接性などを分析し、問題解決に役立つ洞察を引き出す分析手法です。


続きを読む

教師あり学習と教師なし学習の一番の大きな違いは、教師あり学習では「ラベル付きデータセット」を使用し、教師なし学習では「ラベルなしデータセット」を使用することです。


続きを読む

S s インテリジェンスシステムは、企業が技術スタックから価値を引き出せるよう支援する仕組みを指します。
詳しく読む

ユーザー定義関数(UDF)は、ユーザーがコードを書き換えることなく処理を再利用できるようにするカスタムプログラミング関数です。例えば、複雑な計算をSQLを使ってプログラムし、UDFとして保存することができます。この計算を将来、別のデータセットで使用する必要がある場合は...


詳しく読む