多変量解析の実際
扱うデータの種類
多変量解析に限らず、すべての分析で扱うデータには以下の4種類があります。扱うデータの種類によって、用いることのできる分析手法が変わります。
表1 データの種類と特徴
※「アンケートデータの尺度データ(「満足度」等)」は、原則「順序尺度」となります。ただし、「等間隔」であると見なして「間隔尺度」として扱うケースもあります。
多変量解析の目的
多変量解析の目的は、大きく分けて「予測」と「要約」の2つがあります。この2つの目的によって、手法が異なります。
図3 予測の手法
図4 要約の手法
多変量解析の種類
多変量解析には、扱う変数の種類とその目的に応じて様々な手法があります。下表の「説明変数(独立変数)」とは、原因となる事柄に関する変数で、「目的変数(従属変数)」とは、結果となる事柄に関する変数です。多変量解析は、この「説明変数」と「目的変数」との関係や、「説明変数」同士の関係を調べ、関係式を作り、その関係を明らかにします。
表2 多変量解析で扱う変数の種類と目的
※一部の分析においては、質的データを量的データと見なしたり、ダミー変換をおこなうことで対処するケースがあります。
表3 多変量解析の種類
※横にスクロールしてご覧ください
重回帰分析 |
複数の説明変数から1つの目的変数を推定します。例えば、目的変数を従業員の年収として、年齢・会社の規模(資本金)・売上高・利益等の説明変数の影響度を求め、年収を推定します。(1つの変数から1つの目的変数を推定するのは、単回帰分析と言います。身長から体重を推定するのが、単回帰分析の例です) |
数量化1類 |
量的な目的変数(外的基準)に対して説明変数が質的な場合、数量化1類により、重回帰分析と同様な推定を可能にします。例えば、店員のサービス・品揃え・立地等の質的説明変数から店の売上を予測します。 |
判別分析 |
目的変数が質的変数になります。よく使われるのは、2カテゴリーのデータで、例えば、購入/非購入・継続/中止などの判別を、価格・予算・使用量・支払い金額等の量的な説明変数によって行います。 |
数量化2類 |
判別分析の場合量的だった説明変数に質的変数を適応可能にさせたものです。例えば、サービスの印象・売り場の印象・商品評価などの質的説明変数から、購入/非購入を判別します。 |
主成分分析 |
多くの量的説明変数がある場合、これを少数の総合指標(合成変数)で表す目的で用いられます。1番目に得られる総合指標を特に第1主成分と言います。例えば、ある商品の満足度について色々な属性から評価を得て、これを主成分分析にかけると、第1主成分として総合的満足度のようなものが得られます。 |
因子分析 |
多くの量的説明変数がある場合、これらの変数に共通して影響を与えていると考えられる少数の変数(因子)によって、説明変数を表そうとするものです。各説明変数は、少数の共通因子と各変数独自の因子(誤差)によって表されます。例えば、各教科の点数を、理系能力因子・文系能力因子等を仮定して説明するものです。 |
多次元尺度構成法(MDS) |
個体間の類似度の高さに応じて、似ている個体を近い距離、似ていない個体を遠い距離に配置します。出力は幾何学的で軸に意味はないと言えます。 |
数量化3類 |
外的基準がない場合、質的データの内部構造から尺度化を行うものです。Yesなら1、Noなら0の反応パターンに基づき、アイテム、カテゴリーと個体(対象者)をそれぞれ尺度化するものです。全く同じ原理の手法として、コレスポンデンス分析(対応分析)があります。コレスポンデンス分析はデータとして頻度を扱います。その意味で、コレスポンデンス分析は数量化3類を特殊な場合として含む上位の分析法になります。頻度は1か0も含むからです。 |