分散分析の定義
分散分析は2群以上の群間における分散の差の検定のことで、「F検定」とも呼ばれます。
分散とは、データのばらつきの程度を表すものですが、そこから平均値を求められることから、分散分析は平均値の差の検定とも考えられます。
分散分析が適用されるのは、従属変数が量的変数、独立変数が質的変数の場合です。
したがって従属変数は間隔尺度か比率尺度でなくてはならず、一般的には平均値が検定の対象となります。
分散分析はパラメトリック検定の1つです。
パラメトリック検定では、
1. 母集団が正規分布かそれに近い分布である
2. 各条件の母分散が等質である
3 .標本が母集団から無作為に抽出されている
という3つの前提条件を満たしている必要があり、分散分析においてもこの条件が求められます。
また、独立変数が2つ以上の場合でも適用可能なことから、分散分析は多変量解析の1つとも言えます。
その場合には、それぞれの独立変数の主効果の有無、および、交互作用の有無を明らかにすることができます。
分散分析の覚えておきたい関連キーワード
- 平均値の差の検定
- パラメトリック検定
- 多変量解析
- 主効果
- 交互作用
分散分析の補足ポイント
主効果とは、2つ以上の要因の効果について分析しようとする場合に、
ある要因以外のすべての条件を合わせた、つまり、平均した当該の要因の条件間に見られるデータ値の差です。
簡単な例をもとに考えてみましょう。
学生を男子と女子にグループ分けし、さらに、AとBという2種類の教授法を行うグループに分け、テスト結果を検討するとします。
つまり、2要因(性別と教授法)の分散分析です。
両方の教授法のデータを合わせた男子全体、女子全体の平均値の差を「性別の主効果」と言います。
逆に、性別の要因、つまり男子と女子のデータを合わせた上での、教授法の違いにのみによる差を「教授法の主効果」といいます。
結果、条件間で有意な差が見られる場合「性別(または教授法)の主効果がある」ということが言えます。
一方、交互作用とは、ある要因の効果が別の要因の水準により変わり、それぞれの要因の主効果から予想されること以上の、組合せによる効果が見られることです。
これも、先の例をもとに考えてみましょう。
男子にはAという教え方が効果的だったけれども、女子にはBという教え方の方が効果的だったという結果において、その差が有意であった場合「性別いう要因と教授法という要因の間に交互作用がある」ということになります。
交互作用は、グラフにすると非常に分かりやすいです。
それぞれの要因の組み合わせで、2×2、4つのセルの平均値をプロットしてみると、交互作用がない場合は線分が平行になりますが、交互作用がある場合は線分が交差するのです。
主効果、交互作用については、言葉だけの説明をよんでもなかなか理解しにくいかもしれません。
例やグラフなどをあわせて整理しておくと、理解しやすくなりますよ。
編集中