スプレッドシート|CHITEST関数で、カイ二乗検定を行う


ねぇ、長男は引きこもりがちって話、本当だと思う?
失礼だなぁ。確かに次男の方が成績がいいとか、聞いたことはあるけど…
でも、次の調査結果をみたらそんな風に思えない


  引きこもり長男・次男調査(令和X年)

この表では、データを悪意をもって見せているといわれても仕方ありません。というのも、当然「引きこもりでない」と回答した人達もいて、以下のように開示できたからです。



※ アンケート参加者の内、長男は250+2250=2500人, 次男は100+900=1000人です。


本表では、見方が全く変わってきますね。長男・次男に関わらず、全体の1割が引きこもりであることが分かります。また単純に、長男は次男に比べて多いため(1人っ子は全て長男)このような結果になると考察できます。

このように、全回答データを見せないことは大きな誤解をもたらします。それを防ぐために、全ての回答データを開示する表は、クロス集計表と呼ばれます。


良かった…けど、これとCHITEST関数に何の関係があるの?
これは前置きね。CHITESTはクロス集計表を使用することが多いんだけど、なぜ使うのかを理解するためのものよ。以下では、CHITESTの基本情報をみていきましょう。


Step # 1:CHITESTを使う前の基本情報


CHITEST関数って何に使われるのかを先に知りたい!
CHITEST関数は、ある仮説を証明できるかどうかを知るための関数よ。
ここで、一つ目の基本情報。この仮説は統計学のマナーで、次の2つに分類されるの。


1:対立仮説と帰無仮説


1. 対立仮説Alternative Hypothesis:もう一方の仮説)

 例 「AかBかは、〇〇に関係がある


2. 帰無仮説Null(ifiable) Hypothesis:無効(かもしれない)仮説)
 例 「AかBかは、〇〇に関係がない


ここのポイント
・統計学の仮説には2種類ある
・〜ないで終わるのが帰無仮説
・CHITEST関数は、この内帰無仮説が正しいかどうかを判定する


コペルニクス(1473-1543)は、「地球は丸い」ことを証明するために、「地球は丸くない」という帰無仮説を否定しようとしました。これが証明されたことで(帰無仮説の棄却)、「地球は丸くない」は ✖️ →「地球は丸い」という地動説の基礎につながりました。つまり、帰無仮説とは、それ自体が無効なのではなく、否定できるかが検証される仮説であり、かつ本来証明したいものを一度否定した仮説です。


2:カイ二乗検定とは


カイ二乗検定ってなに?
カイ二乗検定(ChiSquireTest)には2つタイプがあって、1つは事象が極めてまれかどうかを、2つ目はAかBかは〇〇に関係があるかないかを判定するものよ。2つとも以下の式で計算できるんだけど、手作業では大変ね。これを簡単に済ますのがCHITEST関数よ。


※ O=Observed(観測値), E=Expected(期待値), Σ=個々の足し算


ところで、χ2 とはカイ二乗値(χ2)のことですが、これはCHITEST関数が出す答え(P値)とは異なります。P値とはχ2を比率変換したもので、わかりやすくするための処置なのです。

以下では、カイ二乗検定の2つのタイプごとに、χ2を求めます。



1. 適合度の検定Goodness of Fit Test:(期待値との)適合の善良性検定)

 適合度の検定は、観測された値が、どれだけ期待値と適合している(or 異なっている)かを検定します。

例:ジャンケンを24回し、観測された値が4勝13敗7引分である時、期待値(確率1/3のそれぞれ8回)とどれだけ適合しているか検定する。ここでの仮説は以下である。

帰無仮説:観測値と期待値の間に、重大な差はない

対立仮説:観測値と期待値の間に、重大な差がある

Ex.

1. 期待値・観測値表から、 カイ二乗(χ2)値を求める。
(χ2は、個々の観測値と期待値の差を二乗したものを期待値で割り、足すことで求められます。)


2. カイ二乗(χ2)値を、以下の関係表からP値に変換し、帰無仮説を棄却できるかを調べる。
(もしP値が0.05(5%)を下回れば、帰無仮説を棄却できる。この0.05(有意水準)は慣例的に統計で用いられる。左軸の自由度(n-1)とは、選択肢で独立している変数の数。今回変数は3つ(勝・負・引分)あるが、内2つがわかれば3つ目もわかるので、自由度は2。)


 各自由度ごとの、カイ二乗(χ2)値とP値(0.99〜0.01)の関係表


今回のχ2値は、5.25で、有意水準0.05を示す5.991よりも低い。つまり、0.05<P値<0.1なので、「帰無仮説:観測値と期待値の間に、重大な差はない。」を棄却(否定)できない。


ここのポイント
・適合性の検定は、観測値と、期待値との差を数値(χ2)にする
・χ2をP値にすることで、その事象がおこる確率(P値)がわかる
・CHITEST関数だと、P値を上のプロセス無しで直接求められる





2. 独立性の検定test for independence:独立への検定)

 独立性の検定は、(クロス集計表で)2つのカテゴリー変数(1,男・女 vs 2,共感能力高・低)の間に重大な関係があるかを調べます。

帰無仮説:「男・女であること」と、「共感能力の高い低い」には、重大な関係はない

対立仮説:「男・女であること」と、「共感能力の高い低い」には、重大な関係がある


CHITESTは、この帰無仮説を否定できるかどうかを、数値にして教えてくれる関数です。

 先ほどのように、ここで調査を行い、カイ二乗(χ2)を計算した後に関係表から有意水準に当てはめてもいいのですが、CHITESTは、この過程を省略して、一気にその有意水準(P値)を教えてくれる関数です。

この否定できるかの基準値(有意基準)は0.05(5%)で、これより下であると否定できます。

 この5%は、観測された結果になる可能性が5%(期待値との解離度合いに基づいて)よりも低いから、これは極めてまれであって、帰無仮説を否定できる(重大な差がある(適合度の場合)、重大な関係がある(独立性の場合))ことを示します。もし本例でCHITESTの答えが0.05を下回ったとすると、「男性か女性かは、共感応力の高低に関係がない」を否定(ないの打ち消し=ある) → 対立仮説「男性か女性かは、共感応力の高低に関係がある」可能性を示唆します。


CHITESTで、クロス集計表を使う方が独立性の検定なんだね。


Step # 2: CHITEST関数(独立性の検定)のつかいかた


1:観測値の表をつくる


今回は、「キャッチコピーの有無は、購買するかしないかに関係がある」という対立仮説をたて、調査を実施したとしましょう。

ちなみに、この帰無仮説は「キャッチコピーの有無は、購買するかしないかに関係がない」ですね。CHITESTは、これを否定できるかを教えてくれます。



  キャッチコピー購買率調査(観測値, O)


上の結果が得られました。なんとなく、「キャッチコピーがあると、購買率が高くなる」ような気がしますが、購入しなかった人も多いので、確信は持てません…。次に期待値の表をつくります。


2:期待値の表をつくる


期待値は「(売上がキャッチコピーとか関係なく)平均通りであれば、こうなっただろうという数」です。



  キャッチコピー購買率調査(期待値, O)

2日間の来客総数は3600人。その内、購入した人の合計は550人です。
つまり、購買率の平均は2日間で550人/3600人=0.153(15.3%)ですね。もしキャッチコピー有りの日の購入人数も、この平均通りであれば、来客者2100人の内、15.3%、よって「2100*550/3600 = 321人」が購入するはずですね。これが、期待値上の購入人数になります。


3:CHITEST関数を使用する


さて、ここで観測値と期待値の差分を求めて…というカイ二乗を求める数式に入ってもいいのですが、ここを省略するためにCHITEST関数があります。観測値と期待値の表さえあれば、カイ二乗を求めることなく、帰無仮説を検定する基準値(P値)を教えてくれます。



  観測値・期待値表から、CHITESTを行う

 p値は? 0.006

よって、対立仮説:「キャッチコピーの有無は、購買するかしないかに関係がある」は認められる


0.006は、有意水準0.05よりも小さいので、帰無仮説:「キャッチコピーの有無は、購買するかしないかに関係がない」を否定できる!つまり、「キャッチコピーの有無は、購買するかしないかに関係がある」と言える。


4:CHITEST関数の実践例


今回は、「江東区か品川区か渋谷区であることは、年齢別人口構成の割合に関係がある」という対立仮説をたて、調査を実施したとしましょう。

ちなみに、帰無仮説は「江東区か品川区か渋谷区であることは、年齢別人口構成の割合に関係がない」ですね。CHITESTは、これを否定できるかを教えてくれます。



  都内3区アンケート回答者の年齢別人口調査(観測値, O)


アンケートによって、上の観測値(結果)が得られました。年齢別人口は各区に同じような割合で分布しており、「江東区か品川区か渋谷区であることは、年齢別人口構成の割合に関係がない」(帰無仮説は正しい)ように見えますね。


 4-1:期待値表をつくる


期待値は「(年齢別人口割合が区に関係なく)平均通りであれば、こうなっただろうという数」です。


  都内3区年齢別人口(期待値, O)

全区人口合計は129、その内20-49才の人口合計は49です。よって、「区に関係なく、20-49才年齢における平均人口割合は49/129 = 0.37(37%)」ですね。この割合を江T区の人口合計41に当てはめると、41*49/129=15.6となります。


  観測値・期待値表から、CHITESTを行う

 p値は? 0.741

よって、対立仮説:「江東区か品川区か渋谷区であること」と「年齢別人口構成の割合」には重大な関係がある、は認められない。


0.741は、有意水準0.05よりも大きいので、帰無仮説:「江東区か品川区か渋谷区であることは、年齢別人口構成の割合に関係がない」、を否定できない!つまり、「江東区か品川区か渋谷区であることは、年齢別人口構成の割合に関係がある」、とは言えない。