
.png?w=728&ssl=1)

引きこもり長男・次男調査(令和X年)

この表では、データを悪意をもって見せているといわれても仕方ありません。というのも、当然「引きこもりでない」と回答した人達もいて、以下のように開示できたからです。

本表では、見方が全く変わってきますね。長男・次男に関わらず、全体の1割が引きこもりであることが分かります。また単純に、長男は次男に比べて多いため(1人っ子は全て長男)このような結果になると考察できます。
このように、全回答データを見せないことは大きな誤解をもたらします。それを防ぐために、全ての回答データを開示する表は、クロス集計表と呼ばれます。
.png?w=728&ssl=1)

目次
Step # 1:CHITESTを使う前の基本情報
.png?w=728&ssl=1)

ここで、一つ目の基本情報。この仮説は統計学のマナーで、次の2つに分類されるの。
1:対立仮説と帰無仮説
1. 対立仮説(Alternative Hypothesis:もう一方の仮説)
2. 帰無仮説(Null(ifiable) Hypothesis:無効(かもしれない)仮説)
・〜ないで終わるのが帰無仮説
・CHITEST関数は、この内帰無仮説が正しいかどうかを判定する
2:カイ二乗検定とは
.png?w=728&ssl=1)


ところで、χ2 とはカイ二乗値(χ2)のことですが、これはCHITEST関数が出す答え(P値)とは異なります。P値とはχ2を比率変換したもので、わかりやすくするための処置なのです。
以下では、カイ二乗検定の2つのタイプごとに、χ2を求めます。
1. 適合度の検定(Goodness of Fit Test:(期待値との)適合の善良性検定)
例:ジャンケンを24回し、観測された値が4勝13敗7引分である時、期待値(確率1/3のそれぞれ8回)とどれだけ適合しているか検定する。ここでの仮説は以下である。
帰無仮説:観測値と期待値の間に、重大な差はない。
対立仮説:観測値と期待値の間に、重大な差がある。
Ex.
1. 期待値・観測値表から、 カイ二乗(χ2)値を求める。
(χ2は、個々の観測値と期待値の差を二乗したものを期待値で割り、足すことで求められます。)


2. カイ二乗(χ2)値を、以下の関係表からP値に変換し、帰無仮説を棄却できるかを調べる。
(もしP値が0.05(5%)を下回れば、帰無仮説を棄却できる。この0.05(有意水準)は慣例的に統計で用いられる。左軸の自由度(n-1)とは、選択肢で独立している変数の数。今回変数は3つ(勝・負・引分)あるが、内2つがわかれば3つ目もわかるので、自由度は2。)
各自由度ごとの、カイ二乗(χ2)値とP値(0.99〜0.01)の関係表

今回のχ2値は、5.25で、有意水準0.05を示す5.991よりも低い。つまり、0.05<P値<0.1なので、「帰無仮説:観測値と期待値の間に、重大な差はない。」を棄却(否定)できない。
・χ2をP値にすることで、その事象がおこる確率(P値)がわかる
・CHITEST関数だと、P値を上のプロセス無しで直接求められる
2. 独立性の検定(test for independence:独立への検定)
帰無仮説:「男・女であること」と、「共感能力の高い低い」には、重大な関係はない。
対立仮説:「男・女であること」と、「共感能力の高い低い」には、重大な関係がある。
CHITESTは、この帰無仮説を否定できるかどうかを、数値にして教えてくれる関数です。
先ほどのように、ここで調査を行い、カイ二乗(χ2)を計算した後に関係表から有意水準に当てはめてもいいのですが、CHITESTは、この過程を省略して、一気にその有意水準(P値)を教えてくれる関数です。
この否定できるかの基準値(有意基準)は0.05(5%)で、これより下であると否定できます。
この5%は、観測された結果になる可能性が5%(期待値との解離度合いに基づいて)よりも低いから、これは極めてまれであって、帰無仮説を否定できる(重大な差がある(適合度の場合)、重大な関係がある(独立性の場合))ことを示します。もし本例でCHITESTの答えが0.05を下回ったとすると、「男性か女性かは、共感応力の高低に関係がない」を否定(ないの打ち消し=ある) → 対立仮説「男性か女性かは、共感応力の高低に関係がある」可能性を示唆します。
.png?w=728&ssl=1)
Step # 2: CHITEST関数(独立性の検定)のつかいかた
1:観測値の表をつくる
今回は、「キャッチコピーの有無は、購買するかしないかに関係がある」という対立仮説をたて、調査を実施したとしましょう。
ちなみに、この帰無仮説は「キャッチコピーの有無は、購買するかしないかに関係がない」ですね。CHITESTは、これを否定できるかを教えてくれます。
キャッチコピー購買率調査(観測値, O)

上の結果が得られました。なんとなく、「キャッチコピーがあると、購買率が高くなる」ような気がしますが、購入しなかった人も多いので、確信は持てません…。次に期待値の表をつくります。
2:期待値の表をつくる
期待値は「(売上がキャッチコピーとか関係なく)平均通りであれば、こうなっただろうという数」です。
キャッチコピー購買率調査(期待値, O)

つまり、購買率の平均は2日間で550人/3600人=0.153(15.3%)ですね。もしキャッチコピー有りの日の購入人数も、この平均通りであれば、来客者2100人の内、15.3%、よって「2100*550/3600 = 321人」が購入するはずですね。これが、期待値上の購入人数になります。
3:CHITEST関数を使用する
さて、ここで観測値と期待値の差分を求めて…というカイ二乗を求める数式に入ってもいいのですが、ここを省略するためにCHITEST関数があります。観測値と期待値の表さえあれば、カイ二乗を求めることなく、帰無仮説を検定する基準値(P値)を教えてくれます。
観測値・期待値表から、CHITESTを行う

よって、対立仮説:「キャッチコピーの有無は、購買するかしないかに関係がある」は認められる
0.006は、有意水準0.05よりも小さいので、帰無仮説:「キャッチコピーの有無は、購買するかしないかに関係がない」を否定できる!つまり、「キャッチコピーの有無は、購買するかしないかに関係がある」と言える。
4:CHITEST関数の実践例
今回は、「江東区か品川区か渋谷区であることは、年齢別人口構成の割合に関係がある」という対立仮説をたて、調査を実施したとしましょう。
ちなみに、帰無仮説は「江東区か品川区か渋谷区であることは、年齢別人口構成の割合に関係がない」ですね。CHITESTは、これを否定できるかを教えてくれます。
都内3区アンケート回答者の年齢別人口調査(観測値, O)

アンケートによって、上の観測値(結果)が得られました。年齢別人口は各区に同じような割合で分布しており、「江東区か品川区か渋谷区であることは、年齢別人口構成の割合に関係がない」(帰無仮説は正しい)ように見えますね。
4-1:期待値表をつくる
期待値は「(年齢別人口割合が区に関係なく)平均通りであれば、こうなっただろうという数」です。
都内3区年齢別人口(期待値, O)

観測値・期待値表から、CHITESTを行う

よって、対立仮説:「江東区か品川区か渋谷区であること」と「年齢別人口構成の割合」には重大な関係がある、は認められない。
0.741は、有意水準0.05よりも大きいので、帰無仮説:「江東区か品川区か渋谷区であることは、年齢別人口構成の割合に関係がない」、を否定できない!つまり、「江東区か品川区か渋谷区であることは、年齢別人口構成の割合に関係がある」、とは言えない。