| Home |
2007.10.25
血液型ハラスメント?
ワトソン博士差別発言・・・という記事から導かれたこの記事にうっかりとらわれてしまった。
福岡県警の免許講習で血液型と事故確率との関係を講義していたというのが以前問題になったらしい。なんでもO型が一番事故る割合が多いそうだ。・・・本当か?この手の確率の話はいつもうさんく感じる。そこで自分で検証してみることにした。
福岡県警の免許講習で血液型と事故確率との関係を講義していたというのが以前問題になったらしい。なんでもO型が一番事故る割合が多いそうだ。・・・本当か?この手の確率の話はいつもうさんく感じる。そこで自分で検証してみることにした。
記事には実数はなく割合しか書いていない。
加害事故者の割合はO,A,B,AB型の順に35.6、34.3,19.6,10.5%、
日本人の平均血液型分布は同順30.7%、38.1%、21.8%、9.4%
・・・。確かに微妙なところである。AとOの順が逆転しているところがいかにもそれらしい。
加害事故者の血液型分布が日本人の平均血液型分布に比べて有意に偏っているかを調べるため、まずはこの割合をそのままカイ二乗検定で比較検定してみる。
観測値(加害事故者の血液型分布)35.6、34.3,19.6,10.5
期待値(日本人の平均血液型分布)30.7、38.1、21.8、 9.4
観測値が生じる確率 0.679542893
つまり加害者事故の血液型分布は68%の確率で偶然に起こりうるというわけです。
やはり偏りなんかないね!
・・・と単純には喜べない。
上のデータは比率だが、検定結果は調査対象者の実数で変わってくる。
例えば上の比率が1000人の人間について調べた結果だとした場合、実数は、
観測値 356、343、196、105となる。同じく期待値も
期待値 307、381、218、94とする。すると
観測値が生じる確率 0.001718301
観測値が偶然に生じる確率は1.7%。この場合かなりハッキリと偏りが肯定されたことに。。
いやでも500人ならどうよ?
観測値 178、171、98、52
期待値 153、190、109、47
観測値が生じる確率 0.056058071
うーむギリギリ外れているがそれでもかなり。
同様に750人とした場合は0.0100でやはり低い。
実際にどの位の人数調べたかはわからないが、保険会社のデータだから数は多そうである。
従って、上の例の場合、大体500件以上(適当に濁す。。)のデータから出した割合であるならば、加害事故者には有意にO型が多いというのは統計的には正しい。
まあしかし、この手のデータというのは数が増えるとちょっとした違いでも有意差が出やすくなる。有意な相関を出したかったらデータを増やせばいいなんていう冗談があるくらいだ。
加えて上の例だと血液型の他にも影響しそうなパラメタが幾らでもあるので、この程度の差では血液型が事故に関係しているというにはあまりにも無理がある。敢えて他のパラメタを無視して意図的に血液型との相関を作り上げた、といわれても仕方ないくらいに。
さらには期待値にだって問題がある。
日本人の平均血液型分布と比較するのが正しいのかどうか?
敢えて血液型信仰に則って考えるならば、例えばA型の人は慎重なので車の免許を持っている人の割合が少ないかも知れない。或いは免許を持っていても日頃運転しない人が多いかも知れない。この場合、正しい期待値は「免許を持っていて且つ実際に運転をしている人」に限って算出しなければならない。
そんなことを加味すると上の記事の差の意味がますますなくなってくる。
ハラスメント云々以前の問題である。
ところで、コレがもし他の血液型だったら私はここまで一生懸命に検証しただろうか?そんな私の血液型は勿論・・・
加害事故者の割合はO,A,B,AB型の順に35.6、34.3,19.6,10.5%、
日本人の平均血液型分布は同順30.7%、38.1%、21.8%、9.4%
・・・。確かに微妙なところである。AとOの順が逆転しているところがいかにもそれらしい。
加害事故者の血液型分布が日本人の平均血液型分布に比べて有意に偏っているかを調べるため、まずはこの割合をそのままカイ二乗検定で比較検定してみる。
観測値(加害事故者の血液型分布)35.6、34.3,19.6,10.5
期待値(日本人の平均血液型分布)30.7、38.1、21.8、 9.4
観測値が生じる確率 0.679542893
つまり加害者事故の血液型分布は68%の確率で偶然に起こりうるというわけです。
やはり偏りなんかないね!
・・・と単純には喜べない。
上のデータは比率だが、検定結果は調査対象者の実数で変わってくる。
例えば上の比率が1000人の人間について調べた結果だとした場合、実数は、
観測値 356、343、196、105となる。同じく期待値も
期待値 307、381、218、94とする。すると
観測値が生じる確率 0.001718301
観測値が偶然に生じる確率は1.7%。この場合かなりハッキリと偏りが肯定されたことに。。
いやでも500人ならどうよ?
観測値 178、171、98、52
期待値 153、190、109、47
観測値が生じる確率 0.056058071
うーむギリギリ外れているがそれでもかなり。
同様に750人とした場合は0.0100でやはり低い。
実際にどの位の人数調べたかはわからないが、保険会社のデータだから数は多そうである。
従って、上の例の場合、大体500件以上(適当に濁す。。)のデータから出した割合であるならば、加害事故者には有意にO型が多いというのは統計的には正しい。
まあしかし、この手のデータというのは数が増えるとちょっとした違いでも有意差が出やすくなる。有意な相関を出したかったらデータを増やせばいいなんていう冗談があるくらいだ。
加えて上の例だと血液型の他にも影響しそうなパラメタが幾らでもあるので、この程度の差では血液型が事故に関係しているというにはあまりにも無理がある。敢えて他のパラメタを無視して意図的に血液型との相関を作り上げた、といわれても仕方ないくらいに。
さらには期待値にだって問題がある。
日本人の平均血液型分布と比較するのが正しいのかどうか?
敢えて血液型信仰に則って考えるならば、例えばA型の人は慎重なので車の免許を持っている人の割合が少ないかも知れない。或いは免許を持っていても日頃運転しない人が多いかも知れない。この場合、正しい期待値は「免許を持っていて且つ実際に運転をしている人」に限って算出しなければならない。
そんなことを加味すると上の記事の差の意味がますますなくなってくる。
ハラスメント云々以前の問題である。
ところで、コレがもし他の血液型だったら私はここまで一生懸命に検証しただろうか?そんな私の血液型は勿論・・・
| Home |
