SSブログ

都知事選,散らばりの小ささ

 最近の国政選挙では,開票結果が本当に正しいのだろうか,ひょっとして数字が操作されているのでないか,といった可能性が,いろいろ指摘されている.孫崎亨氏が指摘しているのは東京都知事選挙の結果で,平成26年の選挙で当選した舛添要一氏の得票数が,平成24年に当選した猪瀬直樹氏の得票数の0.48倍になるという事実だ.東京23区のどこでも0.48倍で,このような均一性が自然に起こるとは考えづらいという.
https://www.youtube.com/results?search_query=%E5%AD%AB%E5%B4%8E+%E4%B8%8D%E6%AD%A3%E9%81%B8%E6%8C%99

 また,平成23年の石原慎太郎氏の得票が,平成24年の猪瀬氏の0.6倍になる,という「不自然さ」を指摘する人もいる.選挙結果の数値は東京都選挙管理委員会のホームページに掲載されているので,これらの指摘がどれほど当たっているかを,まず確かめようと思う.そして,もし指摘通りであるならば,そういう事がなぜ起こったのかを調べることが,次の作業になる.

1.散らばりの大きさ
 以下は東京23区に限って話を進める.まずH26舛添/H24猪瀬 の比を23区それぞれについて計算する.この23個の数字について平均と分散を求める.蛇足ながら,分散(variance)とは「散らばりの大きさ」を示す数字である.H26舛添/H24猪瀬の場合,平均(平均値ともいう)は0.486,分散は0.00026となった.

 で,この数字は小さいのだろうか.「通常なら,この程度の値になる」という情報が必要だ.過去の都知事選に何度か立候補している人について,2回の選挙の得票数の比を調べてみる.たとえば宇都宮健児氏,ドクター中松氏,マック赤坂氏などである.ただし得票数があまりに少ない候補は,誤差が大きくなると考えられるので,考慮しないことにする.

 もう1つ気付いたことがある.それは,比率の数値が大きくなるにつれ,分散の値もまた大きくなることだ.この効果をできるだけ減らすために,平均値が0.48に近い例だけを調べる.必要なら分母と分子を逆にする.たとえば H24猪瀬/H23石原は平均値が1.6程度であるが,分母と分子を逆にすれば 0.6程度になる.

2.分散比
 分散が求まれば,比較したい2つの分散の比,つまり分散比を計算すれば良い.数値の小さいほうを分母にする,という注意が必要だ.分散比はF-分布に従う. 何とアバウトな! と叱られそうだけど,厳密な「統計的検定」でなく1つの目安ぐらいに考えてFの確率を調べる.

 一般に,統計的検定では,「有意水準」というものがある.多くの場合,確率が5%より小さければ,その事象は「メッタに起こらない」と判定される.もっと厳しく,確率1%を基準にとることもある.この5%とか1%とかを「有意水準」という.

 今回のデータではn= 23個の数字の平均と分散であるから,自由度 n-1 は22.そういう分散の比をとったのだから,分散比F の自由度は分子分母ともに22である.F がどういう値より大きければ2つの分散が「等しくない」と判定されるかというと,5%水準ならF = 2.04 程度である.1%水準なら F = 2.78 程度.
 なお,エクセルの関数では次のように入力すれば確かめられる.
= FDIST ( 2.04, 22, 22)
または
= FDIST ( 2.76, 22, 22)
 それぞれ0.05または 0.01 程度の数値が表示されるはずです.

3.計算した結果は
 次の表では H26舛添/H24猪瀬 を分母に置いて,分散比を計算している.3〜6の中松氏や赤坂氏の分散に比べ,舛添/猪瀬 や石原/猪瀬の分散はゼロが1つ多い.そして実際 舛添/猪瀬の分散を分母にして分散比を求めると,2.78よりずっと大きな数値になる.対して,石原/猪瀬 は,舛添/猪瀬 と有意差がない.

“分散比 打出用.xls”のプレビュー.jpg

 表に書かれてない宇都宮氏についてはどうだろうか.H26宇都宮/H24宇都宮 は平均値 1.047,分散0.00721である.これと比較できる平均値のものとして H19石原/H23石原 がある.後者の平均値は1.058,分散は0.00173 である.よって分散比Fは,
F = 4.17
程度の値となる.これは1%水準の2.78より大きい.

 以上,まことにアバウトな計算で,ツッコミどころ満載の計算であるが,いちおうの結論は:
 舛添/猪瀬 だけでなく,石原/猪瀬も,石原/石原も,いずれも地区ごとの変動が著しく小さい.
ということだ.議論の出発点,つまり「1.散らばりの大きさ」に書いた問題設定の,これが答だ.

 じつは,舛添,猪瀬,石原の3氏については,地区ごとの得票数は,それぞれの地区の有権者数とみごとに比例している.元データをダウンロードして,自分で確かめてみてください.

4.エピローグ
 「これが答だ」と書いてしまったけれど,「とりあえずの」答というべきかもしれない.本当はもっと研ぎすませねばならないのだけれど,ここでは大まかな道筋のみを書きました.

 相関係数による分析をしている人もいる.
http://ameblo.jp/ghostripon/entry-11798680218.html
それも1つの方法である.今回は別の方法を紹介した.とにかく日本中で,もっと多くの人に,都知事選のデータを検討してほしい.話題にして欲しい.舛添氏の得票は不自然なのか,不正があったのか,等は,その先の問題だ.

この広告は前回の更新から一定期間経過したブログに表示されています。更新すると自動で解除されます。