ヤフーのビッグデータによる選挙予測から学ぶこと

2013年7月21日に投開票された参院選、ネット選挙解禁と共に私が注目していたのがヤフーのビッグデータによる選挙予測だった。これは相関モデルと、投影モデルという二つの手法で選挙予想が行われている。

・相関モデル 得票実績と検索量による予測
 前回の衆議院選挙レポートの結果を元に分析を行い、各政党ごとの得票への繋がりやすさを補正し、特定期間における検索量から得票数を推定する

・投影モデル 検索量に基づくネットの盛り上がりによる予測
 過去の選挙事例を元に、公示日前後における検索量の変化を増加率としてスコア化し、得票数の推定をしたもの

この二つの予想モデルと、今回の参院選の実績による差分を比較したのが下表になる。まず、与党76議席、野党45議席という実績に対しては、相関モデル、投影モデルの両方でピタリと一致させることに成功し、大枠の傾向を占う分には十分実用性があることを実証した。

ヤフーのビッグデータによる選挙予想

細かい内訳に目を向けるとネットの盛り上がりを取り入れた投影モデルの方が精度が高かったようだ。投影モデルでビッグデータの予想より議席が少なかったのが、自民党-2議席、民主党-3議席。与党、野党という観点で見ると自民党のマイナス分を公明がカバーし、民主党の議席を他の党が奪った格好となった。細かい誤差はあったものの、こちらも各党の獲得議席を占うという点では実用十分と言える結果となった。

■公示日前のデータでもかなりの精度

ヤフーはこのビッグデータによる予想を三回に渡ってレポートしていたが、5月28日~6月21日のデータを用いた第一回目の予想時点から与党78議席と予想していたため、誤差は2議席。公示前からこういった傾向がわかると各党の戦い方や、株式市場にも影響を与えうる可能性も秘めているのではないだろうか。

そして、もっとも重要な点ではあるが、こういった選挙予想がコンピュータの力によって、ある程度は事前に予想することが可能な時代が訪れた。しかし、この予想は「私たちの過去の行動」から推測された未来であることを忘れてはいけない。このコンピュータの予想する未来は「変えることが出来る未来」なのだ。ビッグデータの予想を裏切るにはどうすれば良いか?ビッグデータの予想していなかった事態、すなわち「若年層の投票」によって、この未来は簡単に変えることが出来る。

選挙の結果を見て落胆することだけが私に出来ることでは無い。事前に予想された結果から未来を変えることが出来るようになったのだ。未来を創るのはビッグデータの予想か、私達の行動か、全ては「国民一人ひとりの行動」に委ねられている。



この記事のタグ: ,


関連する記事

  • オラクルCCO、ボブ・エバンス。「オラクルがクラウドを理解していないという世論は馬鹿げている」

  • 書評:データサイエンティスト データ分析で会社を動かす知的仕事人

  • 変化するコンシューマという定義

  • データ・サイエンティストの実像についてAgoop柴山さんと対談します

  • 「組織の壁」を越えた日本企業達。新刊「ビッグデータ・アナリティクス時代の日本企業の挑戦」

  • 国民所得によってスマートデバイスの普及OSが異なっている

  • 孫正義氏が語った、ビッグデータが生み出す新たな収益源

  • ハリーポッター祭りが挑戦する、テレビ局にとっての番組ホームページのあり方とは?

  • スマートグリッドとは?

  • ビッグデータが世界に与える影響をまとめた Infographics by EMC


  • プロフィール

    大元隆志(おおもと たかし) 通信事業者のインフラ設計、提案、企画を12年経験。異なるレイヤーの経験を活かし、技術者、経営層、 顧客の三つの包括的な視点で経営とITを融合するITビジネスアナリスト。業界動向、競合分析を得意とする。Yahoo!ニュース講談社 現代ビジネスCNET翔泳社EntepriseZineITmedia マーケティングITイニシアティブ、等、様々なIT系メディアで活躍する。SNSビジネス特集でNHK教育テレビに出演。ソーシャルメディア系イベントしては国内最大級となるソーシャルカンファレンス主催者。著書に「ビッグデータ・アナリティクス時代の日本企業の挑戦」「ソーシャルメディア実践の書」、「IPv4アドレス枯渇対策とIPv6導入」がある。所有資格 米国PMI認定PMP、シニアモバイルコンサルタント等。