集合知の質: 1ドル1票か1人1票かあるいは? (2)

衆愚制や民主主義の危機が叫ばれる中で、単純な均等投票以外の集合知が民主主義陣営の強力なサポーターになってくれるかもしれない。集合知の質: 1ドル1票か1人1票かあるいは? (1) で、集合的意思決定手法の一つである予測市場について紹介し、その光と闇について論じた。予測市場の株価は予測対象に対する知見が高い人の予測に高いウェイトを振った加重平均値であり、これを予測値とした意思決定は低いバイアスを享受できる。実際にお金をかけさせることで真剣な予測値を作り出すことができる点、加えて人工知能・統計学アプローチと違って既存のビッグデータがなくても意思決定できる点は、プラットフォームとしてのアドバンテージとなる。しかし最近はUKのEU離脱をバイナリー値としては予測し損ねたという失敗例もある。最終株価が単純なアンケート or 選挙に比べて未来を正確に予想しているかどうかには、依然として議論があるだろう点を前回議論した。


普通の人たちを予言者に変える 「予測市場」という新戦略

今日は予測市場の最終株価以外の産物を役に立てられないか考えてみる。最終株価よりもすぐれた予測値を、統計学もしくは金融工学を駆使することで得られないだろうか。具体的には、予測市場が産み出した株価の時系列データと出来高等の個々の取引記録を利用することを想定する。議論のスコープからは今回は外すけども、予測市場株価を原資産に見立てたデリバティブ: 先物, オプションを作ったら更に予測精度が上がるかもしれない。

予測市場及びその派生市場で得られた多くの証券データは、それらを統計的アルゴリズムに入力することで最終株価よりも優れた予測値を生み出す可能性がある。また予測精度自体は同じであったとしても、過渡的なデータが予測対象に関するインサイトを提供する場合があり、その情報自体が市場参加者、つまり一般市民の政治的意思決定能力を向上する可能性もあるのだ。

過渡的な情報に価値があるという見解は、著者が効率市場仮説 (Efficient Market Hypothesis; EMH)を支持していないことに由来する。EMHが完全に成り立つなら最終株価以外の指標は役に立たない。EMHは市場が常に定常状態(=均衡)にいる、もしくは一瞬で定常状態に遷移すると仮定することでほとんどのトレーダーがリターンを取れない、と主張する。EMHの反証は統計的裁定機会の存在を示すことによって行われることが多いが、少なくとも短期トレードではこの裁定機会を見つける困難さゆえにEMHが想像以上に妥当に思えてしまうトレーダーも多い。ファンダメンタルズに基づいた中長期投資ではそれほど反証は難しくないのだが。

短期トレードが難しいとしてもEMHが完全には成り立っていないと言える根拠は、そのおかしな仮定にある。過渡状態と定常状態(=均衡)は明確に区別して議論しなければいけない。またこれらを明示的に区別することで、EMHが成り立たないなら株価はどうやって動くのかある程度モデルを立てることができる。モデルの設計と検証を立てるのはアカデミックな成果を争う研究領域となるのでブログでは避けることとしつつ、今回は過渡状態の方が定常状態よりも重要であるケースの一つを紹介したい。この背景を経て、予測市場の時系列データを残していくことが民主主義社会における大きな遺産になり得る可能性に気づいてもらえれば幸いである。

今回、過渡状態と定常状態の違いについて導入した上で、次回はどのような予測市場の過渡状態を残したいか、著者なりの政治的見解を書いてみようかと思う。今の所の素案にあるのは、「ある政治家が政策Xを実現するか否か」に賭ける予測市場であるが、もっと良いアイデアがあるだろうと思う。

定常状態(=均衡)はしばしば非現実的に見える

突然ではあるが p-美人投票 (p-beauty contest) というゲームを紹介したい。ここではp=2/3のケースを取り上げる。以下のルールのゲームで、各プレイヤーはどのような選択をするだろうか?

  • n (\geq 3)人いるプレイヤーが0以上100以上の整数を一つ、同時に選択する
  • 全プレイヤーの数値の平均値の2/3倍に最も近かったプレイヤーが優勝する

特に難しい点のない単純なルールであるが、図で例時すると図1のとおりである。この例では#1, #2, #3の3人のプレイヤーがそれぞれ35, 15, 22 と宣言し、平均の2/3倍である16に最も近かった#2が優勝した。あなたがプレイヤーの一人だとして、どの数字を選ぶか想像してほしい。平均値は他のプレイヤーの数字によって変わるわけだから、あなたはライバルを出し抜かなければいけない。

pBeautyContest

図1. (2/3)-beauty contestにおける意思決定と結果例

十分に頭の中で想像してもらえただろうか。そうであれば次に進もう。このゲームにはナッシュ均衡が一つだけある。それは全員が0を選択するというものである。そのロジックは次の通りである。

  • ゲームのルールを全くわかっていないナイーブなプレイヤー (これを0-step playerと呼ぼう)を想定すると彼らは0から100をランダムに選ぶのでその期待値は50である
  • 0-step playerを倒すことを想定している1-step playerは50 \times 2/3 = 33.33\ldots のため 33を選ぶだろう。1-step playerは0-step playerよりちょっとだけ先読みしている
  • 1-step playerを更に倒すことを想定している2-step playerは33 \times 2/3 = 22より22を選ぶだろう

こうしてk-step playerを倒す (k+1)-step playerのことを考えていき、全てのプレイヤーがお互いが完全合理的であると予想して無限遠まで読み切ると全員が0を選択することになる。簡単のためにk-step目までの期待値による説明を書いたが、期待値でなく他の代表値を使ったり、0-step, 1-step, …, k-step playersがそれぞれいる状況で(k+1)-step playerの振る舞いを考えても結論は同じである。2/3をどんどんかけていく等比級数の極限である0が均衡となる。先読みばかりしているエリートの選択というのはお互いに似てくるわけだ。またそのような共通の思考回路を暗黙に持つことで無難な幕引きを図るのがエリートの特徴とも言えるし、それこそが彼らがつまらない人物に見える主因かもしれない。

「今」は定常状態 or 過渡状態?

さて、ナッシュ均衡が0だということはわかった。しかしながら、あなたは本当に全員が0を選択すると思うだろうか? あなた個人が0を選択する可能性は十分著者も予見しているが、あなた以外の全員が0を選ぶとあなたが考えているとは、著者は思わない。実際のところ、この「全員が0」という均衡からは、ちょっとした撹乱によって容易に乖離しうる。例えば、

  1. もし他のプレイヤーがゲームの本質に気付いておらず、0よりずっと大きい数字を選択したら?
  2. もしプレイヤーの一人が、自分が負けてもいいのでエリート連中にダメージを与えてやろうと考えたら?

1.はプレーヤーの知性に限界を設けたケースで、2.はプレーヤーは賢いがわざと愚かに振る舞うケースである。理知的な大国間の交渉に比べて、テロリストやヒステリックな人物との交渉はより難しい。現実世界でのそのような読みの難しさをp-beauty contestは簡潔に表現している。

ナッシュ均衡の非現実性は、i) すべての人が一様に無限遠を見通している非現実的仮定や、ii) 確率的な撹乱を無視した決定論的思考 に由来する。実際のところ、[1][2]に掲載された実際の選択は表1の通りである。ゲーム理論家であっても彼らはこのような撹乱を想定しているのであって、0は選択していない。

  • ここでは[2]に掲載された簡略化された表を抜粋している。より広範な調査は[1]に掲載されている。

表1. (2/3)-beauty contestで実際の人間が選んだ平均値

グループ名 n: プレーヤー数
(グループから抽出)
グループの合計人数 選択された平均値
Caltech Board 73 73 49.4
80 year olds 33 33 37.0
High School Students 20-32 52 32.5
Economics PhDs 16 16 27.4
Portfolio Managers 26 26 24.3
Caltech Students 3 24 21.5
Game Theorists 27-54 136 19.1

表1で各グループの性質と選択結果を眺めてみるのはなかなか面白い。カリフォルニア工科大学のボードのお偉いさんたちはほとんどナイーブなプレーヤーのように振舞っていて、学生さんよりもずいぶん値が高い。お年を召されて真面目に考えなくなってしまったのだろうか? などと不謹慎な想像だって出来る – 実際のところ80歳の人たちの平均値も結構高い。さらに学びたい方のために補足: p-beauty contestはリチャード・セイラーの最新刊でも紹介されている。セイラー教授のキャリアの築き方も含めて (学生からの人気を維持するために137点満点のテストを作った話とか) 面白い一冊なので興味のある方はどうぞ。


行動経済学の逆襲 (早川書房)

表1で示されたように、ゲームの中に完全合理的でないプレイヤーが混じっている場合、たとえあなたがとても合理的であったとしても考え直す必要がある。そのような状況における予測値を定量的に与えてくれる方法論は認知階層理論 (Cognitive Hierarchy Theory; CHT) [1] と呼ばれている。各プレイヤーは自分は (k+1)-stepまで読めるが他人は最大でもk-stepまでしか読めないと考えている自信過剰家であり、0-step, 1-step, …, k-step playerの人口比を予想して選択を行っているというモデルを導入するのである。そして kの値と人口比分布を実データから推定することで高い予測値を得ようとするところが、完全合理性一本やりのナッシュ均衡と違っているわけだ。

参考: 機械学習アルゴリズムと行動ゲーム理論との関係

(この項目は参考文献を探している研究者向けである)

さらに撹乱を加えてより予測を精確にする場合、ナッシュ均衡を確率モデル的に一般化した質的応答均衡 (Quantal Response Equilibrium; QRE)を数値計算することになる。CHTが過渡状態で計算を止めるearly stoppingを行うのに対して、QREは確率を入れた上で無限遠まで計算する。しかしどちらもナッシュ均衡よりも初期状態 or 一様分布のような固定点に近づける 正則化として働く点は共通している。その具体論に立ち入るのは予測市場について議論する本題から外れるので割愛する。

参考書としては以下が優れているほか、そのうち機械学習との接点について別エントリーで紹介しようと思うので興味ある人は楽しみにしててほしい。ナッシュ均衡の計算は最尤推定と類似しており、QREの計算は明示的に事前分布を入れたMAP推定に近い。CHTはearly stoppingすることによって結果的に初期状態に近い予測値を出すため、近年のdeep learningで使われているearly stopping によるregularization (初期値に近づける)と類似している。


行動ゲーム理論入門

過渡株価を見ながら定常株価を予測する

p-beauty contestの(狭い)理論と現実との関係から一般化したいstatementは単純である。無限遠まで計算した定常状態よりも、過渡状態の方が現実に近い場合が存在する。あるいは撹乱を入れながら計算した「アニーリングされた定常状態」を計算するべきなのである。そのようなインプリケーションを予測市場に対して適用した場合、我々のやるべきことは明確だ。過渡状態とは個々の意思決定者が残した途中の記録であるから、注文情報や株価時系列データにその情報が含まれており、それを積極的に利用するということである。

p-beauty contestにおいてはk-step playerに(k+1)-step playerが勝とうとするプロセスは心の中で走る時間経過であった。一方、予測市場では 時刻 tまでの株価を見て 時刻(t+1)における投資家の振る舞いが決まってくる。この時刻は物理世界における実時間である。しかし各時刻 t のそれぞれにおいては、各投資家は他の投資家を出し抜こうとする心的プロセスを走らせる。つまるところ心的時間と物理的時間の両方における動力学が働くことになる。他の投資家が完全に合理的で彼らより高いリターンがあげられないのなら、どうして市場に参入するだろうか? 市場に参加するものはすべからく何処かで自信過剰なのであり、その自信過剰性と市場の相互作用が結果的に高精度な政治的意思決定を可能にするのである。

投資家の間の激しい競争を踏まえると、基本的には過去の株価の方が現在株価より正しいというケースは少ないであろう。しかしp-beauty contestの実データに見られる限定合理性からは、過去の株価から背後のマスター方程式を推定して現在株価よりも妥当な推定値を予測するというアプローチが不可能でないことも示唆される。より優れた計量アプローチでは、現在の株価 (price)をvalueの最良推定値とは考えないファンダメンタル投資家に発想が近くなるだろう。長期のファンダメンタル投資家は、定常状態から離れたおかしな過渡状態にいると判断した株式を購入する。そしてその過渡状態から数年のうちに定常状態に収束すると考える。定常状態を理解した上で過渡状態をモニターすることが大事だと見なしているわけだ。

民主主義の強化という我々の目的の場合、一つの政治的意思決定のために数年も待つことはできない。定常状態に収束するまで待っていられないケースが度々ある。UKのEU離脱予測失敗のケースでは、予測市場が本来持っている「賢い投資家に力を与え愚かな投資家を退場させる」時間が投票前に確保できなかった。ならば、過渡状態から計算機上でマルコフ連鎖を回して定常状態を先読みするとか、一部の投資家の認知バイアスをアラートで察知して異常値を排除する、といったデータ加工をしても良いはずだ。そのようにして修正された予測市場株価時系列の方が市場そのままの値よりも本質を突いているかもしれない。加えて、そのようなデータ加工プロセスをも公開することで、市民の意思決定能力が高まる可能性もある。

最後に一つだけ実例を紹介させていただきたい。2013年のACM SIGKDD (データマイニング領域におけるトップ国際会議) で発表された [3] では、フォード社が意思決定インフラとして予測市場を導入したことで得られたメリットについて言及している。この場合、例えば青い車を増やすべきか赤い車を増やすべきかという意思決定において、世界中の社員のボトムアップな知恵を集約するためのインフラとして、投資家である社員が賭ける予測市場が導入された。賭けに勝とうと思うと、各社員が一丸となって今の消費者の好みを調査したりお得意さんにヒアリングしたりする。

株価自体もそれなりに役立ったようであるが印象的な言及として、ニュースイベントと株価時系列との対応関係を取ることで、どういうニュースに社員が過剰反応したりするのか、どこで市場の変化があったのかがモニタリングできるようになった点があった。株価時系列一つ残すメリットは、その株価自身だけではない。他のデータと組み合わせて回帰分析を行うなど、もっと高度な知見収集インフラとして役立つわけである。ビジネスで勝利すべく血眼になって予想を行う投資家の知恵を公的・政治的領域にも役立てられるようになったら我々は民主主義国に暮らしていたことを今よりもずっと感謝するようになるだろう。

References

[1] C. F. Camerer, T.-H. Ho and J.-K. Chong, “A Cognitive Hierarchy Model of Games,” The Quarterly Journal of Economics, 119(3):861-898,  2004.

[2] T. H. Ho, N. Lim, and C. F. Camerer, “Modeling the psychology of consumer and firm behavior with behavioral economics,” Journal of Marketing Research, 43(3):307–331, 2006.

[3] T. A. Montgomery, P. M. Stieg, M. J. Cavaretta, and P. E. Moraal,
“Experience from Hosting a Corporate Prediction Market: Benefits Beyond the Forecasts,” Proceedings of the 19th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD 13), 1384-1392, 2013.

広告

投稿者: rikija

機械学習・認知科学・投資アルゴリズムの研究者。作曲家 (アマチュアですが鋭意努力中) Twitter: @rikija / https://twitter.com/rikija 論文実績等は https://sites.google.com/site/rikiyatakahashi/ を参照

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト /  変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト /  変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト /  変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト /  変更 )

w

%s と連携中