特権ではなくハイリスク投資としての名門学校

イギリスに移って三ヶ月が過ぎようとしている。移民としての生活に感じるところについてはまた後日書くこととして、今日は移住後に見かけた日本のニュースについてコメントしたい。国立大学附属学校の入試をやめて抽選による選抜に変えることで平等性を担保すべきという議論を見かけた。国立附属学校のOBとしてこれは大きな愚行であると考える。加えて、教育政策を立案する人々が何か勘違いしているのではないかと感じる点があるので持論を書きたい。勘違いという表現は、国立大学附属学校への進学は100%の成功を保証する切符であるという誤認を彼らが持っているのではないか、という著者の疑念から来ている。今回、移民後の依然として慌ただしい中で拙論を書いてみてエビデンスとなるデータを揃える時間がなかったため、今後機会のあるときに本稿をupdateしようと思う。

Disclosure: 著者は国立大学附属学校の一つである筑波大学附属駒場高校の出身である。

他の国立大学附属学校OBは日本の国力を維持するために、国立大学附属学校をむしろエリート養成機関として積極活用すべきである、という論陣を張っているようだ。ある程度バックグラウンドの知識がある人にはこれが正論であることがわかる。しかしエリートに搾取されているという被害妄想を持った人々にエリート教育のリターンを解くことはおそらくムダであろう。そこで本稿では他のOBとは違う視点から議論を展開しようと思う。

  • 他のOBの論陣は2つの意見が混合していることが多い。1つ目は日本の国力没落をエリート教育の不足に求めるものであり、2つ目の主張は国立附属学校は別に受験エリートの養成などしていないというものである。
  • 1つ目について。顕著に没落した日本の基礎研究成果や、スタートアップの成功度合いでもイスラエルや米国になかなか追いつけない日本の現状を彼らは危惧している。
    • 基礎研究の没落については、投資に対するアウトプットの比率で見ると日本は意外と悪くない(それでもイギリスやフランスの方が優れているが)
    • 後段の拙論と関係するが、ビル・ゲイツのような偉大な起業家は別に教育されたから出来上がった訳ではないことを考慮すると、エリート教育なるものが本当に必要かも実は怪しい。しかしエリートの卵を単に集めて濃縮するだけの介入には意味がある。これも後述する。
  • 2つ目については、それがTrueであることを著者自身の体験によって知っているので後述する。しかし自らがそれを体験しておらずしかも自分の人生に満足していない人というのは、被害妄想による疑念をやめようとはしないものだ。そこで以下では、教えないにことにこそ真髄があるというその実態を体験談として書いてみた。外野の人にももう少しリアリティが伝われば幸いだ。

存在しないリスク回避手段を求める人々

抽選推進を持ち出している人々は教育委員会のポスト保持者と一部の大学教授のようである。彼らの考えを総括すると、以下のように考えているように見受けられる 著者の誤認も含まれているだろうが、まずは本稿を一通り読んでから評価を下してくだされば幸いである。

  • 国立大学附属学校では、私立学校とは違って、安価な授業料で良質な教育が受けられる
  • この良質な教育が、本来授業料の安さを必要としていない富裕層に独占提供されている
  • その理由は、難しい入試問題を突破できるのが受験塾に授業料をつぎ込める富裕層の子弟だけだからである
  • ついては、諸悪の根源である入試を抽選による選抜に変えることで、このチャンスを富裕層の特権から庶民の資産へと転換することができる

著者の人生を振り返って感じることであるが、このような考え方は公立学校の教員や公務員に特徴的である。彼らには二つの顕著な特性がある。

  1. 彼らはリスクをとにかく嫌う。自分がリスク回避的なだけならまぁ仕方ないが、社会は誰かが他人のためにリスクを取っていかないと成り立たないのだ。私たちの今の落ち着いた生活を実現するために、過去にリスクを取って犠牲になった先人に対するリスペクトだけは忘れないでいたいものだ
  2. 彼らの頭は線形なメカニズムの仮定に支配されているため、常にinterventionismにとらわれる。彼らはsecond-order effectというものを理解していない

まず指摘したいことだが、別に国立大学附属学校に入っても安泰への切符は手に入らない。むしろ自分の今後の人生に対する危機感が発生し、そして実際彼らの多くはその後の人生で否応なしにかなりの危険に晒されるようになる。

内心はとても不安定な名門学校生活と多様性

実態はこういうことである。まず難しい受験問題をくぐり抜けて選抜されて来た子供達は、ほとんどの他の子供達よりも数学や社会的教養の点で優れている。その結果、別に学校の勉強ができてもちっとも尊敬の対象にならないという強烈なピアプレッシャーが発生するのである。もしある子供がアイデンティティを学力テストのスコアの高さに求めていた場合、彼の自我はとても危険な状態に落ちる。そこで子供達は、自分と他者との違いを大きくするものは何か、どのようにして自らのユニークネスを確保することができるのか自問自答し、その試行錯誤に6年もしくは3年の時間を費やしていくことになる。著者の母校の場合は、スポーツで良い成績を納めることはかなりの賞賛対象であったし、音楽活動に勤しむものも同様である。スポーツが賞賛されるのは特待選抜されるようなスポーツエリートが著者の母校にいなかったからで、そのような不利な環境で全国大会まで行くような努力家は尊敬の対象になる。

このユニークネスの追求と独自の価値観構築は、その後の職業人生に大きな影響を与える。それはユニークな研究テーマの選択であるとか、競合他社のことなど意識せず顧客の問題に集中するビジネス上の姿勢といったものだ。彼らは、逆風が多かろうと、他社の真似ばかりしている人々の対極に座ろうとする。他人と違っていることはとても良いことだという、多様性への賞賛を国立学校や多くの私立学校は育んでいる訳である。著者は市立の公立学校にも通ったからはっきりわかるのだが、多くの学校教員や教育委員会の監督者は、poorで独善的な教条を子供達に押し付けている日々について猛省して欲しい。なぜこのような共産主義シンパのまがい物みたいな人々が日本の教育機関にたくさん生まれたのかは著者にはよくわからない。歴史をさらに調べる必要があるだろう。ただ言えることは、英国や米国・カナダのような移民社会では当たり前のように是とされておりかつそれが経済的にペイしている価値観が、残念ながら公立学校でそれを伝えられていない日本においては、国立学校と私立学校が多様性確保に一役買っている訳である。

生徒には実はハイリスク・ハイリターン

さて、思春期に培われた独自人生への探求心だが、これは大人になってもずっとついて回る。自分の人生が平凡であることが恐ろしくなってくるのだ。そして彼らの多くがハイリスクな意思決定を行うようになる。最近10年ぶりに再会した親友を例にとると、彼はNGOの仕事でアフガニスタンにも行っているし、ワシントンD.C.滞在中には後頭部に銃を突きつけられてその時の貴重品を全て盗られた。その際に彼が強盗から英語で言われた言葉は次の通りだ。「顔を見たら殺す」これを正確に聞き取れずに、「えっなに?」などと言って振り返ったらあなたはもうこの世にいない。

要は名門学校に入ることは、ハイリスク・ハイリターンの投資をすることなのだ。もちろん名門学校に入ったあとでも、大学進学くらいの時点で諦めれば、極めて平凡な人生を送ることも不可能ではない。しかし思春期に培われたその価値観を捨て去ることは、自分をどこかで信じている子供達には難しい。結局のところ、名門学校への入学はハイリスク・ハイリターンの株式にほぼ全財産突っ込むようなものなのだ。一応はput optionもあるとは言えるものの。

先ほどの強盗にあった彼は今では欧州で息子を育てている。実はさらに驚きのstruggleがもう一つあるのだが彼のプライバシーを考慮しここでは書かない。彼のハイリスクな人生は、名門校通学をリスクフリーのフリーランチとして考え、抽選制でばらまいてポピュリスト的人気を取ろうとするような人々の人生観とはどう考えても対極にある。

役所の人々の人生はリスクレス・ミドルリターンと言えるだろう。著者が所属するヘッジファンドの世界では、リスクを取らずに追加で期待値が高められるような戦略にはalphaが存在する、という言い方をする。Alphaが存在すること自体は悪いことではないが、それは個人の並々ならぬ努力と忍耐の対価によって手に入れるものであって、努力をしない一部の人にただで配ってはならないのである(選択的にただでばらまくと市民社会の相互信頼を傷つける)。実際、Alphaの取得の難しさは経済学で言う所の効率市場仮説と関係しており、それは市場の公平性を一定量担保している。

もしAlphaが何の追加の痛みも伴わずに容易に、しかも一部の人にだけ与えられている場合、それは特権と呼ばれる。リスクレスでハイタリーンが手に入る特権が放置されている状況は社会的不公正である。雇用を公的に保護されている人たちは、純粋な親切心から、その特権を他の人にもちょっと分け与えてあげようと思ったのかもしれないが、そういう特権の存在が放置されること自体が、公正の観点から問題があるのだ。

名門校に入ることは少しくらいは期待値を高めるかもしれないが、大きなボラティリティを伴うため、これはAlphaを取っている訳ではなくてBetaを高めているだけだ。ハイリスク株式が万人に進めるべき資産クラスではないように、名門学校への通学も別に万人に勧めるべきものではないわけである。多くの名門学校は入学試験を課しているが、その後の人生の波乱に比べたら入学試験などというものはとても小さな試練である。その程度の小さな試練突破に対するcommitmentができない子供達を無理に名門学校に入学させるとむしろ人生に暗い影を落とすであろう。

今となってはオックスフォードにゆかりのできた著者としては、ここでノブレス・オブリージュについても言及しておきたい。第二次世界対戦時、オックスフォード大学やケンブリッジ大学に通っていた貴族の師弟は真っ先に戦死した。戦死したからといって貴族の特権が正当化されてはならないのだが、少なくともこちらのエリートはハイリスク・ハイリターンの人生を送っていたということだ。そのハイリスクには株式投資ロスのような金銭損失だけではなく、命の損失も場合によっては含まれているのである。

社会全体へは: 低コストでハイリターンのバフェット流投資

さて、ハイリスク株式を若くして取得した子供達が将来社会に何を残してくれるか考えてみよう。ここで重要になるのは国立大学附属学校が何をしているかである。著者の記憶を披露させていただくと以下のような感じだ。

  • ともかく異様にポテンシャルの高い同級生だけは集まった。なまじ頭がいいので、誰も他人の命令なんか聞かない。公立学校で行われているような、道徳的正当化からの説得は彼らには無意味である。どうやって何か新しいことを協業しようか?
  • 机はボロい。ファシリティは老朽化して汚い。校舎の保全は県立高校の方がマシなのではないか? 箱物公共工事建設業者泣かせであろう。国からの我が校に対する投資金額の低さだけは他校の生徒に自慢できそうだな
  • 母が保護者向けのガイダンスに出席してきたが、たった一本の鉛筆を持ち帰らないように教官から強くお願いされたそうである。数が極めて限定されているため、それがないと業務が滞ってしまうらしい 鉛筆一本だって?
  • 教官たちは、教養は確かにあるのだが、生徒の意向も意に介することなく勝手な雑学講義をdeepに進めているように見える
  • 生徒たちは、他の生徒の奇抜な行動には気が気でないようだが、教官に対する関心はてんで薄いようである。この人たちが何を「教えて」くれるというのか?

最近は文科省のスーパーサイエンスハイスクール(SSH)といったシステムも導入されているので以前より少し介入的な投資もしているだろう。しかし、国の「エリート養成機関」とやらの実態は、優秀な子供を集めて単に一箇所に放り込んだだけだった。しかしこの生徒たちが将来、社会的には大きなリターンを生んでいることは日銀の黒田総裁 (著者の高校の先輩である)がもたらした日本経済の変化や、後輩たちの起業成果を見ての通りである。生徒個人個人にはハイリスク・ハイリターンの人生でも、生徒を集めた集合体で見ると低コストでハイリターンの理想的ポートフォリオになっていたのだ。Warren Buffettに言わせれば、資本がかからず無限に利益を生み出すような企業の所有が理想の投資である。コストをかけなくてもハイリターンが出ているのに、なんでお役所の人たちはわざわざコストを増やしてROIを低くしようとしていたのだろう?

人材濃度の希釈化に対する脆弱性

この理想的な社会投資はしかし常にワークする訳ではない。この投資機会のeconomic moatはとても小さく、役人の変な介入によって容易に消滅してしまう危機に瀕しているのだ。

子供達をハイリスクな冒険へと駆り立てるものが、「座学勉強ができても賞賛されない」ことだった点を思い出して欲しい。もしここに抽選で、相対的に学力の不足している子供が放り込まれると以下のような事態が起きるであろう。

  • 元来の学力の高かった生徒たちは、座学勉強ができるだけで抽選組に対する優位性を確保してしまう。その結果、今まで保持されていたリスクテイクへのインセンティブが失われる
  • 高いcommitmentを示す前に大人の都合で抽選で入れられた子供たちの将来は全く不確実である。極端に言えば、このハイリスク・ピアプレッシャーで自我崩壊したりしないか?

このように双方の集団にとって、そして子供達への投資からリターンを得ようとしている我々市民全体にとってもおそらくはリターンを低める結果にしかならないであろう。そもそも日本では義務教育が保証されているのであって、他の子供達も普通に都立/県立高校へ進学できるのだ。それを差し置いてわざわざ国立学校を設ける正当化には、この国立学校が他の公立学校と違っていることという条件が必須である。

単に違ってさえいれば良いという視点からは、今の国立学校のバラエティが不十分である、という主張ならば一定の説得力があるだろう。学力の高さだけでかき集めた国立学校があるなら、芸術センスの高さだけでかき集めた国立学校があっても良い。これなら主張として成り立つ。その場合、芸術センスの高さで集めた生徒たちに対して芸術の講義はしない、という政策が要求される。この観点からすると、私立学校の一部で行われているスポーツ特待生にスポーツエリート教育をするというシステムは介入主義の幻想から抜けていない、と言えるだろう。スポーツエリートを集めるなら、スポーツができるということが何の自慢にもならない、という危機感を生徒に抱かせることが社会的投資の秘訣なのである。

介入/設計主義の不毛

最後に、なぜこのような議論が出てくるのか、日本のみならず世界中の公的機関に意識的 or 無意識的に内在する介入主義へのバイアス傾向について論じたい。中学時代、著者を耐えず不快にさせていた教員たちは、子供をスイッチのついたパネルか何かと勘違いしているようだった。例えるとこういうことだ。

  • 生徒には英語、数学、国語といったボタンがついている
  • 教師がそのボタンを押す(授業を通してやり方を教える)。子供は対応するボタンの機能を習得する

こんな現象は現実には存在しない。教師が英語指導をXポイント追加すると、子供は英語能力が0.3Xポイント向上する、というような線形システムが頭の中に埋め込まれている人々は、常に介入を正当化する。子供の英語力が足りない? じゃあ英語の授業をもっと増やそう。子供が非行に走る? じゃあもっと道徳の授業を増やそう。日本の大学しか卒業していない著者はオックスフォード大学のそばに置かせていただいているだけだが、著者がオックスフォードの入試問題を見た限り、こんな単純な線形社会システムを頭に描くような人物はオックスフォードの入学試験には絶対に合格しないと言える。

線形システムが頭にある人の特徴は物事を足し算していって複雑化させる点だ。本日、いったい教師の独善のためにどれだけの無駄な授業と説教が行われているのであろうか? 過去には、才能ある子供たちのポテンシャルをどれだけ潰してきたのであろうか?

一方、国立大学附属学校の低予算システムは、意図されたものだったかはわからないが、少なくとも引き算が有効に働いている。これらの学校では介入をせずただ放置しただけだった。才能ある人たちを集めて、その才能を自己否定させるような場所を提供するという、逆説的アプローチによって人材輩出に成功してきた。数学を教えたら数学ができるようになった、というような介入主義的発想はfirst-order effectばかり見ているが、否定によってリターンを得るこのアプローチはsecond-order effectを利用しているのである。

Second-order effectについて補足して本稿を終えることとしよう。ホメオパシー(代替医療)の効用について考えたことがあるだろうか? これはレメディと呼ばれる謎の物質を、その物質が1原子も含まれない濃度に水で希釈して投与するというものである。

まず伝えることとして、過去の膨大な実験によって、ホメオパシーには医学的な効能が全くないことがほぼ確実である。ここでnaiveな介入主義者は、「非科学的なホメオパシーをやめさせるべきだ」などという。もちろん、正当な治療方法が判明している病気に対してホメオパシーを施すのはよくない。しかし、その治療方法が不明かもしくは既存の方法が有害だったら?

ここで覚えて欲しいのが、ホメオパシーが有害であるという仮説も十分に棄却されているという事実である。つまりホメオパシーは人体にプラスもマイナスも何も及ぼさないのだ。

この結果、有害な過剰医療の代わりにホメオパシーを施された患者は長期的には自らの自己治癒能力で回復していく。ホメオパシーは、有害な医療行為から患者を遠ざけさせることで結果的に患者を回復させるのである。first-order effectの医療しか考えられない医師は肯定的材料だけを探して過剰医療をするが、ゼロがマイナスよりはマシであるというホメオパシーの結果に着目した医療行為はsecond-order effectを利用していると言える。

Second-order effectの効用は他にも色々ある。医療技術が未熟だった過去にはお祈りばかりしている宗教の多くがその役割を果たしたし、今でもある種の呪術行為はアフリカでインチキ医療行為やあるいはもっと過激派の宗教から患者や信者を遠ざけるのに役立っている。

介入行為の不毛に関する指摘はハイエクやポパー以来のオーストリアの伝統である。少なくとも民主主義国家をまだ自認している日本においても、彼ら偉大な哲学者に習ってみたらどうだろうか。国立大学附属校ではsecond-order effectを利用した「何もしない」「否定の」教育をもう少し続けてみるということだ。最安の設備投資で最良のリターンが待っているのだから。

広告

集合知の質: 1ドル1票か1人1票かあるいは? (2)

衆愚制や民主主義の危機が叫ばれる中で、単純な均等投票以外の集合知が民主主義陣営の強力なサポーターになってくれるかもしれない。集合知の質: 1ドル1票か1人1票かあるいは? (1) で、集合的意思決定手法の一つである予測市場について紹介し、その光と闇について論じた。予測市場の株価は予測対象に対する知見が高い人の予測に高いウェイトを振った加重平均値であり、これを予測値とした意思決定は低いバイアスを享受できる。実際にお金をかけさせることで真剣な予測値を作り出すことができる点、加えて人工知能・統計学アプローチと違って既存のビッグデータがなくても意思決定できる点は、プラットフォームとしてのアドバンテージとなる。しかし最近はUKのEU離脱をバイナリー値としては予測し損ねたという失敗例もある。最終株価が単純なアンケート or 選挙に比べて未来を正確に予想しているかどうかには、依然として議論があるだろう点を前回議論した。


普通の人たちを予言者に変える 「予測市場」という新戦略

今日は予測市場の最終株価以外の産物を役に立てられないか考えてみる。最終株価よりもすぐれた予測値を、統計学もしくは金融工学を駆使することで得られないだろうか。具体的には、予測市場が産み出した株価の時系列データと出来高等の個々の取引記録を利用することを想定する。議論のスコープからは今回は外すけども、予測市場株価を原資産に見立てたデリバティブ: 先物, オプションを作ったら更に予測精度が上がるかもしれない。

予測市場及びその派生市場で得られた多くの証券データは、それらを統計的アルゴリズムに入力することで最終株価よりも優れた予測値を生み出す可能性がある。また予測精度自体は同じであったとしても、過渡的なデータが予測対象に関するインサイトを提供する場合があり、その情報自体が市場参加者、つまり一般市民の政治的意思決定能力を向上する可能性もあるのだ。

過渡的な情報に価値があるという見解は、著者が効率市場仮説 (Efficient Market Hypothesis; EMH)を支持していないことに由来する。EMHが完全に成り立つなら最終株価以外の指標は役に立たない。EMHは市場が常に定常状態(=均衡)にいる、もしくは一瞬で定常状態に遷移すると仮定することでほとんどのトレーダーがリターンを取れない、と主張する。EMHの反証は統計的裁定機会の存在を示すことによって行われることが多いが、少なくとも短期トレードではこの裁定機会を見つける困難さゆえにEMHが想像以上に妥当に思えてしまうトレーダーも多い。ファンダメンタルズに基づいた中長期投資ではそれほど反証は難しくないのだが。

短期トレードが難しいとしてもEMHが完全には成り立っていないと言える根拠は、そのおかしな仮定にある。過渡状態と定常状態(=均衡)は明確に区別して議論しなければいけない。またこれらを明示的に区別することで、EMHが成り立たないなら株価はどうやって動くのかある程度モデルを立てることができる。モデルの設計と検証を立てるのはアカデミックな成果を争う研究領域となるのでブログでは避けることとしつつ、今回は過渡状態の方が定常状態よりも重要であるケースの一つを紹介したい。この背景を経て、予測市場の時系列データを残していくことが民主主義社会における大きな遺産になり得る可能性に気づいてもらえれば幸いである。

今回、過渡状態と定常状態の違いについて導入した上で、次回はどのような予測市場の過渡状態を残したいか、著者なりの政治的見解を書いてみようかと思う。今の所の素案にあるのは、「ある政治家が政策Xを実現するか否か」に賭ける予測市場であるが、もっと良いアイデアがあるだろうと思う。

定常状態(=均衡)はしばしば非現実的に見える

突然ではあるが p-美人投票 (p-beauty contest) というゲームを紹介したい。ここではp=2/3のケースを取り上げる。以下のルールのゲームで、各プレイヤーはどのような選択をするだろうか?

  • n (\geq 3)人いるプレイヤーが0以上100以上の整数を一つ、同時に選択する
  • 全プレイヤーの数値の平均値の2/3倍に最も近かったプレイヤーが優勝する

特に難しい点のない単純なルールであるが、図で例時すると図1のとおりである。この例では#1, #2, #3の3人のプレイヤーがそれぞれ35, 15, 22 と宣言し、平均の2/3倍である16に最も近かった#2が優勝した。あなたがプレイヤーの一人だとして、どの数字を選ぶか想像してほしい。平均値は他のプレイヤーの数字によって変わるわけだから、あなたはライバルを出し抜かなければいけない。

pBeautyContest

図1. (2/3)-beauty contestにおける意思決定と結果例

十分に頭の中で想像してもらえただろうか。そうであれば次に進もう。このゲームにはナッシュ均衡が一つだけある。それは全員が0を選択するというものである。そのロジックは次の通りである。

  • ゲームのルールを全くわかっていないナイーブなプレイヤー (これを0-step playerと呼ぼう)を想定すると彼らは0から100をランダムに選ぶのでその期待値は50である
  • 0-step playerを倒すことを想定している1-step playerは50 \times 2/3 = 33.33\ldots のため 33を選ぶだろう。1-step playerは0-step playerよりちょっとだけ先読みしている
  • 1-step playerを更に倒すことを想定している2-step playerは33 \times 2/3 = 22より22を選ぶだろう

こうしてk-step playerを倒す (k+1)-step playerのことを考えていき、全てのプレイヤーがお互いが完全合理的であると予想して無限遠まで読み切ると全員が0を選択することになる。簡単のためにk-step目までの期待値による説明を書いたが、期待値でなく他の代表値を使ったり、0-step, 1-step, …, k-step playersがそれぞれいる状況で(k+1)-step playerの振る舞いを考えても結論は同じである。2/3をどんどんかけていく等比級数の極限である0が均衡となる。先読みばかりしているエリートの選択というのはお互いに似てくるわけだ。またそのような共通の思考回路を暗黙に持つことで無難な幕引きを図るのがエリートの特徴とも言えるし、それこそが彼らがつまらない人物に見える主因かもしれない。

「今」は定常状態 or 過渡状態?

さて、ナッシュ均衡が0だということはわかった。しかしながら、あなたは本当に全員が0を選択すると思うだろうか? あなた個人が0を選択する可能性は十分著者も予見しているが、あなた以外の全員が0を選ぶとあなたが考えているとは、著者は思わない。実際のところ、この「全員が0」という均衡からは、ちょっとした撹乱によって容易に乖離しうる。例えば、

  1. もし他のプレイヤーがゲームの本質に気付いておらず、0よりずっと大きい数字を選択したら?
  2. もしプレイヤーの一人が、自分が負けてもいいのでエリート連中にダメージを与えてやろうと考えたら?

1.はプレーヤーの知性に限界を設けたケースで、2.はプレーヤーは賢いがわざと愚かに振る舞うケースである。理知的な大国間の交渉に比べて、テロリストやヒステリックな人物との交渉はより難しい。現実世界でのそのような読みの難しさをp-beauty contestは簡潔に表現している。

ナッシュ均衡の非現実性は、i) すべての人が一様に無限遠を見通している非現実的仮定や、ii) 確率的な撹乱を無視した決定論的思考 に由来する。実際のところ、[1][2]に掲載された実際の選択は表1の通りである。ゲーム理論家であっても彼らはこのような撹乱を想定しているのであって、0は選択していない。

  • ここでは[2]に掲載された簡略化された表を抜粋している。より広範な調査は[1]に掲載されている。

表1. (2/3)-beauty contestで実際の人間が選んだ平均値

グループ名 n: プレーヤー数
(グループから抽出)
グループの合計人数 選択された平均値
Caltech Board 73 73 49.4
80 year olds 33 33 37.0
High School Students 20-32 52 32.5
Economics PhDs 16 16 27.4
Portfolio Managers 26 26 24.3
Caltech Students 3 24 21.5
Game Theorists 27-54 136 19.1

表1で各グループの性質と選択結果を眺めてみるのはなかなか面白い。カリフォルニア工科大学のボードのお偉いさんたちはほとんどナイーブなプレーヤーのように振舞っていて、学生さんよりもずいぶん値が高い。お年を召されて真面目に考えなくなってしまったのだろうか? などと不謹慎な想像だって出来る – 実際のところ80歳の人たちの平均値も結構高い。さらに学びたい方のために補足: p-beauty contestはリチャード・セイラーの最新刊でも紹介されている。セイラー教授のキャリアの築き方も含めて (学生からの人気を維持するために137点満点のテストを作った話とか) 面白い一冊なので興味のある方はどうぞ。


行動経済学の逆襲 (早川書房)

表1で示されたように、ゲームの中に完全合理的でないプレイヤーが混じっている場合、たとえあなたがとても合理的であったとしても考え直す必要がある。そのような状況における予測値を定量的に与えてくれる方法論は認知階層理論 (Cognitive Hierarchy Theory; CHT) [1] と呼ばれている。各プレイヤーは自分は (k+1)-stepまで読めるが他人は最大でもk-stepまでしか読めないと考えている自信過剰家であり、0-step, 1-step, …, k-step playerの人口比を予想して選択を行っているというモデルを導入するのである。そして kの値と人口比分布を実データから推定することで高い予測値を得ようとするところが、完全合理性一本やりのナッシュ均衡と違っているわけだ。

参考: 機械学習アルゴリズムと行動ゲーム理論との関係

(この項目は参考文献を探している研究者向けである)

さらに撹乱を加えてより予測を精確にする場合、ナッシュ均衡を確率モデル的に一般化した質的応答均衡 (Quantal Response Equilibrium; QRE)を数値計算することになる。CHTが過渡状態で計算を止めるearly stoppingを行うのに対して、QREは確率を入れた上で無限遠まで計算する。しかしどちらもナッシュ均衡よりも初期状態 or 一様分布のような固定点に近づける 正則化として働く点は共通している。その具体論に立ち入るのは予測市場について議論する本題から外れるので割愛する。

参考書としては以下が優れているほか、そのうち機械学習との接点について別エントリーで紹介しようと思うので興味ある人は楽しみにしててほしい。ナッシュ均衡の計算は最尤推定と類似しており、QREの計算は明示的に事前分布を入れたMAP推定に近い。CHTはearly stoppingすることによって結果的に初期状態に近い予測値を出すため、近年のdeep learningで使われているearly stopping によるregularization (初期値に近づける)と類似している。


行動ゲーム理論入門

過渡株価を見ながら定常株価を予測する

p-beauty contestの(狭い)理論と現実との関係から一般化したいstatementは単純である。無限遠まで計算した定常状態よりも、過渡状態の方が現実に近い場合が存在する。あるいは撹乱を入れながら計算した「アニーリングされた定常状態」を計算するべきなのである。そのようなインプリケーションを予測市場に対して適用した場合、我々のやるべきことは明確だ。過渡状態とは個々の意思決定者が残した途中の記録であるから、注文情報や株価時系列データにその情報が含まれており、それを積極的に利用するということである。

p-beauty contestにおいてはk-step playerに(k+1)-step playerが勝とうとするプロセスは心の中で走る時間経過であった。一方、予測市場では 時刻 tまでの株価を見て 時刻(t+1)における投資家の振る舞いが決まってくる。この時刻は物理世界における実時間である。しかし各時刻 t のそれぞれにおいては、各投資家は他の投資家を出し抜こうとする心的プロセスを走らせる。つまるところ心的時間と物理的時間の両方における動力学が働くことになる。他の投資家が完全に合理的で彼らより高いリターンがあげられないのなら、どうして市場に参入するだろうか? 市場に参加するものはすべからく何処かで自信過剰なのであり、その自信過剰性と市場の相互作用が結果的に高精度な政治的意思決定を可能にするのである。

投資家の間の激しい競争を踏まえると、基本的には過去の株価の方が現在株価より正しいというケースは少ないであろう。しかしp-beauty contestの実データに見られる限定合理性からは、過去の株価から背後のマスター方程式を推定して現在株価よりも妥当な推定値を予測するというアプローチが不可能でないことも示唆される。より優れた計量アプローチでは、現在の株価 (price)をvalueの最良推定値とは考えないファンダメンタル投資家に発想が近くなるだろう。長期のファンダメンタル投資家は、定常状態から離れたおかしな過渡状態にいると判断した株式を購入する。そしてその過渡状態から数年のうちに定常状態に収束すると考える。定常状態を理解した上で過渡状態をモニターすることが大事だと見なしているわけだ。

民主主義の強化という我々の目的の場合、一つの政治的意思決定のために数年も待つことはできない。定常状態に収束するまで待っていられないケースが度々ある。UKのEU離脱予測失敗のケースでは、予測市場が本来持っている「賢い投資家に力を与え愚かな投資家を退場させる」時間が投票前に確保できなかった。ならば、過渡状態から計算機上でマルコフ連鎖を回して定常状態を先読みするとか、一部の投資家の認知バイアスをアラートで察知して異常値を排除する、といったデータ加工をしても良いはずだ。そのようにして修正された予測市場株価時系列の方が市場そのままの値よりも本質を突いているかもしれない。加えて、そのようなデータ加工プロセスをも公開することで、市民の意思決定能力が高まる可能性もある。

最後に一つだけ実例を紹介させていただきたい。2013年のACM SIGKDD (データマイニング領域におけるトップ国際会議) で発表された [3] では、フォード社が意思決定インフラとして予測市場を導入したことで得られたメリットについて言及している。この場合、例えば青い車を増やすべきか赤い車を増やすべきかという意思決定において、世界中の社員のボトムアップな知恵を集約するためのインフラとして、投資家である社員が賭ける予測市場が導入された。賭けに勝とうと思うと、各社員が一丸となって今の消費者の好みを調査したりお得意さんにヒアリングしたりする。

株価自体もそれなりに役立ったようであるが印象的な言及として、ニュースイベントと株価時系列との対応関係を取ることで、どういうニュースに社員が過剰反応したりするのか、どこで市場の変化があったのかがモニタリングできるようになった点があった。株価時系列一つ残すメリットは、その株価自身だけではない。他のデータと組み合わせて回帰分析を行うなど、もっと高度な知見収集インフラとして役立つわけである。ビジネスで勝利すべく血眼になって予想を行う投資家の知恵を公的・政治的領域にも役立てられるようになったら我々は民主主義国に暮らしていたことを今よりもずっと感謝するようになるだろう。

References

[1] C. F. Camerer, T.-H. Ho and J.-K. Chong, “A Cognitive Hierarchy Model of Games,” The Quarterly Journal of Economics, 119(3):861-898,  2004.

[2] T. H. Ho, N. Lim, and C. F. Camerer, “Modeling the psychology of consumer and firm behavior with behavioral economics,” Journal of Marketing Research, 43(3):307–331, 2006.

[3] T. A. Montgomery, P. M. Stieg, M. J. Cavaretta, and P. E. Moraal,
“Experience from Hosting a Corporate Prediction Market: Benefits Beyond the Forecasts,” Proceedings of the 19th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD 13), 1384-1392, 2013.

集合知の質: 1ドル1票か1人1票かあるいは? (1)

集合知、あるいは反対の集合愚に関する議論がますます盛んになってきていると感じる。民主主義の危機も部分的には叫ばれている。かといって、一人の独裁者が全てを決める社会に持続性がないことは多くの人がすでに知っている。独裁ではない意思決定方法には多くあり、その一部は市場を使って決める。詳しく知りたければ社会的選択理論 (Social Choice)に関する本を参照してほしいが、今回は市場を使ったものに焦点を絞る。市場を使ったアプローチは利点も大きいが完璧ではなく、その利用方法はさらに研究余地がある。市場が産み出したものの何を利用するかが大事なのだ。意思決定に用いる市場は予測市場 (Prediction Market)と呼ばれる。通常は最終株価あるいは現在株価が大事な予測値として使われるのだが、電子化された予測市場のあらゆる取引記録、つまり市場の過渡状態の記録に民主主義を強くする価値があるのではというのが現時点の著者の考えだ。

今日は予測市場の紹介と、その光と闇を取り上げたい。闇として、予測市場がUKのEU離脱予測に失敗したことを取り上げる。光に期待する声として、いわゆるシルバーデモクラシーを嘆く政府内の友人の参考意見を紹介する。その上で次回以降、市場の闇をグレーに変えていく方法論について議論したいと思う。予告だけしておくと次回のキーワードは行動ゲーム理論である。賢くない人たち同士の競争まで考えたより現実的なゲーム理論であり、賢い人が賢くない人の行動を読み間違えて損するケースも取り扱っている。ある意味でUKで起きたことを分析するのに向いたツールである。

投票と統計学

選挙のように、複数人の人の選択の平均を取ることで意思決定を行うケースがこの世にはたくさんある。各投票者の選択は、社会全体にとって「後付けで望ましいことがわかった」正解に対してノイズを乗せたものだと解釈することができる。大雑把には投票とは算術平均を計算する行為であり、たくさんのサンプル数 n を持ってくることで、ノイズ項を0に近づける。一人一人の予想は誤っていても集団の知恵は正解に近いことを期待するわけだ。

大衆は愚かで意思決定を任せてはいけないとあなたが思ったとしても、確率論的に考えれば独裁が望ましくないのは自明である。サンプル数 n(=1) の少なさゆえ推定誤差が高すぎる。この誤差を保ったまま意思決定を続けるとどこかの時刻でほぼ確実に破綻する。たとえ独裁者がアレクサンダー大王のように賢く彼の予想が平均的には真の正解に近かったとしても、n=1での大きすぎるバリアンスはそれをことごとくspoilしてしまう。

  • (独裁者にも実際には家臣がいるからn=1ではない。象徴的意味合いとしてn=1と書いている)
  • 高い誤差のおかげで破綻、というのはボラティリティの高い株をさらに借金して買うことと似ている。その会社が優良企業で長期的に成長するのだとしても、ある特定時点での逆風で債務超過になったらあなたに次のチャンスはない。
  • 一般にGreat manはGreat mistakesを犯すものだ。カール・ポパーが「開かれた社会とその敵」で議論したとおりである。


The Open Society and Its Enemies (Routledge Classics)

反対に、直接民主制は nを最大化することで意思決定の質におけるバリアンスを減らすアプローチである。推定誤差を減らそうというわけだが、この方法に反対する人は大衆が愚かだという観念を持っていることが多い。彼らは独裁制までは支持しないが寡頭制に近いアプローチを好む。nは1よりはある程度大きいが最大ではなく、知識階級が大きなウェイトを持った加重平均を考えようというわけだ。知識階級の方が良い予測値を持っているという仮定が十分に正しければ合理性はある。統計学的に見れば、バリアンスをある程度犠牲にするがバイアスを減らすアプローチであり、両者の合計が最小化できればアプローチは何でも良いということだってできる。

さて、日本国内の報道における知識階級の人々の意見だと、相対的に後者の考え方、つまりバリアンスを犠牲にしてバイアスを下げる考え方が強くなってきているように著者は受け取っている。例えば、UKにおけるEU離脱投票結果において、知識のない一般市民に離脱意思決定をさせてはならなかったとの言説がある。軍事や外交に関わる問題は知識階級と一般市民との知識差が大きすぎるため、知識階級内での投票にとどめた方が良いというわけだ。

著者としては、原則としてのこの知識階級ウェイティング論に異論はないのだが、今回のUK離脱から得られた示唆はむしろ均等ウェイティングの良さを再確認させるものだった。無論、外交問題を国民投票しろと言っているわけではない。知識階級が今回の結果を予測できなかったことと予測市場の失敗という事件が、知識人の予測能力をディスカウントすべき証拠の一つとして提示されたのだ。

予測市場 = 賢い or 金持ちほど票数が増える投票

単純平均を信じない人々にも何種類かいる。右派の富豪の一部は、金を持っている人の方がそうでない人より賢いのだから票がカネで買えるべきだと思っている。左派の知識人の一部は専門知識の深さによって票が増えるべきだと思っている。残る我々庶民は率直な感覚を覚えておくべきだ。どちらも傲慢であると。しかし、少なくとも右派の理想をすでに実現している投票システムがこの世には存在する。それが予測市場である。そして予測市場は左派の発想も内包している。だから予測市場について利点と欠陥を知ることは、あなたが傲慢な右派 or 左派と対峙する時の有効な知恵になるだろう。


普通の人たちを予言者に変える 「予測市場」という新戦略

予測市場とは、UK国民投票で言えば最終投票結果がStay or Leaveのどちらかになるかを予想して、予想した方向に株式をlong or shortする株式市場である。”Stay” stockに対して自分の好きな金額を賭けることができる。予想した方向が当たればあらかじめ決められた金額が受け取れ、外れると掛け金は紙くずになる。リターンは株式取得時の価格と最終的なpaybackとの比で計算される。例えば Stayが勝つと$1帰ってくる予測市場の現在株価が $0.4 だったら、集団として人類は40%の確率でStayが勝つと予測しているということだ。一つの大きな特徴は、競馬のように一回だけギャンブルして終わりではなく、その時々の情勢に応じて掛け金を追加したり損きりできる点である。この結果、最新の情報が株価に織り込まれるとされる。

途中から参入したり脱退できるという性質は強力な予測能力の根拠となる。例えばStayの株価が$0.4だが、投資家であるあなたの極めて精密な推定が60%の確率でStayだったとしよう。しかしどう見積もっても70%はないこともあなたは知っていたとする。あなたはStay株式を買って大きなリスクをとるべきだろうか? 答えは部分的にはそうだが、最後まで株式を持っていてはいけない。あなたのやることは次の通り。

  • $0.4の価格で株式を買う
  • 数日後、あなたの予想に世間が追いついて株価が$0.6に上がる
  • この時点で株式を売り抜けて利益を得る。これ以上持っていても、あなたの予測が正しい限り期待リターンはゼロだから。

要は本当の投票日まで待たなくても、各人が自分の予想にあったポジションを取ることができるわけだ。このポジショニング上の柔軟性があるため、そして金を儲けるためなら人は必死に先読みや調査をするので、予測市場の株価は無責任なアンケート回答よりも真実を反映しやすい傾向がある。自分の予測に絶大な自信がある人は、多額の金額を賭けるだろう。それが本当に正しいならその人は大金を儲け、次回はもっと大きな金額を賭けられる。一方、大言壮語したが外した愚か者は大金を失って市場から退出していく。つまり、賢い人ほど金が増えて投票ウェイトも上がってくる合理的な仕組みだというわけだ。ここで一つポイント: このウェイト上昇が合理的だと完全には納得しなかったあなたはセンスがある。次回の記事を待ってほしい

予測市場には、明確な既存データがないドメインでも予測を提供できるメリットもある。コンピューターを使った人工知能・統計的予測ではまずデータベースの整備が必要で、例えば途上国での投資はそれだけで大変だったりするのだが、予測市場は賭け事をする場所さえ作ってしまえば人々の脳の中の知識が勝手に株価という予測値に変換される。複雑なクエリーいらずのすぐれたデータベース作成システムでもあるのだ。

大きく外した予測市場と富裕投資家

このように原理上の多くの魅力を持った予測市場だが、実は今回のUK国民投票ではStay (Remain)に賭ける株価となっていた。しかし結果はLeaveとなり、市場の予測は失敗した、とされる。例えばThe Economistは次のような記事を掲載したほか、Financial Timesには賭けの内訳に関する記述もあった。

こういったの記事に対しては実際に予測市場を運営している側からは反論もあるようだ。この論争には行動経済学上の解釈も含まれているようなので、これから読み込もうと思う。著者はまだ要点を把握していないが、次回記事の執筆前には理解しておきたい。

Financial Timesの記事を読むと分かるが、今回の予測市場では、金額が小さい小口投資家の多くがleaveに賭けており、少数の富裕層が大金をstayに賭けていたようである。その合計をとった結果、市場全体の予想はstayであった。

さて、この少数の大金を賭けた「富裕層 or 知識人」は派手にお金を失ったわけである。この結果を見た人はある種のコモンセンスに従ってこう考えるはずだ。金額でウェイティングせずに予測した人の人数だけ見たらleaveと正しく予想してたんじゃないの? と。

彼らはお金を失った。だから次回以降も賭けを続けるならこの外した「賢くない」人たちの影響力は下がるだろう。しかしUKのEU離脱に関する予想は今回一回きりである。未来に約束されていたはずの市場の効率性はもたらされない。そして、少なくとも今回の投票においては「賢くない」人はアンダーウェイトされなかった。時刻 t での失敗/成功は 時刻 (t+1)以降にしか反映されないという性質が、しばしば致命的になるのだ。均衡(定常状態)ではなく、過渡状態を考えなければいけないのである – だからこそ次回行動ゲーム理論が鍵になるのだが。

責任を持たせる予測市場

しかし予測市場に依然として期待する人もいる。公務員の友人の中に期待している人がいると言ったらどう感じるだろうか。放漫財政にYESを言う高齢者に疲れ果てた人にとって、市場ベースの投票は福音にも聞こえるのである。

まず最初に断っておくと、著者にはシルバーデモクラシーが高齢化社会である日本の真の問題なのかどうかは不明である。シルバーデモクラシーではなく若者の投票率が低いことが問題だという考えもできる。つまり、全員が真面目に投票したら自然と集合知が発揮されて良い政治的選択をするのかもしれない、と。しかし投票をしない人たちがすでに投票をしている人と劇的に違っていてしかも既存の投票者よりも賢い選好を示すとは思い難い。投票しなかった人の選好という欠損値を補間しても、既存の投票率と似た分布しか示さないように思える。そしてその似た分布が結果的にもたらす政治的選択は現在のものと同一である。このあたりの欠損値推定がどうなるかは興味深いが、そのような社会実験を行うためには無記名投票ではなくて記名投票して回帰分析する必要がある。このような一様でない補間は投票の自由・安全を脅かす危険を持っているわけだ。

以降、仮にシルバーデモクラシーが日本の問題だとする。つまり老人は将来の日本の財政・次の世代の負担に対して無責任であり、自分だけが最後まで国富を浪費して若者の未来を奪っていくという考え方である。このようなモラルハザードが発生するのは、愚かな政治的選択による損失が現在時刻でなく将来時刻に発生することに原因がある。そして大衆迎合的政治家と高齢者が結託すると、この将来時刻の損失を効用関数に加えずに意思決定が行われてしまう。

この時、もし老人に愚かな意思決定をした場合には今すぐ損失を負わせることができるなら、彼らも将来の世代にとってよりマシなまともな選択をしてくれるという見方がある。公務員の友人は、老人に選挙投票させる代わりに予測市場で戦わせたいらしい。結局のところは日本の将来の世代に貢献するような政策に対する株主になってほしい、というわけだ。あなたが日本の将来にとって良いことを結果的に選んでいたらあなたはお金持ちになってますます生活がエンジョイできるし、その逆だったら代金を払ってもらうというわけである。特定の政策の採択に株価がつくと、その政策のトータルのペイオフを皆頑張って計算し、その結果として財政問題に対する市民のリテラシーが上がるという方法論なのである。

 

このような予測市場は、前述したUKの国民投票予測とは少し性質が異なると思われる。どの政治家が当選するか予測することにたいした意味はない。しかし個々の政策がもたらす将来のキャッシュフローを考えた時、それが将来の日本にとって望ましくないことがすぐに予見できるものであれば、その政策の株価は暴落するだろう。最終株価をもとに政策を決める場合には、そのような政策は実際に選ばれずに済む。

このあたりは著者も実現イメージがあやふやな段階で書いてることを承知いただきたい。友人も著者も民主主義の価値は依然として信じていて、ただ異時点間意思決定がもたらすモラルハザードをより効率的に緩和する方法を追求しているのである。市場はその魅力をある程度持っているが、わずかな時刻のずれが致命的になり得ることは闇の部分で触れたとおりである。この闇をどれだけ緩和できるかが、確率、統計、投資といったテーマで学びを続けるもののチャレンジだと思うわけである。