Integrityと資本配分と高ROCからの再投資

先日のBerkshire Hathaway Inc. Annual Shareholder Meeting出席に関してもう少し話を続ける。著者はOmahaへの渡航時には Value Investor Conference (VIC) 及び併催されるSummitに出席している。昨年はPhilanthropy Summit, 今年はCorporate Values Summitが開催された。VIC本会議が投資手法や経済環境そのものについて議論することが多いのに対して、Summitは投資における価値観 (values) を議論する。技術者の人たちには価値観を議論するカンファレンスというのは馴染みが薄いかもしれない。しかし実は技術よりも価値観と哲学こそが不確実性の高い時代を生きていくにあたって最も大事なものだと、著者は自信を持って伝えたい。本稿では価値観が投資基準にどう影響し、そしてビジネス上の意思決定にどうつながるのかについて議題を提供したい。

Robert P. Milesへの感謝

VICに加えて、2017年の著者はGenius of Warren Buffett  (GOB)というバリュー投資家のためのExecutive MBAのクラスに出席した。VIC, GOB共にインストラクターの Bob Miles (Robert P. Miles) が作り上げてきたプログラムである。

彼と話していると、そしてプログラムに出席していると、Bobのintegrityの高さが伝わってくる。WarrenやCharlieのvaluesがそのまま彼にも共有されていることがよくわかる。VICやGOBの講師はBobによって本当に注意深く選定されており、講演者と受講者のいずれからも信頼されている。米国では彼は著名人なので宣伝目的で近づいてくるファンドマネジャーが大量にいるのだが、彼はそういった人々を避け、正しい価値観の元で投資が続けられるように受講生や出席者を助けてくれる。

Bobは作家として認知されていて、彼の著者の一部は日本語にも翻訳されている。The Warren Buffett CEOの邦訳を紹介しておくが、Warren Buffet Wealthもお勧めである。

最高経営責任者バフェット~あなたも「世界最高のボス」になれる (ウィザードブックシリーズ)

Warren Buffett Wealth: Principles and Practical Methods Used by the World’s Greatest Investor

著者はGOBコースの日本人修了生第1号だそうであるが、第2号以降が読者の中から現れることを願っている。たった3日間の受講で、日本の国立大学授業料の半年分くらいの費用がかかってしまうのだが、この講座で身につけた倫理観と規律はこの後の人生においてずっとあなたを助けてくれると思う。リターンを追求する投資だけではなく、投資による資本配分がリアルのビジネスにどう影響するのか、なぜintegrityがmatterするのかがよく分かるのだ。

ここではGOBおよびVICに来てくれた講演者の中で特に印象的だった2人をピックアップしたい。1人目はNebraska Furniture Mart (NFM)の前CEOであるBob Battである。2人目はInvesting Between the Linesを出版したL.J. Rittenhouseである。彼ら以外にもWarrenの長女であるSusie BuffettやNational Indemnity Company (Berkshire傘下で大変な利益をあげている保険会社である)のCEOであるDonald F. Wursterといった豪華スピーカーと身近に話すことができて大変貴重な時間であった。

Integrityと再投資との関係

Bob Battは慎重さとリテール・ビジネスにおけるあらゆる知見、そして何より次世代に対する思いやりを持った、尊敬できる老人の代表みたいな人である。バフェットの専門をCapital AllocationからRetail Businessに変えると全てそのまま彼になるかのようだった。彼はcandorのある人物で、オンラインのe-コマースや消費にお金を使わないミレニアル世代など、自分たちのビジネスに現在吹いている逆風についても率直に語った。NFMはMrs. Bとして知られるRose Blumkinが創業した。Bobは彼の家系がMinsk (今はベラルーシ、当時はロシア)からどうアメリカに渡って来たのか話してくれた。

NFMは巨大な一店舗にあらゆる家具とアプライアンスが置いてあるblock and mortal storeである。実際のところAshley (たまたまであるが著者の自宅の近所に日本支店があって知っている) など質の高い家具がかなり安く買えるので、インテリア好きの人はアメリカ中西部に行くチャンスがあったらぜひ訪問してみることをお勧めする。Bob自身はNFMからは引退して今は子供たちを助ける慈善事業に全力を注いでいる。リテール・ビジネスにおけるインサイトは慈善事業の経営や政府の運営など公益の追及にもとても役立つそうだ。

NFMや同じくBerkshire傘下で宝飾品の販売を手がけているBorsheimsなどは、他のリテールビジネスとは異なった性質を持っている。店舗数がものすごく少なくて基本的にはsingle-storeで全てを提供するのだ(注: NFMは全米で4つしか店舗がなく、そのいずれも巨大である)。多くのbrick & mortal retail businessでは、小さな店舗をたくさん建設するfranchiseの形式を取る。NFMやBorsheimsは逆である。しかし、たった1店舗にものすごい在庫があってなかなか買い物が楽しく、しかも価格も競合より安い。日本で言うと、東急ハンズが定価販売ではなく量販店と同じ値段で売っているようなイメージだろうか。

このsingle-store policyはWarren Buffettの注意深いcapital allocation能力によってもたらされたものである。彼は合計売上高を増やすのではなく利益率を増やすことを傘下企業に強く求めるそうだ。もし店舗数の増大がコストの増大か顧客の低価格志向によるマージン低下につながるようであれば、Warrenは傘下CEOたちにむしろビジネスの拡大を避けさせるのである。

NFMでは比較的安いNebraska州での流通コストや人件費を武器に低コスト優位性を維持している。販売価格も安いがコストがそれよりさらに安く高い利益率が維持される。他者がこれを真似ようとしても同レベルの低コストが実現できないので、高価格販売して顧客からそっぽを向かれるか無理して値下げして破綻するかのいずれかになる(日本の量販店は後者の道に向かっている印象がある)。Bobは”We are conservative.”と率直に語っていた。政治の世界でのconservativeは色々議論があるが、このビジネスに関するconservativeは著者には心地よく聞こえた。低コストを武器にするのはAmazonのe-Commerce部門も同様だろう。自称高付加価値ビジネスは競合が参入するとあっさりと値下げの妥協を強いられるが、流通網の強さによる低コスト優位性は競合が真似できないのである。Amazonの場合は直近の利益率を犠牲にして世界中で低コスト状態を実現するべく拡大を続けているが、NFMは高利益率を維持する代わりにNebraskaから外に出ないのである。そして全米中から消費者をOmahaに連れてくる

Growthとかbig businessといった言葉に踊らされている人にはNFMのpolicyは奇妙に映るかもしれない。しかし資本の効率性を最大化する観点からはこのアプローチが正しいのであり、しかもこのやり方だと雇用を最大限守ることができる。どういうことだろうか。

Buffettは複数のビジネス領域に極めて通じた投資家である。彼は同じ1ドルを追加投資するならどこに投じたら良いのかが的確にわかる。NFMやBorsheimsの店舗をどこかの州にもう一つ作るのと、それとも傘下の保険会社の拡大に当てるのと、リターンがどちらが大きいのか判断できるのである。彼はdiminishing returnによって利益率がさちってしまったビジネス領域にお金を放り込む愚を犯さない。そしてNFMは店舗を増やさずとも、Omahaにとどまっている限り儲けた利益を翌年の運営のために再投資して、高い利益率を保ったまま安定的に売上も拡大することができる

テストステロンに心を支配された愚かな経営者は店舗を増やせばビジネスが短期間で飛躍的に増大して利益もうなぎ登りかもしれないと楽観サイドだけを考え、短期間で急激な拡大を狙うが失敗して多額の負債を背負う。従業員も急拡大して大量に雇ったと思ったら急に大量に解雇する(人の人生をなんだと思っているのだ)。NFMのやり方だと、circle of competenceを守ることで持続的雇用を提供できる。もちろん絶対的な雇用人数が大きく増えるわけではないが、やっと仕事が見つかったと思って働き始めたら急に解雇されて今までの時間はなんだったのだと、せっかく働きに来てくれる従業員を途方にくれさせるような事態を賢明にも避けているわけだ。実際、Berkshireではlay-offをしないことを大事にしているそうだ。昔のDempsterの件ではBuffettは誤りを犯したと考えているらしい。

そしてこのアプローチは投資としても非常に成功する。高い利益率を維持して再投資を続けることで、長い目で見ると複利によって資本が膨れ上がっていくのである。ある時+50%で増えたと思ったら翌年から+3%しか増えなくなってしまったなどというビジネスよりも、毎年+15%がコンスタントに続き際限なく増えていくようなビジネスの方が望ましい。グロース株などと呼ばれている銘柄の一部は前者のような一発あたり市場しか取れなかったりするし、一発狙いの短期思考の人は、利益の再投資によって膨れ上がる複利を過少評価する傾向がある。アインシュタインも人間が複利の効果に気づかないことについて言及しているようだ。ぜひ後者のビジネスを探してみて欲しい。

Integrityとデータ解析

実はバリュー投資家のコミュニティでは最近、quality of investmentsが成功の鍵だと言う意見が強くなっている。財務書評から読める定量的ファンダメンタルズも大事だが(これが分かるだけでロクでもない会社をお金を放り込む愚は避けることができる)、それ以上にCEOや会社の人格・価値観こそがリターンを決めるのだという見方だ。

L.J. Rittenhouseはcandorをshareholder letterやannual reportsのテキストから分析する方法を見出してきた。良いニュースだけでなく悪いニュースも率直に伝える正直さ・自分の誤り認める態度があるとか、株主への手紙で英作文に時間をかけて丁寧に最適な単語を選ぶような経営者のいる会社は成功確率が高いのである。経済と倫理との関係を大切にしている人にとっては朗報ではないか。この世界は技術者の人にとっても面白いかもしれない。彼女らのアプローチを参考に、自然言語処理を用いて株式のリターンを予測しても良いわけだ。著者も以下の書にサインをもらった。

Investing Between the Lines: How to Make Smarter Decisions By Decoding CEO Communications

Quality of investmentsの世界には心理学者も研究フィールドを広げている。昨年のVICにはFred Kielが以下の書の紹介も含めて来ていた。Rittenhouseに興味を持たれた方はFred Kielも合わせて追いかけると良いことがあるかもしれない。

Return on Character: The Real Reason Leaders and Their Companies Win

広告

合理化途中の過渡状態と不合理を受け入れた定常状態

母校の集中講義で機械学習とゲーム理論の数理的類似性に関して話してきた。大学からの依頼で行ったものであるが、その要請はかつての自分と同様に社会人博士課程に通う学生への助言である。在学中の研究とその後の展開や、研究成果をどう実ビジネスや仕事に生かしていくかを体験談として話して欲しいというものだった。博士取得後に深めた知見の方が在学中の成果よりも大きいと著者は考えているので、学生時代の話は触り程度にして、その後の研究トピックの広がり方・掘り下げ方について、転職後に加わった視点も交えて紹介した。以下はその説明資料である。OpenOffice.org ImpressとLaTeX beamerが混在しているのは全てをbeamerで準備する時間がなかったことによる、デザイン上の妥協である。

提供した視点の中で、その拡張に将来性があると2016年時点で著者が考えているのは以下に列挙した両者の対応である。特に、機械学習側の関数近似テクニックや緻密な確率的モデリングを行動ゲーム理論に持ち込むことで、人間同士が相互作用する社会環境 (人間系) における意思決定を、もっと数値的根拠が確かな状況で行えるものと期待している。

  • 正則化のない最尤推定はナッシュ均衡の計算に類似しており、
  • 事前分布を用いるベイズ推定やJames-Steinの縮小推定は限定合理性を扱う行動ゲーム理論における、Quantal Response Equilibrium (QRE)の計算に似ている
  • 明示的な正則化項を追加する代わりに最尤推定の最適化ステップを途中で中断するアプローチであるearly stoppingはCognitive Hierarchy Theoryと似ており、これも行動ゲーム理論で使われるテクニックである

Google DeepMindはAlphaGoでDeep Reinforcement Learning (深層強化学習)を用いたが、Deep Belief Learning (深層信念学習)という社会科学技術がイノベーションを起こす、というのが著者の大胆な予想である。しかしこれは当たるも八卦当たらぬも八卦の話なので、もう少しsolidな上記メッセージに戻ると、用いた資料で最も重要な一枚は次のスライドだろう。

ml-vs-gt

 

与えられた特定のゲームにおける実現シナリオの候補として、ナッシュ均衡はその定義は厳密ではあるが、実社会でのゲームにおいて実際に発生するシナリオからはしばしば乖離した予測を示す。最尤推定が学習データという狭いデータセットに対しては最大の予測能力を示しても、テストデータを持ってくるとそうはならない点と似てるとは感じないだろうか。

一方、ベイズ推定は事前分布という固定点を導入し、そちらにshrink(縮小)させることで、学習データに対する説明能力を少し妥協する。しかしこの小さな妥協はテストデータに対する予測能力を大きく向上させる。QREも同様で、他のプレイヤーの合理性に確信が持てない状況で、不確実性を撹乱項として明示的に確率モデル化することで、より実社会の集団的意思決定結果に近い予測結果を返してくれる。ベイズ推定もQREも、データやゲームに依存しない固有の確率モデルを入れることで汎化能力を上げる、という思想が共通している。

加えて、実用上は、固定点への縮小戦略ないしアルゴリズムは厳密なベイズ推定解でなくても良い。要は、事前分布の中心に相当する固定点があって、そこに少し近づける方法論であれば何でもよく、その一つがDeep Learningでよく使われるEarly Stoppingである。Early Stoppingは、複雑なゲームの均衡を数値的に計算する場合に使われる Belief Learning (信念学習) を途中で打ち止めにする方法と類似しており、Cognitive Hierarchy Theoryはこの打ち止め自体を確率モデル化したものである。

機械学習研究者コミュニティの中には、統計学だけでなく認知科学の研究も行っており、行動経済学的な現象の発生メカニズムを数理モデル化している人たちがいる。著者もその端くれであると自負している。昨年、著名な国際会議のNeural Information Processing Systems (NIPS)に出席した際には、パネルディスカッションにおいてBayesian Nonparametricsの大家の教授が同様の見方を他の認知科学研究者から聞いたと言っていた。この教授が誰であるか業界人にはバレバレであるが、著者の記憶が間違っている可能性もある。後で「私はそんなことは言ってない」というクレームが発生しても責任は持てないので名前は伏せることにしておく。

講義は機械学習と行動ゲーム理論の接続に限らず、与太話も含めていろいろ話してみた。科学的根拠の薄い仮説であることを断った上で、スライドの最後のセクションには私見をいろいろ載せている。一方で全ての意見が無根拠というわけでもない。例えば、リスクは避けろ、不確実性はテイクしろというメッセージは i) 偉大なバリュー投資家たちのコアとなる考え方で、ii) 多腕バンディット問題におけるexplorationのgainがどういうときに最大になるか考えた上で 持っている意見である。すぐれた起業家や研究者がリスクテイカーだというのはおそらく嘘だ。彼らは不確実性をテイクしているのであって、避けられるリスクは極力全て避けている。製鉄ビジネスを始めるときにいきなり自力で始めるのではなく破綻した製鉄所を安く買い取って始める、とかね。

これから博士課程に通おうと思っている人や、社会人博士における研究テーマの選定で迷いがある人は参考にしていただければ幸いであるし、個人的な質問があれば twitter account @rikija に連絡くだされば話せる範囲でお答えします。

集合知の質: 1ドル1票か1人1票かあるいは? (2)

衆愚制や民主主義の危機が叫ばれる中で、単純な均等投票以外の集合知が民主主義陣営の強力なサポーターになってくれるかもしれない。集合知の質: 1ドル1票か1人1票かあるいは? (1) で、集合的意思決定手法の一つである予測市場について紹介し、その光と闇について論じた。予測市場の株価は予測対象に対する知見が高い人の予測に高いウェイトを振った加重平均値であり、これを予測値とした意思決定は低いバイアスを享受できる。実際にお金をかけさせることで真剣な予測値を作り出すことができる点、加えて人工知能・統計学アプローチと違って既存のビッグデータがなくても意思決定できる点は、プラットフォームとしてのアドバンテージとなる。しかし最近はUKのEU離脱をバイナリー値としては予測し損ねたという失敗例もある。最終株価が単純なアンケート or 選挙に比べて未来を正確に予想しているかどうかには、依然として議論があるだろう点を前回議論した。


普通の人たちを予言者に変える 「予測市場」という新戦略

今日は予測市場の最終株価以外の産物を役に立てられないか考えてみる。最終株価よりもすぐれた予測値を、統計学もしくは金融工学を駆使することで得られないだろうか。具体的には、予測市場が産み出した株価の時系列データと出来高等の個々の取引記録を利用することを想定する。議論のスコープからは今回は外すけども、予測市場株価を原資産に見立てたデリバティブ: 先物, オプションを作ったら更に予測精度が上がるかもしれない。

予測市場及びその派生市場で得られた多くの証券データは、それらを統計的アルゴリズムに入力することで最終株価よりも優れた予測値を生み出す可能性がある。また予測精度自体は同じであったとしても、過渡的なデータが予測対象に関するインサイトを提供する場合があり、その情報自体が市場参加者、つまり一般市民の政治的意思決定能力を向上する可能性もあるのだ。

過渡的な情報に価値があるという見解は、著者が効率市場仮説 (Efficient Market Hypothesis; EMH)を支持していないことに由来する。EMHが完全に成り立つなら最終株価以外の指標は役に立たない。EMHは市場が常に定常状態(=均衡)にいる、もしくは一瞬で定常状態に遷移すると仮定することでほとんどのトレーダーがリターンを取れない、と主張する。EMHの反証は統計的裁定機会の存在を示すことによって行われることが多いが、少なくとも短期トレードではこの裁定機会を見つける困難さゆえにEMHが想像以上に妥当に思えてしまうトレーダーも多い。ファンダメンタルズに基づいた中長期投資ではそれほど反証は難しくないのだが。

短期トレードが難しいとしてもEMHが完全には成り立っていないと言える根拠は、そのおかしな仮定にある。過渡状態と定常状態(=均衡)は明確に区別して議論しなければいけない。またこれらを明示的に区別することで、EMHが成り立たないなら株価はどうやって動くのかある程度モデルを立てることができる。モデルの設計と検証を立てるのはアカデミックな成果を争う研究領域となるのでブログでは避けることとしつつ、今回は過渡状態の方が定常状態よりも重要であるケースの一つを紹介したい。この背景を経て、予測市場の時系列データを残していくことが民主主義社会における大きな遺産になり得る可能性に気づいてもらえれば幸いである。

今回、過渡状態と定常状態の違いについて導入した上で、次回はどのような予測市場の過渡状態を残したいか、著者なりの政治的見解を書いてみようかと思う。今の所の素案にあるのは、「ある政治家が政策Xを実現するか否か」に賭ける予測市場であるが、もっと良いアイデアがあるだろうと思う。

定常状態(=均衡)はしばしば非現実的に見える

突然ではあるが p-美人投票 (p-beauty contest) というゲームを紹介したい。ここではp=2/3のケースを取り上げる。以下のルールのゲームで、各プレイヤーはどのような選択をするだろうか?

  • n (\geq 3)人いるプレイヤーが0以上100以上の整数を一つ、同時に選択する
  • 全プレイヤーの数値の平均値の2/3倍に最も近かったプレイヤーが優勝する

特に難しい点のない単純なルールであるが、図で例時すると図1のとおりである。この例では#1, #2, #3の3人のプレイヤーがそれぞれ35, 15, 22 と宣言し、平均の2/3倍である16に最も近かった#2が優勝した。あなたがプレイヤーの一人だとして、どの数字を選ぶか想像してほしい。平均値は他のプレイヤーの数字によって変わるわけだから、あなたはライバルを出し抜かなければいけない。

pBeautyContest

図1. (2/3)-beauty contestにおける意思決定と結果例

十分に頭の中で想像してもらえただろうか。そうであれば次に進もう。このゲームにはナッシュ均衡が一つだけある。それは全員が0を選択するというものである。そのロジックは次の通りである。

  • ゲームのルールを全くわかっていないナイーブなプレイヤー (これを0-step playerと呼ぼう)を想定すると彼らは0から100をランダムに選ぶのでその期待値は50である
  • 0-step playerを倒すことを想定している1-step playerは50 \times 2/3 = 33.33\ldots のため 33を選ぶだろう。1-step playerは0-step playerよりちょっとだけ先読みしている
  • 1-step playerを更に倒すことを想定している2-step playerは33 \times 2/3 = 22より22を選ぶだろう

こうしてk-step playerを倒す (k+1)-step playerのことを考えていき、全てのプレイヤーがお互いが完全合理的であると予想して無限遠まで読み切ると全員が0を選択することになる。簡単のためにk-step目までの期待値による説明を書いたが、期待値でなく他の代表値を使ったり、0-step, 1-step, …, k-step playersがそれぞれいる状況で(k+1)-step playerの振る舞いを考えても結論は同じである。2/3をどんどんかけていく等比級数の極限である0が均衡となる。先読みばかりしているエリートの選択というのはお互いに似てくるわけだ。またそのような共通の思考回路を暗黙に持つことで無難な幕引きを図るのがエリートの特徴とも言えるし、それこそが彼らがつまらない人物に見える主因かもしれない。

「今」は定常状態 or 過渡状態?

さて、ナッシュ均衡が0だということはわかった。しかしながら、あなたは本当に全員が0を選択すると思うだろうか? あなた個人が0を選択する可能性は十分著者も予見しているが、あなた以外の全員が0を選ぶとあなたが考えているとは、著者は思わない。実際のところ、この「全員が0」という均衡からは、ちょっとした撹乱によって容易に乖離しうる。例えば、

  1. もし他のプレイヤーがゲームの本質に気付いておらず、0よりずっと大きい数字を選択したら?
  2. もしプレイヤーの一人が、自分が負けてもいいのでエリート連中にダメージを与えてやろうと考えたら?

1.はプレーヤーの知性に限界を設けたケースで、2.はプレーヤーは賢いがわざと愚かに振る舞うケースである。理知的な大国間の交渉に比べて、テロリストやヒステリックな人物との交渉はより難しい。現実世界でのそのような読みの難しさをp-beauty contestは簡潔に表現している。

ナッシュ均衡の非現実性は、i) すべての人が一様に無限遠を見通している非現実的仮定や、ii) 確率的な撹乱を無視した決定論的思考 に由来する。実際のところ、[1][2]に掲載された実際の選択は表1の通りである。ゲーム理論家であっても彼らはこのような撹乱を想定しているのであって、0は選択していない。

  • ここでは[2]に掲載された簡略化された表を抜粋している。より広範な調査は[1]に掲載されている。

表1. (2/3)-beauty contestで実際の人間が選んだ平均値

グループ名 n: プレーヤー数
(グループから抽出)
グループの合計人数 選択された平均値
Caltech Board 73 73 49.4
80 year olds 33 33 37.0
High School Students 20-32 52 32.5
Economics PhDs 16 16 27.4
Portfolio Managers 26 26 24.3
Caltech Students 3 24 21.5
Game Theorists 27-54 136 19.1

表1で各グループの性質と選択結果を眺めてみるのはなかなか面白い。カリフォルニア工科大学のボードのお偉いさんたちはほとんどナイーブなプレーヤーのように振舞っていて、学生さんよりもずいぶん値が高い。お年を召されて真面目に考えなくなってしまったのだろうか? などと不謹慎な想像だって出来る – 実際のところ80歳の人たちの平均値も結構高い。さらに学びたい方のために補足: p-beauty contestはリチャード・セイラーの最新刊でも紹介されている。セイラー教授のキャリアの築き方も含めて (学生からの人気を維持するために137点満点のテストを作った話とか) 面白い一冊なので興味のある方はどうぞ。


行動経済学の逆襲 (早川書房)

表1で示されたように、ゲームの中に完全合理的でないプレイヤーが混じっている場合、たとえあなたがとても合理的であったとしても考え直す必要がある。そのような状況における予測値を定量的に与えてくれる方法論は認知階層理論 (Cognitive Hierarchy Theory; CHT) [1] と呼ばれている。各プレイヤーは自分は (k+1)-stepまで読めるが他人は最大でもk-stepまでしか読めないと考えている自信過剰家であり、0-step, 1-step, …, k-step playerの人口比を予想して選択を行っているというモデルを導入するのである。そして kの値と人口比分布を実データから推定することで高い予測値を得ようとするところが、完全合理性一本やりのナッシュ均衡と違っているわけだ。

参考: 機械学習アルゴリズムと行動ゲーム理論との関係

(この項目は参考文献を探している研究者向けである)

さらに撹乱を加えてより予測を精確にする場合、ナッシュ均衡を確率モデル的に一般化した質的応答均衡 (Quantal Response Equilibrium; QRE)を数値計算することになる。CHTが過渡状態で計算を止めるearly stoppingを行うのに対して、QREは確率を入れた上で無限遠まで計算する。しかしどちらもナッシュ均衡よりも初期状態 or 一様分布のような固定点に近づける 正則化として働く点は共通している。その具体論に立ち入るのは予測市場について議論する本題から外れるので割愛する。

参考書としては以下が優れているほか、そのうち機械学習との接点について別エントリーで紹介しようと思うので興味ある人は楽しみにしててほしい。ナッシュ均衡の計算は最尤推定と類似しており、QREの計算は明示的に事前分布を入れたMAP推定に近い。CHTはearly stoppingすることによって結果的に初期状態に近い予測値を出すため、近年のdeep learningで使われているearly stopping によるregularization (初期値に近づける)と類似している。


行動ゲーム理論入門

過渡株価を見ながら定常株価を予測する

p-beauty contestの(狭い)理論と現実との関係から一般化したいstatementは単純である。無限遠まで計算した定常状態よりも、過渡状態の方が現実に近い場合が存在する。あるいは撹乱を入れながら計算した「アニーリングされた定常状態」を計算するべきなのである。そのようなインプリケーションを予測市場に対して適用した場合、我々のやるべきことは明確だ。過渡状態とは個々の意思決定者が残した途中の記録であるから、注文情報や株価時系列データにその情報が含まれており、それを積極的に利用するということである。

p-beauty contestにおいてはk-step playerに(k+1)-step playerが勝とうとするプロセスは心の中で走る時間経過であった。一方、予測市場では 時刻 tまでの株価を見て 時刻(t+1)における投資家の振る舞いが決まってくる。この時刻は物理世界における実時間である。しかし各時刻 t のそれぞれにおいては、各投資家は他の投資家を出し抜こうとする心的プロセスを走らせる。つまるところ心的時間と物理的時間の両方における動力学が働くことになる。他の投資家が完全に合理的で彼らより高いリターンがあげられないのなら、どうして市場に参入するだろうか? 市場に参加するものはすべからく何処かで自信過剰なのであり、その自信過剰性と市場の相互作用が結果的に高精度な政治的意思決定を可能にするのである。

投資家の間の激しい競争を踏まえると、基本的には過去の株価の方が現在株価より正しいというケースは少ないであろう。しかしp-beauty contestの実データに見られる限定合理性からは、過去の株価から背後のマスター方程式を推定して現在株価よりも妥当な推定値を予測するというアプローチが不可能でないことも示唆される。より優れた計量アプローチでは、現在の株価 (price)をvalueの最良推定値とは考えないファンダメンタル投資家に発想が近くなるだろう。長期のファンダメンタル投資家は、定常状態から離れたおかしな過渡状態にいると判断した株式を購入する。そしてその過渡状態から数年のうちに定常状態に収束すると考える。定常状態を理解した上で過渡状態をモニターすることが大事だと見なしているわけだ。

民主主義の強化という我々の目的の場合、一つの政治的意思決定のために数年も待つことはできない。定常状態に収束するまで待っていられないケースが度々ある。UKのEU離脱予測失敗のケースでは、予測市場が本来持っている「賢い投資家に力を与え愚かな投資家を退場させる」時間が投票前に確保できなかった。ならば、過渡状態から計算機上でマルコフ連鎖を回して定常状態を先読みするとか、一部の投資家の認知バイアスをアラートで察知して異常値を排除する、といったデータ加工をしても良いはずだ。そのようにして修正された予測市場株価時系列の方が市場そのままの値よりも本質を突いているかもしれない。加えて、そのようなデータ加工プロセスをも公開することで、市民の意思決定能力が高まる可能性もある。

最後に一つだけ実例を紹介させていただきたい。2013年のACM SIGKDD (データマイニング領域におけるトップ国際会議) で発表された [3] では、フォード社が意思決定インフラとして予測市場を導入したことで得られたメリットについて言及している。この場合、例えば青い車を増やすべきか赤い車を増やすべきかという意思決定において、世界中の社員のボトムアップな知恵を集約するためのインフラとして、投資家である社員が賭ける予測市場が導入された。賭けに勝とうと思うと、各社員が一丸となって今の消費者の好みを調査したりお得意さんにヒアリングしたりする。

株価自体もそれなりに役立ったようであるが印象的な言及として、ニュースイベントと株価時系列との対応関係を取ることで、どういうニュースに社員が過剰反応したりするのか、どこで市場の変化があったのかがモニタリングできるようになった点があった。株価時系列一つ残すメリットは、その株価自身だけではない。他のデータと組み合わせて回帰分析を行うなど、もっと高度な知見収集インフラとして役立つわけである。ビジネスで勝利すべく血眼になって予想を行う投資家の知恵を公的・政治的領域にも役立てられるようになったら我々は民主主義国に暮らしていたことを今よりもずっと感謝するようになるだろう。

References

[1] C. F. Camerer, T.-H. Ho and J.-K. Chong, “A Cognitive Hierarchy Model of Games,” The Quarterly Journal of Economics, 119(3):861-898,  2004.

[2] T. H. Ho, N. Lim, and C. F. Camerer, “Modeling the psychology of consumer and firm behavior with behavioral economics,” Journal of Marketing Research, 43(3):307–331, 2006.

[3] T. A. Montgomery, P. M. Stieg, M. J. Cavaretta, and P. E. Moraal,
“Experience from Hosting a Corporate Prediction Market: Benefits Beyond the Forecasts,” Proceedings of the 19th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD 13), 1384-1392, 2013.

パワードスーツを着た消費者と対話する

あなたが財やサービスを売りたいお客さんはどのような情報源を信頼して購買判断しているだろうか? あなたがたマーケターのメッセージと、Yelpやbooking.comに寄せられるレビューとどちらを信頼しているだろうか。もし、あなたが今までブランド広告で成功してきた人で、商品の本質の代わりに無関係なステータス・イメージの刷り込みに注力してきたなら、これからはその成功体験に殺されないよう警戒しよう。お客さん達の習慣が昔と同じままかどうか、良く考える必要がある。そして今のお客さんが後者のタイプであることに気づいたら、自分のできることは昔よりもずっと少なくなったことを認めたほうがいい。今の消費者は手強い軍人ではない。しかし最強のパワードスーツを着た小学生であってあなたを狙い撃ちにしている。マーケターのやれることはまだいくらかあるが、これからはB2Cのマーケティングは花形の職業ではなくなっていくかもしれない。

統計バカごときが俺たちセンス抜群のマーケターに物申すなって? オーケー。そもそもこんな態度をとるマーケターは仕事上見たことないけども(笑)、そういう人が現れたとしても著者は伝えるべきメッセージがある。このブログの著者が信用できなくても、スタンフォード大学教授で消費者心理を利用したマーケティング理論の第一人者の話は聞いてみる気にならないだろうか? 彼はノーベル経済学賞を受賞したDaniel KahnemanやAmos Tverskyの重要な共同研究者でもある。そしてその彼が、自分の成功をもたらした心理学上の発見を自己否定するかのごとく、新しい時代のマーケティング・コミュニケーションについて論じているのが本書である。真の賢者は自己破壊的な衝動を持つことでイノベーションのジレンマから逃れるものだが、彼の衝動に我々も習うべきではないだろうか。

ウソはバレる―――「定説」が通用しない時代の新しいマーケティング

彼の名はItamar Simonson。マーケティング、特に機械学習モデルと心理学モデルの境界領域をターゲット研究分野に定めた著者にとっては、キャリア上絶大な影響を受けた恩師にも当たるだろう。彼は消費者が商品を選択する際に発生するcompromise effect (1989)と呼ばれる心理学的効果を発見した。それにより、新古典派の経済学者が仮定するような一貫した効用関数を一般消費者が持たない、という事実を劇的な形で示した。Compromise effectや、あるいは別の認知バイアスであるattraction effectと呼ばれる心理現象では、消費者はどのような選択肢が提示されたかによって商品の選好順序を変えてしまう。そこでマーケターたるあなたは、店頭で提示する商品の組み合わせを意地悪く操作することで、割高な商品をいとも簡単に売りつけることができる。この心理学的テクニックは実際に多くの店舗販売で利用されてきた。

  • 便乗宣伝で申し訳ないが、著者は、compromise effectを再現しデータを元に定量予測できる特殊な機械学習モデルを2015年に発表している。論文はこちら

Compromise effectとは、トレードオフの関係にある選択肢集合からは真ん中の妥協した選択肢が選ばれやすい、という現象のことである。例えば下図のように価格と品質とにトレードオフがある選択肢をランダムに分けた被験者に見せる。Windows OSのhome edition, professional edition, ultimate editionみたいなものを想像するのが簡単だろう。この時、存在するすべての選択肢を一度に見せないのが心理実験の肝で、グループ1には選択肢集合{A,B,C}を、グループ2には{B,C,D}を、グループ3には{C,D,E}を見せる。結果はグループ1ではB、グループ2ではC、グループ3ではDが最も人気を得る。見せ方によってB>CなのかC>Bなのかが逆転してしまうわけだ。

NIPS2014

実商品の例が見たい人は下記スライドのpage 5に示した、パソコンを選ぶ例を参照してほしい。

さて、なぜこの現象がマーケティング上そんなに重要なのだろうか? それは絶対効用に基づく競争から逃れるヒントになっているからである。資本主義社会で生きる我々は常に、競合他社との競争にさらされている。たとえ良い製品を作ったとしても、似たスペックの製品を他社が出してきたら? 顧客を他社に取られないためには、同じ値段でさらに良い製品に変えるか、または値下げをして利益を諦めなければならない。ところがcompromise effectに頼ると、たとえ今の製品を改善 or 値下げしなくても、二つの追加の囮の商品: 品質が良いが値段も高い商品と値段が安いが品質も悪い商品を棚に並べておけば、あなたの商品を消費者がさも納得して買って行ってくれるのだ。これは消費者が世の中にあるすべての商品を比較して絶対効用が最大のものを探すことをせず、目の前にある3つの選択肢から相対比較だけを元に選ぶことを強要されていると発生しやすい。

ところがSimonsonは、compromise effectのような心理学効果は今日の実際の購買シチュエーションでは消えてしまうことを確認した。つまりAmazon.comやkakaku.comで類似商品を検索し、種々の商品のレビューを読んで比較して納得した一品を最後にカートに入れるという一連の行動を伴う状況では、目の前の選択肢に集中させて騙す方法が通用しないのである。

彼ら心理学者のグループは、compromise effectを含む認知バイアスが人間から消えたわけではないことも確認している。たとえオンライン・ショッピングであっても、検索行動をさせなかった場合にはcompromise effectが再現する。人間自体が賢くなったわけではないのだ。人間は依然として、有限の記憶しか持たず余計な思考を省こうとする堕落した存在であり続けている。しかし環境は大きく変わった。kakaku.comで同一製品の最安店舗を検索したり、skyscanner.comで所定のルートを飛ぶ最も有利な航空券を店舗横断で探してしまう。製品それ自体の質が不確かな場合でもレビューサイトのおかげでどの競合製品なら欲しいものを代替できるか今日では分かってしまうし、そしてその検索を更に直感的にするiPhone / Androidアプリなどが登場してきた。その結果、怠惰で間抜けな人々であっても新古典派経済学が仮定する合理的なeconomic man (経済人)と似た振る舞いを示すようになってきた。つまるところ、ヘンリー・キッシンジャー博士も真っ青の賢い軍師ではなく、インターネットという最強のパワードスーツを着た本来は非力な村人が今日の消費者であって、その村人がマーケターの仕事を奪おうとしているわけだ。

この大きな変化は、単価が高くて質の評価が容易な商品、例えばパソコンや自動車で顕著になってきている。FMCG (Fast Moving Consumer Goods)のように単価が低くていちいち真面目に検索しない商品や、芸術性を価格に転嫁している商品ではまだブランドの力が残っているだろう。しかしどのような新しいwebサービスがこれら残り少ないブランドの力を奪ってしまうかはわからない。

Simonsonたちは新しい時代の良い点も積極的に説明している。マーケターが刷り込もうとするブランドイメージがなくても、他の消費者のレビューが良ければ製品が売れるケースが出てきた。純粋に良い製品を作った人・純粋に良いサービスを提供するホテルやレストランが評価されやすい時代に変わってきたのだ。また、イメージを刷り込む代わりに、レビューコミュニティに商品の実際の利点を評価してもらうことでも売り上げを増やせる可能性がある。誤った刷り込みのおかげで高い利益率を享受してきた悪党には厳しい時代になったが、本質的な価値を実際に創造する人々には恩恵がもたらされつつあるわけだ。

本書はマーケティングだけでなくバリュー投資にとってもインプリケーションがある。オールドエコノミーに属するバリュー株銘柄の幾つかは、消費者自身の過去の経験への執着を担保としたブランド力によって価値を維持している。FMCGかつ味への執着という恩恵を受けているコカ・コーラのブランドはそう簡単に毀損しないだろう。しかし時計ブランドのバリュー株は再考が必要そうだ。他にも、B2C事業ではブランドが毀損しやすくなってもB2Bのサービスの幾つかは事前に評価することが困難なものもある。クラウド・コンピューティングのサーバーならコストパフォーマンスが客観的で他ユーザーのレビューも参考にできるだろう。一方でクライアント企業の本業ビジネスを変革するコンサルティングは、クライアントにとっての事前評価が難しくブランドの毀損は比較的ゆっくり進むだろう。未来志向のマーケター・投資家の双方にとってmust readな一冊である。

References

I. Simonson. Choice based on reasons: The case of attraction and compromise effects. Journal of Consumer Research, 16:158–174, 1989.