あなたの中にあるコールオプションを見つけて欲しい

前回の投稿 – 大切なことは(実は)ギャンブルが教えてくれる: 集中と分散の両取りと「良い宗教」による演繹はそれ以前の筆者のブログ記事とは桁違いの反響があった。記事に対する意見・質問などはtwitterなどで直接コメント頂いた方を除いて把握していないが、いわゆるpageviewは日頃の記事よりも非常に大きかった。Positive skewnessがもたらす良い方のoutlierの果実をどう取り入れていくのかがメインテーマだったが、wordpress.comに付属しているアクセス解析を見る限りは、この記事自体がoutlierだったようである。

今回はその鏡像である悪い方のoutlier, negative skewnessとどう付き合っていくべきか、少し暗い(?)話をしてみようと思う。その上で、一見negative skewedな報酬しかないように見える環境にも、実はpositive skewedなものが隠れていることがある、アップサイドがないなどと諦めず、読者個人の自分なりの分析をもとにpositive skewnessを見つけ出して欲しいというのが今回のメインメッセージである。

いつものスタイルであるが、メインメッセージ以外にも事例をかなり入れて分量を多くしてある。無理に一度に読まず回数を分けて理解してもらえれば幸いである – そもそも次回の投稿は当分先であるだろうから。社会に広く散見される問題が、skewnessを軸に共通化して議論できて一連のトピックがつながることを体感して頂きたいと思っている。

金融市場においては、多くのリスクプレミアムにはnegative skewness が付きまとっている [1]。投資戦略に関するファイナンス論文をいくつか読むと、小さな利益を積み重ねるが時々大きな損失を被る、ただしそれまで積み重ねた利益を全て吹き飛ばすほどではなく期待値はプラスである性質をもった投資戦略が多いことに気づくだろう。保険販売ビジネスと類似した収益構造である。実は、特に複利で利益を増やす場合において、negative skewnessは多くの問題をもたらすことを最初に数値例で紹介する。たとえば(方向中立な)トレンドフォロー戦略のようにpositive skewedかつ期待値がプラスになるようなリスクプレミアム [2] が手に入れば無理してnegative skewedな資産と付き合わなくても良いのだが、positive skewedなプレミアムを見つけることは想像以上に難しい。一方negative skewedなものは比較的簡単に見つかる。

  • 筆者が機械学習を使って戦略を組む際に、人から要求されずとも強く意識していることの一つに、目的関数や特徴エンジニアリングをいじることでskewnessをゼロか正の値に持っていけないか絶えず探求する、というものがある
  • たとえ同じデータセットを扱っていても、モデルのフォーカスを変えることで違ったタイプの戦略が見つけられることがあり、この仕事の楽しさの一つでもある

この一年半の金融業界での労働経験 (職場にはいわゆる投資銀行から移ってきた人が多く在籍しており、投資銀行出身者の多くは金融業界でのみ働いてきた) も踏まえて、ここで筆者が思い出すのは、現職への転職を決断する際に助言をくれた起業家友人のコメントだ。 「金融業界人はメンタリティが似過ぎていて問題だ」と。この「似過ぎたメンタリティ」はnegative skewedな戦略を選択せざるを得ない市場の厳しさに起因しているのではないかというのが筆者の仮説である。そして、このnegative skewedなプレミアムを稼ぐしかない環境は実は金融業界に限らず広く世界に蔓延していて、日本の職場のモラルの低さもこれと関係しているのではないかという仮説を後半では議論していく。

  • この起業家友人は、自身の広範なビジネス人脈から金融業界の問題を知っている。非金融出身者であるお前の強みを生かすべきだという激励も含めてこうコメントしたのだろう
  • 日本の労働者のモラルについては、実際に日本で働いている読者諸賢は自分にはガッツがあると反論するだろうし、本ブログのような奇妙なコンテンツを読んでくださる方の多くは実際そうだと思う
  • しかし最初の職場でB2Bのビジネスに関わった筆者の目には、多くの日本企業従業員の士気の低さは顕著に映った。これは労働者個人のインセンティブと関係があり後述する

Positive skewedな戦略を見つける実務的困難さと、金融業界の人間が良い意味だけでなく時々は悪い意味でも保守的なこととの間には、双方向にいくらかの因果関係があるのではないかと感じている。野心的で、確率は低いが成功時にはとてつもない報酬がある目標を目指すのではなく、成功確率は高くとも報酬はほどほどのことに集中して挑戦を諦める人、成功者は運が良かっただけと切り捨てる皮肉屋に転落してしまう人は、過去の自分の失敗を思い出すのが辛いのかもしれない。「自分も若かったときは夢を持ってpositive skewed戦略を探したが不可能だった。ベンチャー起業、一攫千金な話は確かに夢があるが、その実態は政府発行宝くじを買うのと同じで期待値がマイナスなのだ」と。Skewnessの正負と期待値の正負は別個の概念であるが、金融市場での取引の多くはnegative skewedでプラス期待値か、positive skewedでマイナス期待値のポジションが多いため、この見かけの相関からpositive skewedだと「常に」期待値がマイナスだと過剰一般化してしまったのかもしれない。Positive skewedだと「多くの場合は」期待値がマイナスであるものの常にそうとは限らない。しかし日頃の労働で認知資源を使い切ってしまった彼らには、「常に」と「多くの場合」の違い、数少ない例外について塾考する余裕がないのかもしれない。

今日のSummary

  • 複利でのものごとを考えない一部の学者・銀行家が本来は合理的な選択を非合理であると言っていることがある。Skewnessの役割を理解することが鍵であり、期待値がたとえプラスでもnegative skewedな投資はpositive skewedなものより小さく賭ける必要がある
  • Positive skewedな起業家とnegatie skewedなサラリーマンの違いはペイオフの構造がコール買いかプット売りかの違いであり、どちらが無条件で優れているということはない
  • 日本のサラリーマンの無気力の根源はペイオフが極端にプット売りに偏っていることにある。従業員個人は合理的に行動しているだけで彼らを非難するのは的外れである
  • プット売りをしている従業員個人には、テールリスクを抑えるDOTMプットを買う投資が過剰に魅力的に移ってしまい、日本社会全体では大きなコストを払う羽目に陥っている。経営者は労働者にコールオプションを売ってインセンティブ構造を変えなくてはいけない
  • 労働者個人も絶望せずに、自分の仕事の中に隠れたコールオプションを探してほしい
    • 金銭のアップサイドがある(=コール買いしている)経営者は実はスキルのダウンサイドを負っている(=プット売りしている)
    • 金銭をプット売りしているサラリーマンは実はスキルのコール買いをしている
  • ただし無節操なコール買いにも問題はある。「労働者のチャレンジ精神を奪う」と非難されることの多い福祉国家システムの実態は株式のロング + プット買いであるプロテクティブ・プット・ポジションであり、ダウンサイドが限定されることでむしろ国民を過剰にリスクテイクさせる傾向がある(=Kelly Criterionを超えて投資してしまう二流ギャンブラー)。福祉政策を推進したい左派政治家・経済学者は、国民のやる気の減退リスクという右派からの的外れの批判よりも過剰投資問題の方に真剣に回答すべきである
  • 負の側面が目立つプット売りも、それを行なっている人たちは社会的には大きな役割を担っている。Negative skewedな投資自体を否定するよりも、むしろnegativeなテールリスクを負う義務が生じた人たちへの社会的理解は大切である。Skewnessはcounterparty間で常に鏡像の関係にある
  • 高次モーメントが発散するような極端にテールリスクの大きい投資を、期待値がプラスであることだけを根拠に合理化し、テールリスクを避けている市政の人を「非科学的」と罵る人を見かけることがある。モーメントが発散する投資は期待値がプラスでも「長期的には我々はみな死んでいる」状況でruinを避けることができない。Kelly Criterionが示唆する許容可能投資水準を例えば参考にして、科学的だと思われている政策提言にも非科学性が隠されていることを認め、専門家は常に自らの判断を再考していく必要がある

行動経済学者が「非合理的」と言ったら疑おう

まず最初に紹介するのは、前回導入したKelly Criterionの、skewedな場合への拡張である。一般の連続値確率分布のケースを導入するのはしきい高く感じる読者もいるだろうから、離散化した単純例を導入しよう。ここでは次の二つのクジのどちらが魅力的か考えてもらいたい。現実世界とは違って確率分布が事前に完全にわかっているため、帰納につきまとう推定誤差のことは忘れて、今は演繹的思考に集中してもらえば幸いである。

  • くじA: 5%の確率で掛け金を全額失う。90%の確率で掛け金の10%を手に入れる (1.1倍になって戻ってくる)。残り5%の確率で掛け金の20%を手に入れる (1.2倍になる)
  • くじB: 5%の確率で掛け金の11.5%を失う (0.885倍になる)。90%の確率で掛け金の1.5%を失う (0.9985倍)。残り5%の確率で掛け金の108.5%を手に入れる (2.085倍)

くじAとくじBは一度選んだらもう片方は二度と選択できない、ただし選んだクジにいくら賭けるかは自分でコントロール出来て、選んだ方の賭けを何回でもやることができるとしたら、貴方にはどちらが魅力的だろうか? 筆者の回答を見る前に少し考えてみてほしい。


行動意思決定論―経済行動の心理学

くじAは大概の場合は少し儲かるが低い確率で大きな損失を被る。一方のくじBに賭け続けると長い間少しずつお金がなくなっていくが、たまに大きな利益を得る。

筆者にはくじBの方が魅力的である。直感の時点でそうであるし、数理的に分析してみても同じ結論だ。しかし学会等で業界が長い人と雑談してみると逆の観察が得られる。一部の経済学者 (このケースでは行動経済学者が該当する)や銀行家は、くじBをくじAよりも選好する筆者は非合理的であるとのたまうのである。これを最初に聞いたときには正直驚いた。本当にそう思っているのか? 筆者を騙してお金をむしり取るために、銀行家たる彼らはバカのフリをしているだけで、実は彼らもBを選ぼうとしているのではないか? 貴重なくじBへの投資機会 (良い投資機会というのはそんなに無数にあるものではなく、普通は誰がそのプレミアムを取るのかの競争になる) を筆者に渡さないために、Aが魅力的であるという屁理屈をでっち上げて騙そうとしてるのでは? それとも、仕事上パワハラか何かを受け続けてきて正気でないなどの理由で知性が働いていないのか?

  • 幼少期より中国の歴史に親しんできた筆者としては、敵を買いかぶり過ぎて小さく失敗するのは構わないが、敵を侮って致命的な損失を負うのは恐ろしい
  • よってこういう場合は常に、相手はバカではなくて単に筆者を騙そうとしているだけである、と考えることにしている。敵は常に最強の知性を持っていると仮定する方が安全である – それこそ経済学でスタンダードに使われるゲーム理論が想定すること(=∞-stepの予測ができるエージェントで満たされた世界を仮定する)だ

彼らのロジックはこんな感じである。基礎の確率論 or 統計学で習う概念である平均と標準偏差を評価せよと。計算すると以下のとおりである。

  • くじA: 期待値 +5%, 標準偏差 24.19%
  • くじB: 期待値 +3%, 標準偏差 24.19%

「リスクの指標である標準偏差が同じで、期待値がAの方が高いのだから、Aが優れる。投資戦略の評価に使われるシャープ・レシオ(*)が くじBはくじAの60%に過ぎない。この計算結果を見てもわざわざBを選ぶのかい?」

(*) 平均を標準偏差で割ったスコアで、高ければ高いほど良い賭けであるとされる

しかしこの分析は的を射ていない。筆者の予想にすぎないのだが、金融業界に染まっていない読者諸賢の多くも同様に、別に数理的分析など講義されなくてもくじBを選んだのではないだろうか? 生半可な確率論知識こそが本来の人間の生存能力を奪ってしまう – 学校によって学生が却ってspoilされてしまうというよく聞く話 – がこんな場所でも発生するのである。

問題はこういうことだ。定額を賭け続けるのであれば確かにAを選択すべきだ。たとえば毎日このくじに1万円ずつ払うつもりであれば十分な時間たったあとには、AがBよりも大きな財産を残してくれるだろう。しかし常に調達可能と仮定されたその1万円は実際にはどこから調達してくるのか? 儲けが続いた後と、運悪くダウンサイドの5%をうけた後とで同じ金額を賭けられる保証がどこにあるだろうか。さらには、資産がたとえば1000万円規模に溜まったときも1万円、1億円溜まっても同じ1万円しか賭けないのは利率を考えると不自然なシナリオではないか? お小遣いが月500円だった小学生の頃は100円の出費を超真剣に考えていたが、月収が50万円になった今は10万円の出費を真剣に考えていることとと同じである。定額 ではなく定率で賭ける場合を考えないと非現実的なのである。

ここで前回と同様にKelly Criterionの対数期待値最大化原理が役に立つ。資産のうちどれだけの割合をくじAまたはくじBに賭けるべきだろうか? 解の導出過程は省いて数値結果だけ示すと、以下のとおりである。

  • くじA: 資産の47.40%まで賭けてよく、その場合は一回あたり+1.42%で資産が増えていく
  • くじB: 資産の100%を賭けてよい。一回あたり+1.72%で資産が増えていく
  • くじB (無利子で借金が可能な場合のレバレッジ最適解): 資産の48.85%を借金して、148.85%を賭けて良い。一回あたり+1.85%で資産が増えていく

最後のレバレッジ解は現実世界では最大ロスが完全に-11.5%で止まっていたり無利子借金できるケースが稀なので実用的ではないが、株式の代わりにコールオプションへの投資を考える場合の参考にはなる。そしてレバレッジなどかけなくても、くじBの方が複利での資産増加率がくじAより高いことが一目瞭然である。

  • なおこのくじA, Bのケースは解析的にも解くことができる。筆者は数値計算で出した
  • 今回のケースに限っては三次方程式の解の公式で解析的に導出できる。しかし現実世界の一般ケースでは確率分布はもっと複雑であり、モンテカルロ法を用いた数値計算に頼る必要がある
  • 余談だがこの手の数値計算には筆者はpythonのscipy.optimize.minimizeパッケージを愛用している – ver 1.1.0から内点法による制約つき一般非線形最適化モジュールのtrust-constr solverが入ってやれることが劇的に広がった。scikit-learnRegressorMixinクラスおよびClassifierMixinクラス, TransformerMixinクラスを拡張して内部的にはscipy.optimize.minimizeを呼び出した独自機械学習モデルクラスを作るのが筆者のスタイルである。筆者の真似はせずとも、読者諸賢も各種ソルバーの性質や利用可能制約について知っておいて損はないと思う

さて、厳密な最大資産増加率の計算はコンピューターに頼ることにはなったが、AよりBを好む直感自体は別におかしくなかったではないか。定性的にはこういうことだ: 確かにくじAはくじBよりもシャープ・レシオが高いが、一発退場のリスクがあるため一回あたりの投下可能金額に制限がある。一方くじBは、一回あたりではどんなにダメージを食らってもたかだか-11.5%で底がキャップされているため大きな金額を賭けても生き残れる。Bはたとえシャープ・レシオで負けていても、投下可能金額とシャープ・レシオの合わせ技で、シャープ・レシオ単独のAよりも優れた賭けに変わるのである。

たとえばプロスペクト理論における極小確率の過大評価 [3] など、行動経済学でアノマリー・非合理とされている人間の行動のいくらかは、生き物が本能的にpositive skewedな戦略を好むところから来ている。その副作用として、期待値マイナスが確定している政府発行宝くじまで買ってしまうのは確かに問題だが、期待値プラスのものを見つけられる前提であれば、positive skewnessの選好は長い目で見た生存と繁栄を目指す上で理にかなっている。

行動経済学者が人間の行動を非合理的といったときに、非合理的なのは直感で行動している人間の方ではなくて用いるべき解析技術を間違えた行動経済学者の方であるケースがしばしばある。筆者も以前の研究で例えば [4] で行動経済学と関わったし、行動経済学・認知心理学からは研究の幅を深める機会をもらった。なので行動経済学の既存成果を全否定する気はないが、経済学者が合理的と主張する意思決定はよく考えると実は直感よりもむしろ不合理な場合が多々あることを覚えておいてほしい。確率分布が完全に既知で帰納が不要な今回のケースでさえ、ナイーブな解析が非合理的な選択を合理化しようとした。確率分布が不完全にしかわからず帰納が混じるタスク (ヘッジファンドが扱うケースも含む) では、従来合理的とされたものが非合理的で、非合理的とされたものが実は合理的なケースがさらに増えていく。


ファスト&スロー (上)

平均・分散あるいはシャープ・レシオの罠

定額で考えた場合と定率で考えた場合で有利不利が逆転してしまう、というのは現代生活に毒されてしまった人には自明ではないようである。シャープ・レシオで劣るくじBがなぜ、くじAよりも優れていることになったのか? 答えは、Kelly Criterionの中に、同一平均・同一分散であればpositive skewedな戦略を好む性質がビルトインされているからだ。複利での資産最大化は、より経済学的表現を使えば対数効用関数 (logarithmic utility)最大化 と呼ばれる前回と同様、ある賭けの損益 (Profit & Loss: PnL)を確率変数Xであらわし、資産のうち\alphaの割合を賭けるとしよう。最大化すべき目的関数はU_p(\alpha)\triangleq{\mathbb E}_{p(X)}\left[\log (1+\alpha X)\right]である。確率変数X4次モーメントが有限であると仮定し、確率分布p(X)で積分される項をテーラー展開した上で各項を積分することで、以下の式(1)が導出される。

U_p(\alpha)=\alpha \underbrace{{\mathbb E}_{p(X)}[X]}_{mean} - \frac{1}{2}\alpha^2 \underbrace{{\mathbb E}_{p(X)}[X^2]}_{\simeq variance} + \frac{1}{3}\alpha^3 \underbrace{{\mathbb E}_{p(X)}[X^3]}_{\simeq skewness} - \frac{1}{4}\alpha^4 \underbrace{{\mathbb E}_{p(X)}[X^4]}_{\simeq kurtosis} + o(\alpha^4)    (1)

  • 4次モーメント有限の仮定は一般には成り立たず、現実にそのようなケースはしばしば存在する。そのようなクリティカルなケースではより慎重に考える必要があり、原子力発電と遺伝子操作を例として最後に議論するが最初はモーメント有限のケースで議論しよう

式(1)の第一項は確率変数Xの平均そのものに比例する。第二項は正確には(分散+平均の二乗)に比例しているが、通常この手の賭けは期待値に比べて標準偏差の方がずっとオーダーが大きい(=S/N比が小さい)ため、ほぼ分散に比例する。第三項がこれまで議論してきたskewness (歪度)と関係する。そして第四項はkurtosis (尖度)と関係する項である。小さな損失がたくさんあり大利益がたまにある確率分布では歪度はプラスの大きな値を取り、逆に小さな利益がたくさんあり大損失がたまにある確率分布では歪度はマイナスの大きな値になる。正規分布のような対称な確率分布では歪度はゼロである。尖度は確率分布の裾野の重たさを表現する統計量であり、大利益 or 大損失の確率が10%の分布よりも1%の分布の方が大きな値をとる。0.1%になれば更に大きな値をとる。

\alpha>0の場合の第一項から第四項それぞれの係数の符号を見て欲しい。効用関数U_p(\alpha)は平均が高いほど良く、分散が低いほど良く、歪度が高いほど良く、尖度が低いほど良いことがわかる。つまりKelly Criterionの最大化は、平均が高くて分散の低い(つまりシャープ・レシオの高い)投資を一応は好むが、同じシャープ・レシオなら歪度が正(positive skewed)の大きなものの方が好まれるのである。一方で前回議論した、アップサイドに魅惑されて賭けすぎる二流ギャンブラーが示唆するように、たとえpositive skewedであっても成功する場合の確率が極端に低いと四次モーメントが大きすぎて効用が落ちることにも気づくだろう。

Positive skewnessの場合は尖度が高すぎないよう注意すれば良いが、negative skewedでテールリスクがある投資は歪度の項と尖度の項の双方においてdiscourageされる。シャープ・レシオという指標は三次以降のモーメントを無視できる場合のみに有用なのであって、単にシャープ・レシオ最大の投資を選ぶといずれ痛い目に会う。モーメントに着目すると、以下を覚えておくと良い。

  • Kelly Criterionを最大化する場合は確率変数Xの全ての高次モーメントが効用に影響する。\log(1+x)をテーラー展開した場合は無限に項が継続するため
  • \alphaが小さい場合には低次モーメントだけでだいたいの投資成績が決まる。規律を持って少額を賭けている限りは統計学の基礎で習う指標だけで判断しても問題ない
  • 平均がプラスである限りは、分散やnegative skewnessが大きくても利益を上げること自体は可能である。掛け金を0.1%、0.01%といった小さい値にもっていけば一次の項しか関係しないためである。ただし最終章で議論するモーメントが発散する場合を除く
  • 高額を賭けるときに少額で賭けるときの基準を適用すると痛い目にあう。高額の賭けでは、平均のような低次モーメントよりも高次モーメントの方がクリティカルになるため

Negative skewedかつ期待値が正の賭けはたくさん存在し、規律を持って掛け金を小さくできるならそのような賭けを行っても問題はない。規律を保てなくなる原因は、多くのケースでは帰納の誤りにある。小さな成功体験を納めすぎると、真の勝率が実は95%しかないのに99%あると勘違いしたりする。その結果Kelly Criterionで許される金額を超えて賭けてしまう。Left tailが重たい場合はもっと悲惨である。本当は成功確率99.5%なのに99.9%あると勘違いし、少額利益のために0.5%の確率で大災害が起きるような巨大なリスクを取ってしまう。そして、いずれやってくる大災害で破産もしくは債務超過になる。お金だけの話に限定しても、自己破産が許されなければ貴方は高利貸しの言いなりになってしまうだろう(注: 2018年現在日本では救済としての破産は可能なので、本当に困っている方は素人考えで変な行動を起こさず弁護士にまず相談すること)。お金よりもっと大事な人類全体の課題に対する一般的な投資のケースでは、我々は二度と復活できない。たとえ真の期待値がプラスであっても

大損失の発生確率または発生時の損失の大きさを過少評価する戦略上の間違いは、金融市場ではオプションを売る投資家に散見される。典型的にはDeep Out-of-The-Money (DOTM)のオプションをキャッシュでカバーできる許容金額を超えて売ってしまう人たちで、資産価格がジャンプして動いたときにこの手の暗い話題は事欠かない (DOTMが何なのかわからない読者諸賢は特に気にする必要はない。地震保険を売るのと同じだと思えばよい)。

オプション投資から学べることはビジネスや人生設計に大変有用であるので、今回の議論ではオプション用語を使わせていただく。以降の議論でもオプション・プライシングの数理などは特に使わないが、オプション取引に馴染みがない人のためにコールオプションの買いとプットオプションの売りという単純な二つの取引がどういう性質を持っているか少しだけ紹介する。すでにオプション取引の経験がある人は次節は飛ばしていただければ幸いであるし、また初めてご覧になる方も筆者の主張を理解するのにオプション・トレーダーの深い蘊蓄は必要ない。

その後、これらの単純な二つの取引と類似したビジネス・仕事が世の中のいろいろな場所に転がっていることを観察し、それぞれのペイオフ構造がどのような問題を引き起こすか、どのように変えていけば良いのか見ていこう。

      • なお巷の金融工学のテキストの多くは結局のところオプション価格の期待値がどうあるべきか or なるかを議論しているだけである。平均だけを見るリスク中立の世界は、複利で賭けていく投資家にとっては参考になることが少ない
      • どのようなネーミングが適切かわからないが、「対数期待値中立」みたいなプライシングの概念があったら筆者も学んでみたいので、もしご存知の方がいれば文献を教えてほしい
      • 現在のところ、筆者が個人的にオプションを評価する上で重視するのはリスク中立価格と市場価格の差ではなく、(1)式のU_p(\alpha)を最大化する\alphaにおいて、p(X)にある程度の精確な推定値を用いたときに効用が実際にどのような値になっているか、つまり実現可能な最大対数増加率 \max_{\alpha} U_p(\alpha)である。この評価方法は金融工学専門家が見たら首を傾げるかもしれないが、筆者はこれに深く納得している
      • プライシング理論よりも注意すべきなのはむしろ、p(X)のオーバーフィッティング、推定誤差の過小評価である。p(X)の推定値の不確実性を効用にどう反映するか考えるわけだが、古典的なブートストラッピング、あるいはBayesian bootstrap [5] は個人的にはとても役立っている
      • この蛇足まで読んでくれた方のために、オックスフォードの地の利のおかげで筆者が手に入れた知見をもう一つシェアしておこう。ベイズ推定における不確実性の評価方法のスタンダードは事後分布の解析評価 or 事後分布からのサンプリングだが、この事後分布はモデルが正しいときのみに正確な不確実性を与える(正確不確実性って不思議な表現だね)。仮定しているモデルのクラスが真のデータ生成過程を含まない場合に、ベイズ推定は不確実性を過少 or 過大評価する(過少評価が大半)。モデルのmisspecificationを許す場合の正確な不確実性の評価法にはいくつかあるが、たとえば [6] では真のデータ生成過程が、中心が仮定されたモデルそのものであるDirichlet processからのサンプリングであるというメタモデル化を行っている。その結果、Bayesian bootstrapとMAP推定の組み合わせがmisspecifiedモデルに対する不確実性評価の優れた方法であることが示されている。計算時間のかかるMCMCを行わずともbootstrap標本を数百程度生成して、それぞれの標本上でMAP推定をするだけで非常に良い不確実性評価ができていたわけだ。統計学部のChris Holmes教授はmisspecifiedなモデルにおけるベイズ推定について多くの成果を出しているので、興味がある人は参考文献を辿ってみると良い

コール買いと起業家・研究者

大半の労働者にとっては、景気が良くなった方が生活が安定し幸福度も上がる。株価と経済状況の相関がプラスであると言ってしまうのは実はとてもナイーブなのだが(歴戦の投資家先輩方から怒られてしまうであろう)、説明の簡便さのために、経済が良くなること、売上が増えること、仕事がうまく行くこと、給与が上がることなどポジティブな現象全般を単にアナロジーとして「株価が上がる」と表現することにする。そして多くの人が株価が上がる方向に賭けている世界を考える。

同じ株価の上がり方でも、人によって賭け方が違うため、利益の享受の仕方が異なってくる。株価が+30%上がった場合でも、ポジションの取り方によって+60%になる人や+10%で終わる人などいろいろな取引がある。上場企業C社の株価が上がる方向に賭ける場合、簡単なものでも以下の三種類の取引を行うことができる。最初の選択肢である原資産の株式を買う場合は、アップサイドもダウンサイドも一体となって享受するだけである。

  • C社の株式を買う
  • C社のコールオプションを買う
  • C社のプットオプションを売る

2番目の選択肢について、特にOut-of-The-Money (OTM)のコールオプションを買う場合について説明しよう。たとえばC社の現在株価が$100だとする。1年後に$120で株式を買う権利はコールオプションと呼ばれ、これが例えば一株あたり$0.5で売られている。もし株価が本当に大きく上がって一年後に$130になった場合、権利行使して$120で買って$130で売れば差額の$10が手に入る。権利自体は$0.5で買っていたのだから、$0.5が$10になって掛け金の20倍が帰ってきた! 原資産をそのまま$100で買っても$100が$130になるだけだが、もしOTMのコールオプションを買えば$100 / $0.5 = 200株 分のオプションを買うことができ、本当に株価が上がれば $100が$130ではなく$2,000に化けることになる。

無論こんなうまい話は実際には殆どない。株価が$130になる確率はごくわずかであり、むしろ一年後も$120未満である可能性の方がずっと高い。もし$100を全額OTMコールオプションに投下して、株価が上がらなければあなたは破産である (賭けすぎの二流ギャンブラー)。しかし投下金額を$100ではなく例えば$10に減らすことで最大損失を$10に限定しつつ、アップサイドも+$30ではなく+$100に増幅することができる。これでも楽観的すぎで、現実の金融市場では、殆どの場合において理想的なポジションサイズは更に小さいものだろう。

つまりコールオプションは、ダウンサイドを限定しつつアップサイドを拡大するギャンブル・安全弁のついたレバレッジとして用いることができる。その代わり成功確率が低くなる代償が存在する。株価が$110まで上がった場合、素直に株式を買っておけば+10%のリターンはもらえたのにOTMコールオプションの場合はゼロである。


グリーンブラット投資法 ──M&A、企業分割、倒産、リストラは宝の山

それでも、ダウンサイド限定・アップサイド拡大の双方を併せ持つ魅力が強すぎるゆえ、宝くじ買いをする投資家が後を絶たない。それを見透かしたオプションの売り手、たとえば前述した銀行家や、手持ち株を利用したカバードコール戦略で小遣いを稼ぐ機関投資家は、ここぞとばかりに宝くじを高値で売りつける。最初の例のように$0.5で買えた場合はいいものの、$1、$2とコストが増えるに従い確実なダウンサイドであるコストに対する不確実なアップサイドが見合わなくなっていくことを想像してほしい。コールオプションの買い手にとって重要なことは、売り手が成功確率を過少評価しているような投資機会・優れた企業を見つけ出し、売り手がその誤りに気づく前に買うことだ。これはつまりところ、起業家や研究者が他人からバカにされている・過小評価されているビジネス機会や研究テーマを見つけ出して先に着手することと似ている。たとえ夢はあっても成功確率が低いのも同様である。

コール買いをすると、なかなか簡単に成功が出ないので、来たるべき日が来るのはいつだ、まだかまだかと「イライラ」することになる。

プット売りと保険屋・サラリーマン

第三の選択肢に使われるプットオプションは、株価を指定された行使価格で売却する権利である。プットオプションを「売る」投資家は、株価が下がった場合に時価が行使価格より低くて割高な行使価格でも株式を買い取る義務に同意する。プットオプションの買い手は株価が暴落した場合の恐怖から解放されるために、保険を売り手から購入するのである。

プット売りのペイオフを簡単に見ておこう。C社の株価が$100から残念ながら$60に下落してしまったとする。一方のあなたは行使価格$80のプットオプションを他の投資家に販売し、保険料$5を先に受け取っていた。しかし残念ながら時価$60の株式を引き取ることになり、差額$20の損失、プレミアムで少し軽減されて正味$15の損失を負うこととなった。

ただしこのようになるケースは希である。株価が下がったといっても$85までしか下がらなかった場合、買い手は(誤発注などをしない限りは)プットオプションを行使しないので、あなたが株式を買い取ることはない。結果としてあなたの手元には$5残る。株価が$100のまま、$110に上がった場合、$130に暴騰した場合も買取は発生しないのであなたの売上$5は残る。

つまりOTMのプット売りは基本的には株価の上昇局面で利益が出る。ほぼ確実に少額の利益が得られるが、低い確率で大きな損失を負う。とはいえ、株価の暴落局面やバブルの疑いがある局面では投資家は恐怖にかられるため、高い保険料の支払いに同意することが多い。その結果、注意深く取引していればプット売りも期待値をプラスに持っていくことができる。

C社が顧客を独占できるような画期的な技術を開発して株価が暴騰した場合でも、あなたの利益は一定金額である。しかし逆に大スキャンダルが起きた場合にはあなたは大きな痛みを味わう。保険販売はプットオプションの販売そのものだが、たとえば(特に日本で)サラリーマンとして会社に勤務することもプット売りに酷似している。成果が並でも凄くても毎回一定金額のサラリーをだいたい受け取るし、名の通った一流企業であれば今までの業務通りのやり方をしてもだいたいは利益が維持できる。ただし低い確率で、勤務先のビジネスは新興のベンチャー企業や異業種参入してきた海外資本などに根幹からdisruptされ、ある日突然集団リストラ。手に入ると思っていたサラリーがいきなりゼロになった(生活費を考えればネット収支はマイナス)、などという事態に陥る。ベンチャー企業にdisruptされるなんてアリエナイと言ってるみなさん。Apple (この会社はベンチャーですらなかった)のiPhoneが出たあとNokiaがどうなったのかを思い出して欲しい。一時期ニュースを騒がせた「想定外」である。

Disclosure: ただし筆者個人はNokiaが好きでイギリスで購入した携帯はNokiaブランドのHMD Global製である。新興企業のHMD Global社がこれから何をしてくれるかは分からないが、Nokia復活の日を見るのが個人的な楽しみである (そのためにはHMD Global社は今までのプロダクトと少し違った何かには賭ける必要があるが)

プット売りをすると、低い確率の大暴落に対する恐怖と戦うことになる。その結果、プットセラーは「ビクビク」した生活を送ることになる。

プット売りサラリーマンの恐怖と無気力

イライラしているコール・ロングとビクビクしているプット・ショート。雇用主からの報酬パッケージがほとんど定額サラリーで占められており、RSU/ストックオプションやボーナスといったアップサイドが雇用契約に含まれないタイプのサラリーマンは、プット・ショートonlyのポジションを取っているに等しい (債券ロングとどちらが近いか思案したが、大企業の経営危機が増えた最近はプット・ショートの方が実態に近いと思う)。成功確率は高いがアップサイドが上限キャップされている一方で、もし業界変革でリストラになったりすると大きな損失を被るプット・ショート、サラリーマン報酬にはnegative skewnessが伴う。それでも多くのサラリーマンが、少なくとも先進国では自分と家族を養って無事に引退していくことを考えれば、このプット・ショート・ポジションの期待値自体はプラスである、と言ってよいだろう。

  • なおサラリーマンでもこれに該当しない業種はいくつかあり、たとえばスタートアップの初期従業員やヘッジファンド社員の実質ポジションはOTMのコール・ロングとOTMのプット・ショートの合成になっている。fixed incomeとコール・ロングの組み合わせゆえに転換社債ロングにも似ているが、ここではその議論は省く

ここで「期待値プラスでもnegative skewnessの場合は賭けすぎに要注意」の議論が出てくる。レバレッジをかけるなど基本的には論外である。自分という資本が100%しかないのに150%とか200%をプット・ショート的ポジションに張ってはいけない。具体的には、不必要な長時間労働をしたり、アップサイド固定の副業をしてはいけない。自分の健康を担保に将来から借金をして、直近のお金を稼いでいるだけにすぎないからだ。少し余計な病気にかかっただけでこのポジションはすぐ破綻する。サラリーマン就労自体は期待値がプラスの賭けであるが、労働集約的な副業でレバレッジをかけると対数期待値がマイナスの領域に突入してしまうことになる。

  • Negative skewedポジションのレバレッジ禁止から示唆されることとして、副業をする場合に選ぶ仕事はサラリーマン的なものは避ける必要がある
  • 起業家/研究者的な何かでしかも少額betができるものが望ましい。データサイエンティストならkaggleの比較的新しいタイプのタスクで小遣い稼ぎとか (スキルが水準に到達している人に限るが)
  • 長時間労働を要求されても、同業者が身につけることのできない特別スキルが身につかない限りは拒絶すること。企業は「残業を拒否できない」と雇用契約書面に書くものだが、不要な残業が発生しないように顧客との交渉をする責任は企業側と労働者双方にある。個別に交渉する勇気があなたにないと、レバレッジによるもっと大きな損失がやってくる
    • 一方でその特別業務にスキルと特殊知見獲得の莫大なアップサイドがあるなら、その余計な負荷に没頭してみても良いことになる
    • その場合でもリスクを抑えるためメインの業務量を減らす必要性は変わらない

長時間労働 or 副業によるレバレッジは、ある程度常識が働く人なら回避できるかもしれない。しかし過労死等の痛ましいニュースがまだ日本社会に残ることを見る限り、全ての人が正しくこの過剰レバレッジを回避できているとは言い難い。成長のために借金によるレバレッジをかけろとフェイク・アドバイスをしてくる大人たちも罪深い。ただしく長期成長するためには借金を伴わないタイプのダウンサイド限定レバレッジ機会を「探す」必要がある。間違っても今すでに確定している業務を単に物量増やしてこなすことは正解ではない。この辺りの意思決定で必要となるセンスは、資産運用と自分のスキル開発とでほぼ同一である。

しかし常識をもって借金は回避できたとしても(ネットのポジションはキャッシュ・セキュアード・プットと同様になるだろう)、低い確率の大きなダウンサイド自体は依然としてサラリーマン生活に付随し続ける。筆者の個人的印象では、この恒常的なダウンサイド / プット売りに起因する恐怖と無気力が、日本の労働者たちの活力を奪っているように映るのである。

悪魔のモラルハザード契約: ネイキッド・プットをスプレッドに変えて無気力続行

プットオプションを売るだけの取引がリスクが大きすぎると感じるときに、リスクを限定するためのポジションの一つにブル・プット・スプレッドがある。OTMのプットを売ると同時に、より行使価格の低い (よりskewedな) OTMのプットに買いを入れることで損失を限定する。保険を売りつつ、再保険会社と契約するようなものだ。ブル・プット・スプレッドにもnegative skewnessは残るのだが、left-tailをキャップする効果があるためテールリスクは大幅に減少する。単なるプット・ショートよりも大きなポジションが持てるようになる。

あなたがプット・ショートせざるを得ないサラリーマンだとする。ある事業がすごくうまく行っても会社が利益の大半を持って行ってしまい、あなたにはアップサイドがない。一方で低い確率の大暴落を受けた場合、それがあなたの選択の失敗に起因するものだった場合、社内で非難大合唱が始まり精神を病んでしまうかもしれない。あなた個人のせいではなかったとしても、部署全体が取り潰しになり今後の生活不安が爆発する。そんなときに、取引先会社がさらなるOTMプット・保険を売ってあげるよ? と提案してきた。何ということだ。これで自分の人生は安泰だ・・・そんなデタラメな話があるかと読者諸賢は訝しむかもしれないが、筆者の見立てでは日本の企業間取引 (Business to Business: B2B)ではこれが蔓延している。

ITベンダーとの共同プロジェクトで、競合関係にある2社が異なる提案を持ってきた。ユーザー企業であるあなたはどちらを選ぶだろうか?

  • ベンダーA: 一定の成果がほぼ確実に期待できるプロジェクトを提案してきた。そして納期がXXX日以上遅れた場合には全てのコストをベンダーが負担する保証が入っている
  • ベンダーB: 面白く新しいビジネスモデル開拓につながりそうだが失敗する可能性の高いプロジェクトを提案してきた。失敗覚悟で我々の投資資金を「賭ける」べきだと説得された。ただし失敗の責任はベンダーではなく我々にある

こういう営業・取引交渉が何百・何万と行われている世界を考えよう。マクロな経済システムの発展を考えたときに、ベンダーAを選択する企業が大半になると日本社会にとっては悪夢である。個々の企業あるいは企業内部署はベンダーBが提案するプロジェクトのように、positive skewedリスクを取る必要がある。ただし種々の異なるプロジェクトに分散投資することでドローダウンを抑えていく。もしあなたが謂わゆる賢明な独裁者で全ての契約に口を出すことができるなら、ベンダーBタイプを選定する強い圧力をかけることになるだろう。

だがベンダーBを採択するよう促すのに、冷酷な独裁者による強制は別に必要ない。ベンダーBを選んで、うまく行った場合には担当者である社員にもどーんとアップサイドの成果報酬を渡す、つまりコールオプションを売ってあげるだけで十分なのだ。わざわざ社長が説教しなくても社員はBを選択するだろう。

しかし、日本のB2Bビジネスに触れたことがある人はすでに分かっており、馴染みがなくかつB2B企業への転職を考えている人は覚悟して欲しいのだが、日本企業の社員はベンダーAを好むことが大半なのである。なぜか。その答えは従業員個人が意思決定する点にある。

端的に言って、この現象は経営者が社員をincentiviseする方法を間違えたがために起きている。従業員にとってはベンダーAの選択は完全に合理的である: ベンダーBを選んでも利益は社長か資本家が持っていくだけだ。一方で高い確率の失敗は自分たちのせいにされる。一方ベンダーAを選んでおけば、万が一の失敗も彼らに責任転嫁できてクビを回避しやすい。どちらもアップサイドはないが、ベンダーAにはダウンサイドのプロテクションがついている。こんなことを多くの従業員が考えているせいで、B2B取引では保険を買うことばかりに頭がいき、肝心の事業の強化・収益力の向上を目指す本質的なプロジェクトは過少投資される。

B2B取引で経験の長い営業マンは、顧客企業ではなく顧客企業の従業員個人の潜在欲求を満たした方が売上が増えることをよくわかっている。彼らは顧客企業全体の将来のビジネスのことを本質的には考えない。代わりに、保険が欲しい従業員の心を買収して確実にディールを締結させる。さて、多くのディールのおかげで歩合ボーナスをもらうこの営業マンと責任回避を達成した顧客従業員は満足かもしれない。でも大局的に見たら我々は何をやっているのか? 日本社会の悪夢がまた一歩、実現に向かって前進してしまった。

このような状況でお偉方は「若手はチャレンジ精神が足りない」などと明後日の説教をする。しかし根本的原因を想像してほしい。元はといえば、事業成功時のアップサイドを渡す契約を忘れた経営者が愚かなのである。何の成果報酬もないのにわざわざリスクをとる人物がいたら、人格は高潔だが知性がむしろ足りないとさえ言える。だから経営者のみなさん。こんなことを続けて自社の競争力が弱っていくのは暗黒時代への片道切符でしかないのだから、なんとかしてコールオプションを社員に渡してあげましょう。そしたら社員も保険買いをやめてリスクテイカーに変わってくれる。誰のプロジェクトが成功するかはわからないが、誰かはいずれ画期的な発見をする。社員に自社株買いを奨励するのも良いが、現物自社株だけだとこれらの社員にとっては少々レバレッジが足りない。株主に配当やキャピタルゲインを渡すためには、社員を良い方向に刺激してとにかくまず収益力を強化しないといけないのである。

経営者に全ての責任があるとは言わない。経営者が従業員のincentivisationを訴えても却下してしまうような、株主にも問題があるかもしれない。しかしそのようなコミュニケーションも含めて重い責任があるからこそ、経営者は大きな報酬を受け取る資格があるのである。経営者は努めて、そのような株主ではなくて真に投資眼のある株主を集めるようコミュニケーションを図らなくてはいけない。Amazonにおいて、ジェフ・ベゾスCEOがともかく新しいチャレンジをした社員には結果に関わらず表彰していたことを思い出そう。


ジェフ・ベゾス 果てなき野望

お金だけではないアップサイド

さて、ここまでの議論だとサラリーマンは踏んだりけったりにも見えてしまう。期待値プラスであること以外は何も救いがない。一方の経営者・資本家はやりたい放題・・・などと勘違いするのは経営者と話したことのない労働者だけである。サラリーマン家庭に生まれた筆者も30歳ごろまでそうだったが、友人が起業や経営に関わるようになってから違う見方もでてきた。

実は、経営者はお金のアップサイドと引き換えにスキルのダウンサイドを負っている。上場企業であれば投資家とのコミュニケーション、各種事業責任者から上がってくる情報の整理と資本配分の再考といった膨大なプロセスをこなしていく多忙な日々のせいで、たとえば元々は一流のソフトウェア・エンジニアであった人も気がつくとテクノロジーの最先端がわからなくなっていたりする。本質的には経営者は資本配分のスペシャリストであって、それ以外のことを担当者にdelegateする必要がある。しかし配分を適正化するだけに足る市場と自社技術の現在および将来に関する深い洞察は常に持っていなければならない。忙殺は資本配分に必要な後者のスキルを奪ってしまうことも多い。そこまで含めてマネジメントするのが経営者の責任であるわけだ。経営者が「忙しくてよく考えられない」と感じたら、その経営者はそもそも仕事をしていない。

アマゾンのベゾス氏:1日3つ良い決定をすれば「仕事は十分」

一方で金銭的成果報酬部分のレバレッジがあまりない労働者であっても、スキル向上機会のアップサイドには恵まれていることが多い。保守的であると型に当てはめられて説明される大企業では、実際には多くのスキル向上機会が提供されている。規模の経済に必要な関係で運用されているインフラが巨大であり、利害関係人物が多様であることによるものだ。

  • なお自分の会社では金銭もスキルもアップサイドがないと、何度真剣に考えてもあなたがそう思うなら、それは実際におそらく転職しなければならない状況だろう

労働者は実際にはスキルのコールオプションを雇用主から買っている。このオプションを手に入れるために、従業員は、経営者あるいはもっと金銭的報酬が多いがより忙殺されている人々よりも低い現在賃金に同意する(プレミアムを雇用主に払う)。その代わり、雇用先企業のインフラおよび人的ネットワークを使って、self-employedで働いていた場合では到底手にできないスキル獲得を狙う。このコールオプションは、可能性としては獲得したスキルをレバレッジして将来大きく稼ぐ宝くじになっている。スキルが獲得できる保証自体はなく従業員自身のリスクテイクによるものであるのも金融市場のコールオプションと同様だ。しかし実際にオプションがstrikeした場合には、同じ雇用主のもとで大出世するのも、他社に高額で引き抜かれるのも、はたまた自分が起業するのも、何でもアリである。雇用契約のもとで開発した知的財産自体は雇用主が差し押さえるものであるが、その知的財産を生み出すにいたったプロセスから獲得した、あなたに隠された膨大な経験を会社が差し押さえることは実質不可能だからである。

たとえば筆者の場合、現在の雇用主の元でもっとも有難いのは投資プロフェッショナルとのコミュニケーション機会である。Self-employedの個人投資家の想像とは大きくちがった、業界構造の深い知識が手に入る。

  • たとえばセルサイドであるmarket makerは、なんらかの理由でバイサイドの将来の注文が先読みできる場合には、execution algorithmを洗練させることでmarket makerにとって有利なbid-ask spreadを提供したりする
  • 一方のバイサイドはブローカーに余計なコストを払うのを防ぐために注文を乱択するなどの予測可能性を減らす対策を行う。水面下の小さな勝負があるわけだ
  • とはいえセルサイドに注文を執行してもらわなければバイサイドも商売が出来ないので、お付き合い自体を切るわけではなく、あくまで微調整をするイメージで捉えてほしいが

機械学習研究者の筆者としては、二番目だが一番目に匹敵するくらいにありがたいのは大規模な計算機を使い倒して実験ができる環境だ。最終的に構成される投資戦略はCPUが数コア程度の環境でも十分に実行可能な実装に落ち着くことが多いのだが、その戦略が将来にわたってもおそらくリターンを生み出し続けるとの確信をもつためには、たとえばbootstrap sizeを非常に大きくしたり、高次元の積分が必要なある種のノンパラメトリック検定をモンテカルロ法の力技で解決するなど、信頼性担保プロセスにマシンパワーが必要である。

  • マシンパワーの必要性は将来のリターンを予測する際のS/Nがとても小さいことから来ており、低いS/Nは金融市場で投資家が互いにしのぎを削ることで発生する
  • しかしS/Nがゼロであると考える効率市場仮説論者とは違い、低いが実際には正であるシグナルが存在する。その存在を莫大な実験を通して実証するわけである

筆者の雇用先における計算機の規模は、GoogleやAmazonといったITの真の巨人よりはずっと小さいが(社員数がそもそも3桁以上違うしファンドの運用コストを抑える義務もある)、それでもこれまでの雇用先に比べてずっと大きな規模の計算機実験ができる。このプロセスを通して構成された投資戦略は、一人の個人投資家がせいぜい100万円程度の計算機で実験して見つけたそれとは信頼性に大きな違いがある。また、大実験をする前提であっても、プロセス効率化をはかる際には投資プロフェッショナルからの知見が大きなヒントになる。予測モデルのどの部分については大きな時間をかけて厳密に調べつつ、どの部分は非金融業も含む機械学習屋のよく用いるデフォルト設定で済ませてしまうかのフォーカスが設定しやすくなるわけだ。投資知識、大規模計算機環境、そしてその非線形相互作用まで含めたパッケージこそが、筆者が雇用主から提供された大事なコールオプションである。

  • たとえば将来のある時点で、ヘッジファンド・ビジネスとは全く別だが同様にS/Nが異様に低いなんらかのデータセットと格闘しなければいけない新業種が発生したとしよう
  • この新会社は画像認識や広告ターゲティングなどの多様なバックグラウンドから多くのデータ・サイエンティストを雇ってみたが極端に低いS/Nゆえに彼らのほとんど誰も成果を出すことが出来なかったとする。このようなビジネス領域において、将来の筆者が労働市場であるいは自分のスモールビジネスにより持つ交渉力はとても大きい
    • 筆者の研究が今後十分に成功した場合に限るが
  • そのために、潤沢なキュッシュフローをもつIT企業では働かず高額従業員パッケージを逃している(=コールオプションのプレミアムを支払っている)ことを覚えておいてほしい
  • あくまでオプショナリティであることに注意: そのシナリオが将来確実に発生するわけではない。非ゼロの低確率で発生したときにstrikeするコールオプションを保持しているだけである。オプション行使は自由意志による選択であって、行使義務はない。筆者が目指すキャリアの既定路線が投資の世界での成功であることには変わりはないし、そちらの路線がうまく行けばこのオプションは別に権利放棄して良いのである
  • このオプショナリティの根源は、極端に低いS/Nデータに対する予測品質確保という仕事がいまのところ機械学習アプリケーションの世界ではメイントピックではないことに起因している。ある程度予測の成功が約束されている世界で現在引く手あまたなのに、そんな嫌がらせみたいな課題の世界に何故わざわざ行く必要がある、と同業者が将来の可能性を過少評価することで機会が発生するわけだ。端的にいって、直近の報酬を少し妥協できるマイノリティは大きなオプショナリティを持つことになる
  • 大規模実験に関してほかに感じるのは、スケーラブルなR&Dインフラにおける雇用機会の過少評価である。ITインフラを担当するソフトウェア・エンジニアの方と話していて思うこととして、e-commerceサイトなどのように直接現在のサービスを提供するフロントの部分には大規模な並列計算を用いるのに、そのプロダクトに将来導入されるアルゴリズムを開発する社内インフラはなぜか貧弱にしてある日本企業を広く散見する
  • このいびつな構造には筆者はこれらのIT投資意思決定をした担当者の近視眼性を感じるのであるが、ソフトウェア・エンジニアの人はこの近視眼性にキャリアを潰されてしまってはもったいない。顧客と接する直接サービス部分ではなくてR&Dインフラ構築にも実は大きな可能性があることを考えてみるとよい

そんなわけで、経営者が賃金を増やしてくれないと嘆く労働者のあなたも、実はコールオプションをすでにもらっていなかったかどうか、今一度よく考えてみてほしい。また経営者の方も、収益力強化をはかる上でコールオプションを社員に売ることができないか考えてみてほしい。まず理解して頂きたいことは、これは無料のフリーランチを配るモラルハザードとは大きく違っていて、互いにリスクを取った上での正当な投資にすぎないことだ。経営者であるあなたはコールオプションを売った際にプレミアムを受け取る権利があり、従業員の賃金をさらに少し低くしてもよい。あくまで少し低くである(大きく下げるのはKelly Criterionで投資可能な水準を超えた不合理なレベルのリスクテイク、二流ギャンブル性を社員に強要することにつながる)。低い確率の成功時には、溜め込んだリスクプレミアムと事業成功による大きなキャッシュフローのプールからどーんと報酬を払ってあげるだけである。本質的には、あなたが資金調達の際にequityでファイナンスするかdebtでファイナンスするか、資金提供者との関係構築時に考えていることを社員とのコミュニケーションにも適用するだけのことだ。

リスクを取らせすぎる福祉国家

さてコール買いポジションの福音を説いてきたが、賭けすぎ二流ギャンブラーになる危険性を再三伝えてきたとおり、このポジションは無節操に奨励されるべきものではない。極端にアップサイドの限定されたサラリーマンはプット売り由来の無気力が問題となるが、ダウンサイドを限定したコール買いポジションの方はそちらはそちらで、ペイオフ構造があまりに魅力的すぎてうっかり賭けすぎてしまうのである。

雇用先での報酬が一定額サラリーのみで明示的なアップサイドに馴染みがない人々は忘れているが、たとえば日本の大半の市民は、健康問題に関してこの賭けすぎギャンブルをしている。救急車を呼ぶにも20万円かかるために血だらけで病院まで歩く人々がたくさんいるアメリカ合衆国とは違い、日本やイギリスは国民皆保険国家であって治療可能な病気・怪我である限りは公的機関からの手厚いサポートがある。病に倒れた全ての人が完治するわけではないが、ほとんどの患者は病気が治癒するかどうかそのものに関心を持てており、米国のように医療破産するかどうかを先に心配する人はほとんどいない。日本でこのような心配をする人は単に高額医療補助制度など公的なシステムを理解していないだけである。

しかし困っても病院が・国が助けてくれるからと過剰に安心して予防医療に対する自己意識が低いのが日本の課題である。アルコール依存(依存している本人は依存していることに気づいていなかったりする)やたばこ依存から偏食から歯磨きでフロスを使わない怠慢まで、医療専門家に言わせると列挙すべきものがたくさんあるだろう。皆保険システムが提供してくれるプットオプションを手に入れたのはいいが、ダウンサイドがキャップされて過剰安心したせいで、不合理にレバレッジをかけてしまったのである。国民へ寛大にもプットオプションを付与する主目的は、あくまで最悪ケースからのプロテクトであって、過剰安心からくるレバレッジ: 借金して株を追加するような過剰リスクテイクの奨励ではない。NHSによる保護があるイギリスも同様で、筆者の自宅近所の名門公立病院には、金曜日になると急性アルコール中毒患者が多く運び込まれているようである。

福祉国家は市民にリスクテイクさせ過ぎる点が問題である。一部の右派的思想の持ち主は、福祉国家のもたらす安心が、ハングリー精神を失わせ経済が不活性化するという主張をして福祉国家や福利厚生システムに反対することがあるが、実態は全く逆でハングリーになりすぎるのである。たとえば左派の学者や政策担当者は、福祉が国民を羊にするというような明後日の批判にたいして自身の政策をdefendする必要は全くない。むしろそんな批判でオロオロしてしまうような左派を見ると、全体としては福祉国家をなんだかんだで良いものだと考えている筆者としては無能な味方から刺されたような気分になる。

左派は右派に対して、福祉があってもハングリー精神は失われないなどと弱腰の意味不明な反論をしてはならない。福祉のせいでハングリーになりすぎる欠点はあるが自制心を促す政策も併せて実行していく、その仕組みは・・と反駁していく必要がある。過剰リスクテイクをしない自制心を市民にどう根付かせるか、その具体案こそが左派が右派に対して真摯に回答しなければならない内容である。政府レベルの意思決定ではなくて、企業内でもときどき全社員に対して提供される福利厚生システムを憎む変な従業員がいるが(自分の給与になるべきお金が他の社員の保険に浪費されると単に思い込んでいるのだろう)、このようなケースでも同様である。明後日の方向の憎み合いと無意味な口論ではなく、ペイオフの非対称性をきちんと理解した意味ある討論を政治レベルでも民間企業レベルでも見たいものだと筆者個人は思っている。

プットセラーも重要な社会的役割を負っている

Positive skewedなポジション・コール買いの麻薬的負の側面を理解するのが大事なのと同様、negative skewedなポジション・プット売りの社会的正の側面も忘れてはならない。サラリーマンとして働く機会のように、期待値が正のポジションが広く世の中に存在している事実を忘れてはいけない。そしてなぜ期待値が正の投資戦略はnegative skewedなものが多くなってしまうのかを考えてみることは大事である。投資家や労働者が広く収益機会を探しているなら、期待値正の投資戦略はpositive skewedなものとnegative skewedなものと半々の割合で存在しても良いではないか。

なぜnegative skewedかつ期待値プラスの投資機会が多いのだろうか。この理由を考えるとき、映画 Bridge of Spiesでトム・ハンクス扮するジェームズ・ドノバン弁護士の台詞が思い出される。保険金請求に対して彼は要求額の半分だけが支払われるべきだと説くときにこんな感じのことを言う。「保険業そのものが儲からなくなるような出費が出たら、保険会社が撤退してしまいその結果誰も保険で保護されなくなる」


ブリッジ・オブ・スパイ [AmazonDVDコレクション] [Blu-ray]

この台詞は本質を集約していると思う。生命保険も自動車保険も、保険会社自体の収益はプラスでskewnessはnegativeである。保険を買っている人々はpositive skewedで期待値がマイナスの賭けをしているわけだが、彼らの目的は最悪の事態から自分の人生の続行可能性を守ることであって別に生命保険を買って金賭けをしようなどとは考えていない。もちろん、生命保険会社同士の競争はあり価格に下落圧力がないわけではないが、保険会社の利益がゼロになるまで被保険者が保険会社に圧力を加えるような事態にはならず、売り手と買い手が双方とも自然に満足する価格水準に行き着くということである。

保険会社はleft-tail riskという代償を元にプラス期待値の報酬を手に入れる権利がある。同様に、資本家と経営者、経営者と従業員のように、少なくとも人間同士の取引においてはペイオフやリスク構造は鏡像の関係にある。双方が人間である取引において、片方がリスクフリーで一方的に得をするディールは何かがおかしい。このように考えるとpositive skewedなポジションが欲しい人はnegative skewnessを負う人に対価を払うのは当然であり、双方のリスクテイカーが尊重されるべきだ。

ただし本質的にはゼロサムの保険の売買と違って、経営者から従業員へのコールオプション付与はそれ自体が余剰を産むプラスサムになる。というのはインセンティブ付与された従業員の努力と献身によって会社全体が成功すれば、コールオプションのstrikeによる支払いが生じても経営者にとってはプラスであり、オプションを行使する従業員は言うまでもなくプラスだからである。Skewnessは鏡像の関係として残るが、双方が期待値プラスの取引が作り出せないか、我々は絶えず創造性を大事にすべきだ。

高次モーメントが発散する場合: 原子力発電, 遺伝子操作, etc.

金融市場のオプション取引では、negative skewedであろうとpositive skewedであろうと、left-tailはどこかでキャップされている。DOTMのプット売りであれば、最悪のケース: 株価がゼロになった場合のstrike priceが最大支払い金額だ。最初に受け取ったプレミアムの何百倍もの支払いが発生するから問題となるだけで、最大ロス金額は確かに有限で存在し、高次モーメントも有限である。問題はレバレッジの間違いであって、Kelly Criterionから最大投資金額自体は算出できる。

しかし金融市場に限定されない人類全体の賭けについては、高次モーメントがおそらく発散しているものが存在する。筆者が最近おそろしいと感じていることは、そのような賭けを行う場合に知っておかなければならないことの多くを、一流とされる科学者が理解していないように見受けられるばかりか、懸念を正しく表明している人たちを非科学的とレッテル貼りしたりするケースさえ見られることだ。最終章の執筆意図は、これらの研究者にモーメントが発散している場合の複利投資の不毛性について数理的に理解してもらい、自らの主張や研究の方向性を再考する機会をもってもらうことである。

具体例の前に、高次モーメントが発散する確率分布を持ってきて、Kelly Criterionによる投資可能水準がどうなるか見てみよう。単純な例で使えるのはスチューデントのt分布である。この確率分布は左右対象であるため広い意味でのskewnessはゼロだが、自由度が裾野がべき乗減衰し、分散が有限であるためには自由度\nu\nu > 2でなければいけないし、3次モーメントが有限であるためには\nu > 3が要求される。

ここで、PnLが掛け金に対して期待値+50%で、誤差項がスチューデントt分布に従う賭けを考えてみよう。期待値はプラスで存在するものの、自由度\nuの値に応じて高次モーメントが発散する。\nu \to \infty (正規分布に一致する)、\nu = 1.5 (分散が無限大)、\nu = 3 (分散は存在するが3次以上のモーメントが発散)、\nu = 5 (分散・歪度・尖度は存在するが5次以上のモーメントが発散) の4種類を考えてみる。正規分布のケースは分散が1なので シャープ・レシオ0.5の賭けである。自由度が無限大ではないケースでは、対称性ゆえに、想定外のロスが発生するleft-tail riskだけでなく、right-tail riskつまり想定外の嬉しいリターンも発生する可能性がある。金融取引との違いは、left-tail riskの最大値が決まっていない点である。確率的には掛け金を全額失いさらに余計に-100% (つまり-200%のloss), -200% … と失う可能性がどれだけ低い値であってもわずかながらに存在する。

このリスク資産に対する投資を行い、複利による資産増大を行う場合の投資可能最大割合はどれだけだろうか。実は、最大ロスが確定していないケースでは正確なKelly Criterionに用いられる積分が定義できない。そこで妥協策として、下側確率\delta/2, 上側確率1-\delta/2 で確率分布をtruncateし、50\delta-percentileから(100-50\delta)-percentileの区間積分をモンテカルロ法で評価してみよう。このtruncationは積分を有限にしてある種の最適投資水準の算出を可能にする。しかしtruncationが必須であることの本質的な意味は、十分に長い時間がたった場合には我々はruinを避けられないということである(詳細な議論は [7] にある)。\deltaの選定は、たとえば太陽が赤色巨星になって地球を呑み込むまでの残り時間(億年の単位である)とか、地球温暖化がこのまま進んでしまい地球が人間の住めない場所になる残り時間(100年あるかどうかさえ危惧されている)などから設定せざるを得ない。

実際にスチューデントのt分布からサンプルサイズ n の乱数を発生させつつ、下側と上側のtail samplesを除外した経験分布に対するKelly Criterion上の最適投資水準\alpha_nを計算する。そしてサンプルサイズ nを増やしていくと\alpha_nがどのような値に収束していくか (つまり真の\alphaが何か) 観察してみよう。\delta=0.0005を今回は採用する。簡単なpythonコードは以下の通りである。手元環境のメモリ上限の関係で 100種類の異なるブートストラップ標本 (ただし経験分布からではなく既知の真の分布からの標本だが)を生成して平均している。n100\times 10^2 (1万)から100\times 10^6 (1億)まで変化させている。そして計算された、収束状況を示したグラフが図1である。

import numpy as np
from scipy.optimize import minimize_scalar
from sklearn.utils import check_random_state
import matplotlib.pyplot as plt
from matplotlib.backends.backend_pdf import PdfPages
from collections import OrderedDict
import os

def kelly(y):
    lg = lambda x: -np.log1p(x * y).mean()
    res = minimize_scalar(
        lg,
        bounds=(0.0, 1.0 if np.min(y)>=-1.0 else -1.0 / np.min(y)),
        method='bounded'
    )
    return res.x

seed=5678
n_replicates=100
delta=0.0005
key2n_vs_alpha = OrderedDict()
for key, df in [
    ('Gaussian', np.inf),
    ('Student t: nu=1.5', 1.5),
    ('Student t: nu=3', 3.0),
    ('Student t: nu=5', 5.0)]:
    n_vs_alpha = []
    for n in np.logspace(2, 6, 9, dtype=np.int64):  # n=100 to 10^6
        random_state = check_random_state(seed)
        alpha_n = 0.0
        for _ in xrange(n_replicates):
            y_n = random_state.normal(loc=0.5, size=n) if np.isinf(df) \
                else (0.5 + random_state.standard_t(df=df, size=n))
            left_cap = np.percentile(y_n, 100.0 * delta)
right_cap = np.percentile(y_n, 100.0 * (1.0 - delta))
            truncated_y_n = y_n[np.logical_and(y_n > left_cap, y_n < right_cap)]
            alpha_n += kelly(truncated_y_n)
        alpha_n /= n_replicates
        n_vs_alpha.append([n*n_replicates, alpha_n])
    key2n_vs_alpha[key] = np.array(n_vs_alpha)

plt.rc('font', size=14)
with PdfPages(os.path.expanduser('~/student_kelly.pdf')) as pdf:
    plt.figure(figsize=(9, 5))
    plt.xscale('log')
    for key, n_vs_alpha in key2n_vs_alpha.iteritems():
        plt.plot(n_vs_alpha[:, 0], n_vs_alpha[:, 1], label=key)
    plt.title('Maximally-Allowed Investment by Kelly Criterion')
    plt.xlabel('Sample Size')
    plt.ylabel('Weight in Portfolio')
    ax = plt.subplot(111)
    ax.set_ylim([0, 0.65])
    box = ax.get_position()
    ax.set_position([box.x0, box.y0 + box.height * 0.1, box.width, box.height * 0.9])
    ax.legend(
        loc='upper center',
        bbox_to_anchor=(0.5, 0.975),
        fancybox=True,
shadow=True,
        ncol=2,
        fontsize=12
    )
    pdf.savefig()
    plt.close()

student_kelly

図1. PnLがスチューデントのt分布に従う場合の最大投資可能割合

図1の実験結果をみるかぎり、サンプルサイズが10^6以降の値はどの自由度でもほぼ収束値になっていると言えよう。しかしこれは\delta>0を設定したおかげである。\delta=0の場合の正確なKelly解はexactにゼロである。自由度が大きく裾野が浅くなるほど収束速度自体は遅くなるが、対数効用関数の性質上、ある特定のモーメントが発散しているだけで、どんなに\alphaを小さくしてもruin (たった一回のロスで破産して債務超過になること)を回避することができない。また分散が無限大の\nu=1.5のケースは他の場合に比べてとても低い金額しか賭けられないことが図1からよくわかる。

これら t分布のPnLに対する賭けは、一回あたり定額である限りは期待値に収束させられる。しかし定率での賭けは、十分に長い時間がたった場合はどんなに小さい金額を投資していても破産という結末しか待っていないわけだ。なんと不毛なペイオフだろうか。発散している高次モーメントと複利の組み合わせは、期待値がプラスなら賭けないのは不合理だとのたまう一部の有識者の意見を完全に葬り去ってしまう。モーメントが発散している場合の賭けは我々はruinでいずれ死ぬことをむなしくも受け入れた上で、そのruinの発生時刻を出来るだけ未来に設定した中での投資しかできないのである。唯一の救いは、我々の住む太陽系には元々決まっている死亡時刻がある点で、それより長い時間に該当する切断水準 \deltaは考えても無駄という点である。

さて、実際に高次モーメントが発散していると筆者が考えている投資の代表例は原子力発電と遺伝子工学である。期待値が本当にプラスなのかどうかも若干の懸念はあるのだが、ひとまず原子力発電も1次モーメントは発散せずプラスであると仮定しよう。時々起こる大損害や放射性廃棄物の処理を差し引いても、安定して供給される電力や二酸化炭素を排出せず、気候変動阻止に役立つ性質はトータルで見ればプラスと考えることが一応できる。同様に遺伝子工学も、農業生産性の劇的な改善を通して本来は飢えていたはずの人々に食料が行き渡るならば、生物多様性上のリスクに見合うだけのリターンがあると仮定しよう。

  • 原子力の方で一応と書いているのは、1次のモーメントが有限であることを示すにはleft-tailのべき指数がある範囲に収まる必要があり、これまでの観測を通じて真のleft-tailのべき係数が測定され、そのconfidence intervalが望ましい範囲に収まっていたのか筆者が疑問に思っているためだ
  • 遺伝子操作の方も、飢餓問題の本当の要因は農業生産力の不足ではなくて先進国の農家への補助金や独裁者による横領といった経済システムの欠陥の方だが、その本質的議論もここでは遺伝子工学研究者側に譲歩して不本意ながら目をつぶることとしよう


最底辺の10億人

しかしこれら二つの賭けは、それら単独ではまず間違いなく、left-tailが分厚いnegative skewedなものである。原子力による電力供給の増加は多くの場合に少しの便益を提供するが、莫大なアップサイドとは言い難い。遺伝子操作も食料生産性は上がるだろうが、嗜好品を求める富裕層はそもそも遺伝子組み換え食品は買いたがらない。人間の遺伝子を直接書き換えるというならパーフェクトベイビーを欲しがる人々(これらの近視眼的な人々がまた別の大災害の源となる)に魅力的なアップサイドを提供するかもしれないが、みなが殺到して似たような遺伝子を欲しがることで多様性欠如が発生し、人類全体自体は存亡の危機に瀕するだろう。

遺伝子操作に関する懸念は何も筆者個人のものでなく、投資リスクの評価に関心がある研究者の間では広く共有されているものだと思う。著書「ブラック・スワン」で同じみのNassim Nicholas Talebや、彼のビジネスパートナーであるヘッジファンド・マネジャーのMark SpitznagelはGMOの欠陥に関する極めて強い懸念を表明しているので、ぜひ読んでみてほしい。ジャガイモに過度に依存したことで起きたアイルランドの飢饉など、生物多様性の破壊は過去にも大惨事を起こしている。

Another ‘Too Big to Fail’ System in G.M.O.s

筆者もジーン・ターゲッティングなどの遺伝子操作プロセスが具体的にどうなっているかは知らないので、あくまで結果のペイオフから利便性と危険性を判断することしかできない。もしGMOにおいて遺伝子配列の特定部分を置き換える作業が、実質的にはコンピューター・プログラムのマシンコードを直接バイナリエディタで編集するかのような処理と等価であるなら、SpitznagelやTalebが懸念する見方は実際のところ正当だと思う。生物学的に離れた種の配列を一部直接組み込むことを可能にする編集プロセスは、自然交配や放射線をぶつけることで遺伝子に影響を与えてきた伝統農業とは最適化における動力学が大きく異なっている。

伝統農業における品種改良は、高次元の遺伝子表現状態空間において放射線や生物本来の突然変異による撹乱を導入することで近傍への移動をはかるものである。他の近傍への移動後、種が人類にとって都合のよい方向に変化したならば採択し、そうでなければ廃棄する。ここで重要なことは、状態空間上の任意の領域が生物として存続可能なわけではない点だ。近傍移動を繰り返していくが、生物として存続ができず死亡してしまう崖が存在する。最後に選択される種はときどきこの崖への墜落を経験しながら、あくまで初期状態から連続的に到達可能な範囲にとどまっている

しかし遺伝子を直接編集して、他の種から見つけた遺伝子を埋め込む方法を用いると、状態空間上でのleapが起きる恐ろしいのはこのleapのノルムが大きいときだ。本来、人類を滅ぼしかねないようなキメラの発生を防いでいたはずのinfeasible領域、最適空間上の崖を飛び越えた、種として存続可能だが既存の全ての生物全体にとって最強の敵となる未知生物の生産に加担してしまうかもしれない。このようなleapは、simulated annealingのように、多峰性のある目的関数を最適化する際には助けになり得るが、生物種の操作の場合はleapこそが悪夢のトリガーになる気がしている。そもそも人類は遺伝子表現とそれに対する効用関数値の全空間をカバーしたサンプルを持っていないからだ。遺伝子操作をしている研究者は特定の塩基対に特定の生物機能があり、二つの塩基を持って入ればそれぞれの機能が生物に備わる、というような線形の対応関係を直感的に描いているように思われる。その切り取った塩基と別の塩基の共起が特定機能の発言に関係しており、しかもその発現が潜伏するような性質を持っていたら?

機械学習のモデルを解釈するときの留意事項を思い出して欲しいのだが、線形モデルが非線形モデルより予測能力が良かったとしてもそれは真のデータ生成メカニズムが線形であることを全く意味しない。線形モデルが非線形モデルよりも推定時のvarianceが小さく、与えられたサンプルサイズのもとではbias-variance trade-offの関係上variance reductionのメリットがbias reductionのメリットに勝ったというだけである。もしデータ生成プロセスが寸分の狂いもなく線形であると主張するためには、線形モデルと非線形モデルとでbiasが同一であるという実験を膨大なモンテカルロサンプルを生成して確認しなければいけない。たとえば特徴選択の文献だが、[8]に記載されているようなバイアス同一確認プロセスが遺伝子工学の文脈で必要になる (論文には、ある関数近似器のbias^2+noiseとvarianceの具体値がどうなっているかcross-validationを用いて推定する方法が記載されている)。だが計算機の中の、モンテカルロ法による数百万bootstrapサンプルに頼れるピュアなデータドリブン世界と違い、遺伝子操作の実世界でこのような莫大なbootstrapサンプル生成ができるのかも筆者には疑問である。

GMOのモンサント社も、遺伝子を直接書き換えるのではなくて交配メカニズムに介入するタイプのアプローチを最近開発したようだ。こちらのアプローチの方がまだleft-tail riskが低いように筆者の目には移っている。近傍探索の一種だからである。

遺伝子組み換え作物の巨人、モンサントが取り組む「昔ながらの品種改良」

では原子力発電への投資も遺伝子工学への投資も極めて否定的結論しかないのだろうか? 筆者もいろいろ考えてみたが、いまのところの結論は「市民の生活の屋台骨を預けるような基幹システムへの採用には反対だが、原子力開発や遺伝子改良技術開発には賛同」としか言えない。まず上記のモーメント発散議論により(発散しないと主張する研究者がいるなら、彼はこれらの技術のleft-tailが完全にキャップされることを証明する必要があり、おそらくそれは不可能だ)、人口増大にあわせた複利投資にこれらの技術はいまのところ向いていない。

だがこれらのleft-heavy-tailedな技術を利用停止したとしても、人類は気候変動という別の存続脅威を抱えており、こちらを放置してもいずれ我々はruinで倒れるだろう。人類の工学的失敗によるruinと、不可逆な気候変動によるruinと、どちらのruinが先に来るかの有限時間勝負の中でしかポートフォリオを最適化できない。上記のシミュレーションでtruncationを導入しながら、「実は我々にはあまり時間は残されておらず、全てのtail riskをキャップすること自体が贅沢で達成不可能な目標なのだろう」という諦念感が筆者を襲ったのも事実である。

気候変動危機の回避には化石燃料の大幅な撲滅が必須になっており、発電所における化石燃料利用の削減と、自動車の電気自動車への置換・それに伴って増える電力需要に対処できる電力源は必須である。太陽光や風力などのrenewableは実効コストがすでに原子力より安くなっているものの、原子力も依然として一つの対処技術候補である。あるいは同じく原子力を利用するが、損失がどこかでキャップされるような新しい発電方式が開発され、今までDOTMのネイキッド・プット売りだったポジションをブル・プット・スプレッドに変える新技術が開発されるかもしれない。

  • なお近年のrenewable energyのコスト下落には筆者もうれしく驚かされた。安くなったrenewableのおかげで、インドでは石炭火力を、それより安いrenewableにいかに早く置き換えるか競争が行われている
    Disclosure: 筆者の個人ポートフォリオにはインドのある電力会社株が組まれている

遺伝子工学も、たとえば深海の熱水孔にいるような嫌気性細菌を改良するなどして、気候変動阻止装置の開発に大きく貢献できるかもしれない。比較的長く研究されてきたものとしては、たとえばExxonMobil社は藻に石油を吐き出させるカーボンニュートラルな algae biofuel を生産するため、強力な光を浴びても死なずにそれに比例して石油を吐き出すような遺伝子操作された特殊な藻を開発してきた。このプロジェクトはヒトゲノム計画で著名なクレイグ・ベンター博士の創業したSynthetic Genomics, Inc.がExxonMobilから投資されて始まったもので、2009年にニュースをはじめて聞いたときはこれこそが本当に意味ある遺伝子工学の利用だと思ったものである。たまたま最近のツイートで進捗を拝見したが、プロジェクトは継続しており2017年には彼らが言うところのブレイクスルーがあったようだ。Nature Biotechnologyにpublishされているそうなので筆者も読んでみようかと思う。

 

Craig’s twist (こちらは2009年に話題になったThe Economistの記事である)


チェンジング・ブルー-気候変動の謎に迫る (岩波現代文庫)

こればかりはどのツールが決定打になるか、まだ人類が観測していない側のpositiveなright tailに賭けてみるしかない。Left-tailも存在するがright tailもある「かもしれない」。Ruinが回避不能ならむしろその諦めをもとにleft tail-eventが発生する前にright tail-eventが発生する可能性に賭けることも非合理的ではない。

だがその場合においても二流ギャンブラーがご法度である一連の議論により、賭けることのできる資産は極めて限定されるべきである。そういったあたりを勘案し、研究開発としての将来性に賭けて小さいがレバレッジの効いたポジションを取りつつ、negative skewness, left-tail riskを無視した、最大投資可能金額を超えた賭けによって大勢の市民を危険にさらす運用には反対する。やるなら複利で再投資はせず定額で:つまり人口が増えてもそれに比例して規模を拡大しないこと、というあたりに筆者のいまの意見は落ち着きつつある。

  • ただこれでも実務上は困難がともなう。巨大な損失発生がありうるにも関わらず、定額で賭け続けると、例えばこんなことがおきる: 資産の1000%を失う大災害が発生したとしよう。その次も定額で賭けるということは、どこからかその失った資産1000%を丸々持ってきて補填し、巨大な借金を追いつつ運営することを意味する。単なるお金ではなく物理的インフラの場合にはそれが何を意味するか想像してほしい – たとえば荒廃した工場に巨額のお金を投下してそれらを全部復旧し災害前の元の規模と同レベルのオペレーションを動かすことになる
  • そのため定額で賭ける戦略は、損失を受けた時点で割合としてはむしろ投資額を増やしリスクテイクする性質を持っている。複利で賭ける場合は資産減額に応じて自然とリスクも減らすのとは対照的である。大損害のあとに大リスクを取るというのは実際上、また政治的にも困難な場合が多いのではないかと思う

正直なところ、筆者は原子力工学にも遺伝子工学にもメカニズム上・物理的な知識がないので具体的プロセスについては的外れなことしか言えていない。しかし同時にこれらの分野の専門家はtail riskへの本当の正しい対処法について金融の世界で培われてきた成果を真摯に吸収すべきだと考えている。筆者がしばしば驚くのは、統計学や物理学のPhDホルダーの中にモーメントが発散するという現象の本質が何なのかを全く理解していない人物がそれなりにいることだ。多くの物理現象・自然現象にはべき乗則・フラクタル性がともない、彼らにとっては解析経験が深い対象であるにも関わらず。一般市民に対して、科学的プロセスと自らの研究成果の正当性を啓蒙したいなら、彼らはこの自らの欠点を急いで補強する必要がある。期待値がプラスである限りは大きく投資しろなどという妄言は慎まなければならない。Positive skewedな賭けなら失敗してもまだ二流ギャンブラーとして笑い話で住むが、negative skewedな場合の帰結はfatalだ。人類は存続不可能な賭けは実行できないのであり、存続を前提とする限り複利の賭けの性質は必ず考慮しなければいけないのである。モーメントが有限でない賭けに人類はすでに巻き込まれてしまったためにこの存続も100%の存続と言えないのが残念ではあるが。

結論

今回はskewnessが複利前提の投資にもたらす影響に関する分析方法を紹介した。日本人労働者に蔓延するnegative skewedペイオフがもたらす無気力の問題と、その処方箋としてのコールオプション付与を説き、また従業員個人も金銭だけでものごとを考えず隠されたスキル・コールオプションの探索を自ずから行うべきだと説いた。国家がプットオプションを提供してくれることで一般市民がリスクテイクしすぎてしまう福祉国家の例と、プットセラーたちも弱い立場の人にきちんと保険を提供する大事な社会的役割を担っており、コール買いとプット売りそれ自体に何らかの優劣があるわけではないことを補足した。最後に、高次モーメントが発散する場合には複利投資が不可能(truncationなしの厳密解においては最大投資可能金額がexactにゼロ)であることを示し、期待値プラスであることのみを持ってleft-tail riskの大きな投資を過剰に行うことの危険性を警鐘しつつ、truncationを妥協・覚悟して受け入れることで一定の投資価値を見出した。またleft-tailed risk投資の要素技術の中には人類を将来救うright-tailの希望があるかもしれないことも論じた。筆者個人はpositive skewnessを好みnegative skewnessを嫌うバイアスを明確に持っているし、ブログ自体も中立性そのものを目的とはしていないが、なるべく双方の判断材料が提供された構成にはなったかと思う。サラリーマン、経営者、left-tail riskを伴う研究開発に携わる人々のいずれにも刺激になれば幸いである。

References

遅い社会と早い個人のLearning to Learn

人工知能による失業増大はよく議論されるが、その実態と個人レベルでできる対策について掘り下げてみたい。書き下してみたら非常に長くなってしまったので分けようかとも思ったのだが、これらのトピックが一連でつながっていることを強調したかったため、あえて一投稿とすることにした。後日分割して同内容を再投稿するかもしれない。

AIにより失業する可能性の高い職業と、逆に需要の増える職業について議論した論文が2013年に発表されて話題になった [1]。その著者の一人であるMichael A. Osborne教授は、オックスフォード大学において著者と同じ建物に勤務している。紅茶を常にloose leafで丁寧に入れる穏やかな方だ。どこまで論文の予想を信じるべきかについて、Gaussian Process (GP)を使ったこの論文のメソドロジーを聞いたりもしたのだが、最近正式なジャーナル論文になっていたので最新版をReferenceに載せておいた。

  • 著者が個人的に思う彼の論文の良いところは、予測だけでなくその予測がまちがっている可能性のある不確実性についても評価しているところである: GPの強みだ

論文の中身には立ち入らないが、内輪のワークショップで彼が楽観的にコメントしていたことを強調しておく。AIにより失業する職種はたくさんあるが、人の心や日常生活に寄り添う仕事といったカテゴリーの中に増える仕事もたくさんある。若い世代にとっては、単に親の職業と類似した職業を選ぶという愚を犯さなければ良いだけのことで、自分の興味を持ったことがらを突き詰めて楽しんで学んで行ってほしいとのことだ。我々の世代が職業選択/キャリア構築の際に採択していた規範は、メタレベルでは未来でも有効なのである。

  • もし著者があえて批判的に見るなら、論文内の予測が外れる可能性が高いのは芸術家に関する楽観部分だろうか。ただ具体的予測の一部が期待値がずれるのは確率的予測の宿命なので、これは批判ですらない。そしてこれはOsborne教授の意見ではなくて、学習データとなったアンケートに答えた人たちがそのような考えを持っているというだけである
  • 芸術的才能をもった人たちの需要は増えると答えた人が多かったが、たとえばAlgorithmic Compositionの今日の発展 (実はこれは不連続な変化ではなくてXenakisなりDavid Copeらから脈々と続いてきた活動であるし、12音技法の開拓以降はある種必然であった)を見るに、AIがある程度の創造性を提供していることを忘れてはいけない
  • この「ある程度の」創造性は、他の過去の芸術家の様式模倣という、Recurrent Neural Network / Convolutional Neural Network等が得意なものもあれば、
  • 過去の様式上今まで聴いたことがないが、生成されたものが芸術的に高い価値を認めうるという様式レベルの汎化能力を獲得するものまで幅がある
  • どちらの場合も作曲家にとっては職業上の脅威になりえる。一方で、作曲家もAIに教えてもらいながら独自の作品を創ることで、人間の創造性が拡大される可能性も高い
  • 囲碁AIの生んだ新しい戦略によって人間棋士が学びやすくなっている現象と似ている


Algorithmic Composition

さて、著者が今日議論したいことは、本当の脅威はAIそのものなのだろうか? AIが脅威とリンクしやすい今日の社会構造の方ではないか? という問いである。どちらが真実なのかという答えは著者個人は持っていない。しかし最近、後者の考えをいくつか発展させてみたので、読者諸賢のキャリア上の参考として、書き下したいと思う。

今日の要旨

  • すべては新環境に適応する速度の問題である
  • 速度をゆるめる政治的圧力をかけるか、個人が学習速度を速めるか、選ぶ必要がある
  • 一般的には、社会変化速度を出来るだけ抑えつつ、個人の学習速度を最大化するのが良い
  • ただしAIに関しては社会が低速に進むことを期待できない
  • 個人にとっての学習速度を最大化するために、「学び方について学ぼう」
  • 安心せよ。次第に学習速度が加速し、経験ある人は初学者より早く学べるようになる

予測できる人 / 早く学習する人

優れた起業家は自分の作り上げたビジネスを、他社にdisruptされる前に自分自身でdisruptできる。Amazon.comが紙の本で確固たるビジネスを作り上げた後にKindleで書籍部門の利益を少なくとも最初は容赦なく食べていったのは良い例である。真実かどうかはしらないが、Jeff Bezos氏は電子書籍の担当者にお前たちの使命は紙の書籍部署の連中を首にすることだ、とハッパをかけるという噂もある。このような自己否定的傾向は、Christensen教授による有名な「イノベーションのジレンマ」を避けるために不可欠である。

起業家レベルまでいかなくても、柔軟な思考回路を持った労働者はうまく担当事業を変えて行く。例えAIによって自らの現在のビジネスがdisruptされる日が来るとしても、その審判の日が訪れるまでにはタイムラグがある。彼らはこのラグ期間に新しい分野を学び、Nextビジネスを見つけ出す。専門領域の滑らかなシフト・拡大を測っている人たちは、時間とともに変わるビジネスフィールドのどこにおいても充実した人生を送っている。

  • 著者が、撤退オプションを残しつつも、マーケティング・広告領域からファイナンス・投資領域に移ってきたのもこれと関係がある

さらに話は起業家・労働者にすら限らない。政府レベルでこの思考が徹底している国もあるのだ。代表的なのはスウェーデンである。衰退産業と新産業との間における労働力配分最適化という課題において、スウェーデン政府は衰退産業を切り捨てることに躊躇がない。有名な例はVOLVOとSAABからの救済申請却下である。スウェーデン政府は過去に船舶事業会社を救済した結果、長期間低成長率に苦しむという痛い目にあった。過去の失敗から学んだ彼らは、ゾンビ企業を容赦なく切り捨てる方針を採用した。しかし同時に、福祉国家が長年提供してきた社会安定の維持に腐心した彼らは、代わりに包括的な職業訓練プログラムを提供し、労働者に新しい産業への適応時間を与えた。著者が見る限り、この方法論は福祉の源泉となる経済利潤の確保と社会不安の回避という二つのバランスをとる上で、現実解の中での理想に近い。

  • ムチ (厳しい市場競争) とアメ(福祉予算による訓練プログラム)のうまい組み合わせである
  • もちろん、ターゲット先の産業を間違えたらどうするんだ、職業訓練プログラムで本当に現在ではなく未来役立つスキルがつくのかという詳細点は議論がある
  • しかし自動車工が3年訓練でバイオマス発電技術者として転職したケースなどを見るに、
  • 単にレッセフェールで失業者放置 or パターナリズムでゾンビを延命するよりは実践的にworkしているとは言えるだろう

スウェーデン・パラドックス

さて、このような機動的なシフトができる起業家・労働者・国家とそうでないところとの間にはどのような差があるのだろうか。確実に忘れてはならないことは、タイムラグを利用したシフトには当然のことながら期限があるということである。この期限内のシフトを成功させるようなメソドロジーが、社会のどの意思決定階層においても必要である。ゆえにどうやったら早くシフトできるんだ? というのが真の問いであるべきだ。加えて、シフト先を間違える(起業家の場合は参入市場の選定、職業訓練の場合はターゲット産業)と巨大な損失につながるので、少なくともランダムよりはましな確度で次に伸びる場所を創る or 特定する必要があるように思える。しかしながらもう少し考えると、後者は実は優先順位としては2番目で、早いシフトさえ達成すれば細かいことは忘れてよいことに気づく。

  • 最優先である早く学習する能力が身についていれば、選定を間違えて失敗してもまたquickに別のことにtryすれば良いだけだからだ
  • また社会的な未来予測というものは、過去にてんで間違って予言ばかり提供してきた。そういった不確実性の高すぎる予測を信頼して行動するのは理にかなっていない

本当の脅威はAIではなくてhyper-connectivityかもしれない

なぜAIによる失業が、過去の技術革新による失業よりも深刻に捉えられているのか、読者諸賢はどう受け止められているだろうか。ITはあらゆる事務職員を危機に陥れた。インターネットは小売業や証券会社を危機に陥れた。こういった過去の創造的破壊と、AIによる創造的破壊は何が違うのだろうか。

一つの答えは、機械学習および強化学習 / 一般的な最適化アルゴリズムを学んでいるとはっきりわかるが、AIの適用範囲・役立つ範囲が広すぎるためである。Amazon.comが出てきたとき既存書店は彼らの存在をある程度認識していただろうが、家電量販店は書店ほどには当初脅威とは思っていなかったのではないだろうか。しかし書店で橋頭堡を作ったAmazon.comは全てのRetailerの脅威に変わった。想像していなかったところからやってきたダークホースが自らのビジネスを脅かす、というのが広範囲に使える技術がもたらす社会現象である。そして弱いAIにせよ、AGIにせよ、AIはこのような性質を広く持っている。ロンドンの変わったスタートアップ (注: Googleに買収される前のDeepMind社のことだ) がATARIのビデオゲームを自動で解くおもちゃを作っていたと思ったら、その背後にある技術がいつのまにか銀行家にとっての脅威になっていた、というようなことだ。脅威が 迫ってくるまでの時間が以前より短くなっているため、人間側の準備が間に合わなくなっているのである。

通常はローカルコミュニティに閉じているはずのクラスター化された社会ネットワーク構造において、その汎用性の高さゆえにクラスター境界を想定外の高速度で超える技術がいくつかある。機械学習に基づいたAIはその波及速度が人類の歴史において最速にあたるだろう。古いエキスパートシステムには人間が予測器を設計することに由来する顕著なボトルネックがあったが、機械学習はこのボトルネックをはるかに減らしてきた。

そしてネットワーク化された経済ではwinner-take-all効果が高まる。世界最低の調達コストを実現した一部の企業が全ての利潤を独占したりする。以前紹介したバリュー投資の分析で、グローバル企業によるwinner-take-all現象を逃れて生き残る数少ないローカル優良企業は、砂利運搬業のように物理的に重いモノを仲介していたことを思い出そう。物理的な制限のないアイデア: 例えばアルゴリズム上のイノベーションは物理的なものよりも早く普及し、その利得分布におけるheavy-tail性を強める。一部の強い人だけに富が集中してしまうのである。


千年投資の公理 ──売られ過ぎの優良企業を買う

一つの技術変化が急速に全てのノードに影響するような社会システムは、hyper-connectedネットワークであると言えるだろう。グローバリゼーション・IT化で準備されていたhyper-connectivityに対してAIという燃料が投下されたわけである。

さて、hyper-connectivityによるダークホースの脅威にいつも晒される社会では、守る側の立場は何が自分の脅威になるのかを絶えず監視していないといけない。そのためには、自分にとって馴染みのなかった新技術が自分のビジネス領域をどう変えてしまうのか、優れた仮説立案能力が必要である。AIに限らず、自分のビジネスと新技術の組み合わせによる正/負の影響を客観的に考えるだけの頭脳が必須となるが、技術的詳細に立ち入らずにこれを行うのはほとんどの人にとっては困難であろう。確実な方法は技術的詳細も含めて学ぶことである。その結果、端的にいって複数の新しい技術を早く学べない人は仕事がなくなるのである。

新技術の恩恵を広く行き渡らせつつも、hyper-connectivityに由来する脅威を緩和するにはどうすべきか。一部の人が解だと思っているが実際にはworkしないアプローチが1つあり、現実解は2種類あると著者は考えている。変化を拒絶するという態度はWorkしない。何故なら自社が新技術の採択に臆病になっていても、外国の競合他社は非常に積極的であることが大半だからである。変化を拒絶するのはその経営者の勝手だが、遠からぬうちにその企業が倒れるだけだ。では現実解の2つは何かというと、1つ目は普及速度を社会的にゆるめることで、2つ目は個人が普及速度に追いつけるよう早く学習することだ。それぞれの方法の利点や可能性については歴史が教えてくれるので、分けて議論しよう。

1. 普及速度を緩める: 過渡状態の重要性

実はhyper-connectivityはインターネットに限ったものではない。グローバリゼーションと金融自由化という過去の波はいくつもの教訓を提供しているのでそちらを紹介しよう。

社会が状態Aから状態Bに移行するとき、たとえ状態Bの方が長い目でみれば望ましいものであったとしても、AからBへの移行速度が早すぎると多くの問題が生じる。これを顕著に見せたのが1997年のアジア通貨危機やソビエト崩壊後のロシアにおける急速な民営化であった。保護主義や統制経済から自由主義市場経済への移行が最終的に望ましいとしても、急激な自由化は急にやってきてバブルを引き起こし急速に引き上げるたぐいの国際金融資本を惹きつけてしまう。マレーシアで当時のマハティール首相が採用した一見不合理な資本統制が、過渡期を上手に乗り切るという観点ではタイやインドネシアよりも賢かったことは今ならわかるだろう。だからといってマレーシアは別に外資の参入をずっと拒絶し続けているわけではないし、資本主義国としての道をきちんと歩んでいる。理想状態だけではなくそこに至るための過渡的なパスを熟考すのが大事なのだ。Amazon.comが最終的にはなんでも売るつもりであっても、最初は書籍からスタートしたのと同様である。


世界を不幸にしたグローバリズムの正体

この過渡期の設計を間違えると、長期間たった後でさえ目標未達の貧しい状況になりかねない。たとえばチリのピノチェト政権時に行われたような、南米で行われた急速な右派的自由化は大資本の支配を通じて反米的反発の拡大をもたらしてしまった。今でも南米では共産主義がworkすると信じる層が残っているようである。資本主義が、急速な格差拡大でなく多くの広くの層への恩恵につながるという実感を、少なくとも西ヨーロッパや東アジアと同レベルで南米市民が享受していたならば、ポピュリズム由来の誤った信仰は今日の南米のようには強くなかったはずである。ボリビアやベネズエラは誤った信念によって悲劇的な失敗の道を辿った。

  • 著者の個人的考えでは、亡くなったウゴ・チャベス元大統領は、少なくとも経団連のクーデターから救い出されて大統領に戻ったころはそれなりの高い理想を持っていたと思う
  • 彼は別に資本主義のシステムに詳しい経済畑の人間ではなく軍人であって、石油利権の恩恵に預かれない貧困層を救済する方法だったら何でもよかったのではないか
  • しかし制限のない自由化と隣り合わせの外国オイルメジャーとの利権闘争においては、社会主義に走る以外の選択肢は、少なくとも彼の頭脳では無理だったのであろう
  • そして絶対的な権力は絶対的に腐敗する。憲法を改正して禁止されていた3選を可能にした時点でベネズエラの暗黒未来は決まっていたようなものだ
  • そして彼の死後、同様に経済に疎いことに加えて、チャベスよりもさらに強権的で人望に劣る今のマドゥロ大統領になってはお察しの通りである


The Open Society and Its Enemies : the spell of Plato (Routledge Classics)

逆に速度やタイミングに慎重であったことで大きな恩恵がもたらされた例もある。政治の世界で著者が思い当たるのは、南アフリカ共和国のフレデリック・デクラーク元大統領である。アパルトヘイト推進側からキャリアをスタートした彼は、ある時期からアパルトヘイトの廃止に関心があったようであるが、ネルソン・マンデラへの歩み寄りというアクションを起こすためにソ連の弱体化を待った。これはマンデラ率いるANCがソ連との協力関係があることで、ANCとの和解が共産化を引き起こす恐れがあったためである。マンデラは当時はアメリカ合衆国からテロリスト認定されていた。

  • このあたりの経緯は著者も思春期に目の当たりにしたことを思い出しつつ、後日の解説をあやふやに理解しているだけである
  • もっと興味のある方は自分で調べてみていただきたい。著者にとっては、たとえばこちらの解説は包括的で学びになった。

マルタ会談からたった10日後にマンデラに接触を図ったデクラーク大統領に、著者はただひたすら感銘を受けざるを得ない。明らかにこれは周到に機が熟するのをまった結果であり、かつ条件が満たされたならば電光石火で動くべきであるという、手本の中の手本を示している。

デクラーク大統領がソ連の弱体化を待ったように、マクロな経済政策レベルでは最終状態までの遷移をわざと遅くすることで社会的な恩恵が増えることが多々ある。議論は次回とするが、待つ戦略は中国の老子の「無為」などにも見られて孫子につながっているほか、数理モデルのレベルでも過渡状態の分析は多くのインプリケーションを生む。ピノチェト大統領の背後にいたフリードマンやルーカスたちが、均衡への着目だけでなく過渡状態のダイナミクスにもっと気を使っていたならば、ピノチェトの評価も違っていたかもしれない。

一部の読者諸賢は、ここで議論した遅い行動の利点は、政治家レベルの社会的意思決定において発生していることに気づいているだろう。そしてAIの普及におけるインプリケーションを取り出そうとしたときには、過去の成功例の背後にあった前提条件を理解しなければいけない。マハティール首相やデクラーク大統領の英断は、自国だけが遅い変化を選択し他国がもっと高速な変化を選択したという短期的不利状況が、長期間の損失にはつながらなかったために成功した。デクラーク氏の場合、そもそも南アの白人社会が国際社会からの制裁を受け続ける覚悟をもっていたということで、経済ダメージはあっても政治資本が残ったという背景もある。

AIの急速な普及はグローバルな法人税値下げ競争と似ている。自分たちだけ抜け駆けして値下げするタックスヘイブン国家がいる限り、妥協してどの国家も下げて税収を圧迫せざるを得ない構造が原理的に存在する。同様に、失業による社会不安を危惧した政府が規制によってAIのより緩やかな浸透を考えたとしても、他国のもっと優れた企業がそれぞれの産業領域でAIの急速な活用により独占状態にいたるリスクを排除できない。政府がよほど愚か者でない限りは、AIの活用はビジネスパーソンのみなさん他社に負けず頑張ってくださいとしか言えないのだ。

  • それでも強引に規制をかけると、おそらくは過去に強い金融規制と不透明なコーポレート・ガバナンスを嫌って東京から香港やシンガポールに金融機関のアジア拠点が流出したのと同様の問題が、AIをフル活用した企業の間に発生するだろう
  • 政府が規制政策としてできるのは、せいぜい兵器開発や遺伝子操作にAIを用いる際の倫理上の問題について歯止めをかけることだけだ。そのような問題が大きくないもっと一般的な商取引においては、規制を入れた国の企業は単に衰退するだけであろう

そのようなわけで、遅い行動の利点を散々に紹介しつつ、AIに関してはこの利点があまり享受できそうにないという結論が得られる。それでも漸進的な変化を選択した先人たちから現代の私たちも大いに学ぶべきである。本題である個人レベルの意思決定の前にやたら前置きを置いたのは、例えばデクラーク大統領の英断から著者個人が受けた感銘を共有したかったためだ。

  • 政治レベルでの漸進性という観点では、近年の政治ではこれが顕著にまずくなっていると著者は感じている
  • サダム・フセインやムアンマル・カダフィが「独裁者だから」という理由で排除してしまった結果がどうだろうか
    • そもそもカダフィ大佐はインターポールにオサマ・ビン・ラディンの逮捕状を請求した最初の人物であった
  • ワッハーブ派の影響を受けたテロリスト達を世俗的な独裁者が押さえつけていた構図について、西側諸国の指導者たちはどの程度の事前理解があったのだろうか
  • もちろんサダム・フセインもムアンマル・カダフィも冷酷で恐ろしい独裁者だった。ただしそれが単に悪だから除去しようというのは、First-order effectしか考慮していない極めてnaïveな判断である
  • 彼らがいなくなった場合のワッハーブ派の活動というSecond-order effectを考慮していない限り、拙速な判断は大体の場合、災害につながるのである。

 


ぬりつぶされた真実

2. 「学び方を学んで」学習速度を早める

社会レベルでは遅い行動には利点があるがAIの文脈だとあまり利点を享受できそうにないという結論を一旦得た。もちろんこの結論はさらなる論考や実証で将来覆るかもしれないが、とりあえず是として進もう。個人レベルの行動、政府は一旦放っておいて私たち個人ができる行動についてはどうだろうか。こちらの結論は極めて明確で、出来るだけ早いことが望まれる。ロジックはこういうことだ: 社会ができるだけゆっくり動く一方で、個人がその変化に先回り or 十分に余裕を持って追いついていれば、過渡期につきものの混乱を最小化した上で良い移行が達成できる。個人が社会よりも早いことが大事なのである。

前回のブログではゆっくりと漸進的に研究を進めてシグナルを取り出せと書いて、これは相反するメッセージのように移るので先に明確にしておく。インプットを高速に、アウトプットを低速・品質重視で個人は動こう、というのが鍵である。他者や先行技術の理解には広範な範囲をできるだけ早くカバーする必要がある。自分の独創性を加えたオリジナルワークは、自己否定的・懐疑的な検証によって品質を最大化すること。

他者から学ぶとはどういうことだろうか。具体例を想像してもらうために、最近著者のもとに届いたヘッドハンターからのスキル要件をあげてみよう。著者はこの要件に関するスキルセットが不足している上に現職に満足していて行く気もないのだが、データサイエンスや機械学習などの今の著者のスキルに加えて、Fixed income securities (債券や優先株などの一定収益を期待する証券)に詳しい人物を探しているそうである。著者の所属するファンドでもFixed income securitiesは取引対象であるが未熟者ゆえ著者個人はこれにはまだ習熟していない。それを習得している者にはさらなる上のステージがあり得るということである。FinTechや決済ビジネスにおけるイノベーションでは、どうやって一般ユーザーの負担するコストを安くしつつ沢山の人にそれを使ってもらうかが大事であるから、確率的なアービトラージ等を通じて決済用のフロントエンドと、コスト or リスク分散のバックエンドとを出来るだけ統合した形で実現するのは大事であろう。少し拡大すれば、Machine Learning + Blockchain + Fixed Income Businessという3分野統合スキルセットの持ち主には飛躍的な将来がありそうである。

  • Fixed income securities に詳しい人は銀行やヘッジファンドにいくらでもいる
  • Blockchainの基礎技術とそれがもたらす社会変化を熱心に追っている人も最近は多い
  • 機械学習については大学か産業界で2-3年の経験がある人には一定スキルがあるだろう
  • しかし3つ全部のスキルを要求される仕事では、急に競争相手がいなくなるのである。そして3つを習熟するにあたって、あなたがフェルマーの最終定理を証明できるような天才である必要は全くない

これら3つを学ぶといっても、昭和の日本企業で推奨されていたようなゼネラリスト、全部が70-75点程度の理解である人材には声はかからないであろう。理想的には、3つの分野全てにおいて、サクセスフルなビジネスを一つ手がけたことがあるか、またはトップ国際会議 or ジャーナルに論文を通している、といったどれも90-95点という状況が望ましい。そのような人材はGeneralistではなくてVersatilistと呼ばれる。Versatilistになるのが不可能ならSpecialist+リテラシーで対処するしかなく、一つだけ120点で他が80点という状況を狙うことになる。

このような複数スキルセットを包括的に学ぼうとしたときに、長時間労働・勉強にも限界がある。一見異なる3分野間の共通性をどうやって見出し、早く学習できるかどうかが、長期的に効いてくるだろう。そのような効率的な学習法で自分個人にあった方法論を見出した人にはすごいボーナスが来るが、それ以外の人は仕事を失う創造的破壊が起きているのだろう。

効率的な学習法とは、予備校の教師が教えるような効率的勉強法よりも一段階メタレベルのアプローチを指している。あなたが三角関数という新しい概念を高校で習ったとき、あなたは三角関数について学んでいたのだろうか。それとも何か未知の概念を習得するときにどうすべきかという規範を学んでいたのだろうか。あなたは前者を学んでいたつもりだったのに、当時は冴えなかったクラスメートの一人が実は前者と後者を学んでいた可能性を考えたことはないだろうか。そしてそのクラスメートは大人になってから突然大化けした。実は、前者と後者をともに学ぶことについては、機械学習の先端に大きなヒントがある。

機械学習の最近のトレンドの一つに learning to learn アルゴリズムというものがある。Learning to learnタスクでは、どのような学習アルゴリズムが同じサンプルサイズでもより予測精度の高いモデルを生み出すかのメタルールを自動学習する。予備校教師の例で言えば、学習法Aを勧めた教師と、その学習法とは違うBを勧めた教師と、どちらのアドバイスに従うべきかを、学習サンプルを収集して判別するのである。

人間が新スキルを得るための学習法というものは、その学習法自体の良し悪しを統計的に比較検討できるはずである。例えば、Blockchianのど素人である著者がこの分野を勉強しようと思ったとき、次の複数のアプローチのどれが有効だろうか。

  1. 新分野の中で興味をもった論文からはじめてその参考文献を追って行く
  2. 新分野の代表テキストを最初から最後まで読む and/or 課題をやる
  3. 新分野において信頼できる専門家の書いた一般書を読み、その中の参考文献を追う

この3つのどれがより著者にとって有効であるか調べるためには、理想的には、Randomised Controlled Trial (RCT)を行う必要がある。RCTする場合は、著者と似たようなアカデミックバックグラウンド and 実務経験を持った人をたくさん集めてきて、方法1, 2, 3をランダムに割り当て、例えば1年間勉強を続けてもらう。1年後にスキルテストや実在課題を解かせてみて、1-3のどの集団が優れていたか比較するのである。古典的A/B/Cテストだ。

しかしこのようなRCTは実際には実行不可能である。厳密に同じバックグラウンドを持った人をたくさん集めるのは不可能だし、各人に貴重な時間を消費させて選択を強制することもできない。まぁ因果推論関係の統計学を使えば自然選択状況からある程度の推定は可能であるが。

なので読者諸賢には、このような選択的トライアルを自分個人で一人でも実践していくことを勧める。著者の体験例を出してみよう。著者がゲーム理論やマルチエージェント・システムについて学んだ際には1の論文スタート・アプローチを取った。著者が作曲における和声法・対位法・管弦楽法を学んだ際は2のテキスト網羅アプローチを取った。そして著者が行動経済学を学んだ際は3の一般書スタートアプローチをとった。

  • 一応白状しておこう。和声と管弦楽法は定めたテキストをきちんと全てこなしたが、対位法は未完であり、こちらは今後きちんと補間していかないといけない。

Tonal Harmony

Materials and Techniques of 20th Century Music

Counterpoint: The Polyphonic Vocal Style of the Sixteenth Century (Dover Books on Music)

The Study of Orchestration

Agent-Based and Individual-Based Modeling: A Practical Introduction
Generative Social Science: Studies in Agent-Based Computational Modeling (Princeton Studies in Complexity)

その結果、著者にとって新分野学習において有効だと結論されたのは以下のシーケンスを重視した方法論である。1-3のどれかを選べ、ではなかったのだ。このシーケンスが採用された理由は、それぞれの学習法の利点と欠点を身をもって味わったからである。

  • まずはその分野の一般書を読みReferenceをたどる
  • 続いて興味をもった論文をいくつか読み漁り、すでに自分が知っている数学的知識とのアナロジーから学習をはかる
  • 最後に、当該分野のテキストを最初から最後までやって網羅的に全体像を把握する

1-3のどの方法にも利点と欠点がある。論文drivenのアプローチは興味を追っているので効率が良い一方で、カバレージにかけ教養の欠落を招く。Exploration-exploitation trade-offのある状況においてexploitationしすぎるのだ。一方でテキストdrivenのアプローチは、特に和声課題のときに感じたことであるが、いつになったら一人前になれそうかゴールまでの感覚がつかみにくく、動機付けが弱くなる。その結果、平均的な学習速度が遅くなる。とはいえ、このカバレージはいずれは必須である。なので、効率的に取れる60%の範囲をまずは論文drivenで学び、その後にテキストで網羅することが良いと結論した。とはいえ最初のとっかかりが何もない状態で論文をあさるのもまた非効率なので、好きな読書の延長としてまずは一般書からスタートする、という組み合わせに落ち着いたわけである。

  • 著者の友人の複数のPhDホルダーを見ても、カバレージをきちんとしているかが学位保持者とそうでない人の一番の差で、それが長期的に効くということはお伝えしておく

著者の採択したアプローチが合致する方はデータサイエンティスト以外にもたくさんいると思われる。しかしながら、これはあくまで著者個人にとっての準最適解だ。読者諸賢個人に対してあうかどうかの精査は大事である。新分野を開拓するときに学習法を意図的に変えてみて、自分の中で学習法を比較できるようなサンプルを創り出すことはお勧めである。

自己サンプルだけではおそらく比較には不十分であろう。そこでサンプルサイズの増大 or 信頼できる事前分布の設定のために、身の回りの人の学習結果もこっそり利用すると良いかもしれない。他人の成功と失敗から学ぶのである (優れたバリュー投資家がよく口にすることだ)。あなたの身の回りでは、環境変化への適応が早い人と遅い人がいてそれぞれ異なった戦略を採用しているはずだ。彼らを観察して良い戦略の事前分布を作ろう。事前分布といっているのは、これは人間一般にとって良いと仮説されているだけで、あなた個人は他人と大きく違っているかもしれないためである。多くの他人による事前分布と、自分自身の経験によるサンプルのmixtureで推定するのは、ベイズ推定である。ベイズ推定のアナロジーで汎化されたリアルlearning to learnは、あなたのキャリアを大きく広げて行くだろう。

機械学習に限らず、数理的な最適化アルゴリズムというのは何も仕事のデータだけに使う道理はないのである。そこから学べる規範を自分の人生そのものに役立ててみてはどうだろうか。リアルな日常生活においてベイズ推定 and/or 強化学習しよう。

長時間労働は勤勉革命のせいだけではなく、不確実性回避のせいかもしれない

さて、個人が時間を浪費せず新しいスキルを学ぶことの重要性について説いているわけであるが、多くの人はなかなかこれが出来ない。その理由として著者が想像しているのは、新しい分野を学ぶのに想定外に長い時間がかかってしまったらどうしよう or いつまでたっても理解できなかったらどうしようという恐れではないかと思っている。(新たに得たスキルの利得) マイナス (所用時間による機会損失) という打算において、後者の不確実性に対するリスク回避を重視した意思決定をしてしまっているのである。

このリスク回避現象は、なぜ長時間労働が減らないかの理由の一つになり得る。もちろん長時間労働の主たる要因は江戸時代の勤勉革命 (Industrious Revolution)から、顧客による無償労働の脅し(株主によるコーポレート・ガバナンス不足の結果としてのpricing powerの弱い事業から経営者が撤退しないことが本質的要因)まで種々ある。しかし副次要因としてはこのリスク回避性も作用していると思う。現場レベルで、例えば次のようなことがおきるのだ。

  • 財務担当者がExcelで作業をしているが、いくつかの数値入力部分は毎回同じステップであるので自動化して他の仕事に集中するか早く退社したい
  • しかし彼はプログラミングに馴染みがないので、過去の.xls or .xlsxファイルをコピー&Editする以上の作業時間短縮が現在のスキルではできない
  • 今回の作業を完遂するにあたり彼は二つの選択肢から選ぶ必要がある
    • 1. 今までと同様のやり方をする。所用時間は3週間で確実にこの時間で終わる
    • 2. pythonまたはVBAを追加で学び、プログラムの自動出力を利用する。他に財務で新たにプログラミングを学んだ人の経験から推定するに、学ぶのに期待値では10日かかり、その後最後に残る手作業は4日で終わるためトータルで2週間である
    • 2.は期待値としては1.よりも早く終わるが、学ぶのに想定外の苦労があって、10日かかる学習時間が20日か30日になってしまうかもしれない
  • このような状況において、彼はハードデッドラインを過ぎてしまうリスクが怖いので選択肢2を選ぶことができない。もし2を成功裏に今回終えれば、今回の短縮に加えて来期の同一作業における所用時間は劇的に減るにも関わらず

同じ財務担当の中でも所用学習時間にはバラツキがあることが観測できるだろう。加えて、そのようにプログラミングを習得した他の同僚がいない場合には、サンプルサイズの不足による不確実性(統計学ではestimation errorとかconfidence interval or credible intervalのことをさす)が増大する。このリスク+不確実性を短期的に回避し続ける結果、彼は長期的にいつまでたっても長時間労働から逃れられないのである。


退屈なことはPythonにやらせよう ―ノンプログラマーにもできる自動化処理プログラミング

このようなトラップは、締切ドリブンのカルチャーが緩和されれば回避できる。経営者の方は社員のコントロールにおいて参考にしてみて欲しい。一度のチャレンジでは想定外に多くの時間がかかって一時的な生産性低下を被るかもしれないが、明らかに最初の段階で学習に取り掛かる方が累積コストは低い / 累積リターンは高い。実は企業がR&Dに投資する際の基本を、ここでは単にExcel処理という小さな例に当てはめて議論しているだけである。

結局のところ、キャリア構築・スキル習得においても、短期のリスクは不可避であると腹をくくって長期リターンを最大化するだけなのだ。世界的に見て、社会人が会社を辞めて大学院で学びなおしたりする際の正当性も、そのような短期損失を覚悟したリスクテイクから来る。

学習速度は逓増する

不確実性に惑わされて二の足を踏んできた人たちに最後にメッセージしておきたい。安心して欲しい。本当にゼロから学習を始めて恐ろしく時間を無駄にするケースはまれである。そして著者が今までの体験から自信を持って言えることとして、今までの蓄積が多い人ほど、新しい概念の習得も早まる。学習の複利効果とでも言おう。直感的には、n 種類の見かけ上異なる学問分野があったとしても、それら全てを学ぶのにかかる時間は log n くらいで済むだろう。見かけのサンプルサイズや次元に反して、実効次元やクラスター数はもっと小さいのだ。その根拠は、先人のたちの知恵のおかげで異なる専門領域も元をたどればシンプルで強力なファンダメンタルズから成り立っていることが多いためである。

  • 著者の場合、有名な「藝大和声」の課題をやっている間は、このよくできてはいるが疲れる禁則を体に無理やり叩き込むのが非効率に感じられて仕方なかった
  • しかし本業の機械学習研究においてbias-variance trade-offの扱いに関して理解が進み、五度圏による分析法の習得など他の知識が混じってきた段階にいたると、よりメタレベルでの法則理解が得られたため、課題の遂行が容易になったのである
    • それでも初学者には先に挙げたStefan Kostka氏のテキストの方を勧めるが

和声―理論と実習 (1)

和声―理論と実習 (2)

和声―理論と実習 (3)

見かけ上の学問領域の広さに圧倒されて、自分の既存知識範囲に固執し過ぎてしまう傾向は、若い人が資産運用において複利効果を軽視してしまうことと似ている。一回一回はリスクある意思決定であっても、長期的には本来あるべきcapital growth rateに近づいて行くのだ。複利効果を理解しない人は、期待値 ➗ ボラティリティのS/N比を上げる代わりに単にボラティリティの高い一か八かのギャンブルをやってしまう傾向がある。しかし若い人は残された時間がもっとも長く、長期資産運用が本当は向いた立場にいる。彼らは期待値としてのcapital growth rateを上げるような、複利効果のあるキャリア開発に全力を注ぐのが最適である。

若い人だけでなく、40歳や50歳の人にとってもこれからの社会ではimplicationが似てくる。平均余命が伸びていることと、年金の支給開始年齢が上がることでシニアも先々のキャリアは想像以上に長いからだ。

残り期間が長い前提においては、今更新しいことを学ぶなんて難しい、という嘆きこそが最大の敵なのである。今回の投稿は俗に言う「文系的」知識を総動員しつつ、著者の専門から言えることを定性的に結びつけて論じてみた。読者諸賢のキャリア上の触媒になれば幸いである。

Reference

Integrityと資本配分と高ROCからの再投資

先日のBerkshire Hathaway Inc. Annual Shareholder Meeting出席に関してもう少し話を続ける。著者はOmahaへの渡航時には Value Investor Conference (VIC) 及び併催されるSummitに出席している。昨年はPhilanthropy Summit, 今年はCorporate Values Summitが開催された。VIC本会議が投資手法や経済環境そのものについて議論することが多いのに対して、Summitは投資における価値観 (values) を議論する。技術者の人たちには価値観を議論するカンファレンスというのは馴染みが薄いかもしれない。しかし実は技術よりも価値観と哲学こそが不確実性の高い時代を生きていくにあたって最も大事なものだと、著者は自信を持って伝えたい。本稿では価値観が投資基準にどう影響し、そしてビジネス上の意思決定にどうつながるのかについて議題を提供したい。

Robert P. Milesへの感謝

VICに加えて、2017年の著者はGenius of Warren Buffett  (GOB)というバリュー投資家のためのExecutive MBAのクラスに出席した。VIC, GOB共にインストラクターの Bob Miles (Robert P. Miles) が作り上げてきたプログラムである。

彼と話していると、そしてプログラムに出席していると、Bobのintegrityの高さが伝わってくる。WarrenやCharlieのvaluesがそのまま彼にも共有されていることがよくわかる。VICやGOBの講師はBobによって本当に注意深く選定されており、講演者と受講者のいずれからも信頼されている。米国では彼は著名人なので宣伝目的で近づいてくるファンドマネジャーが大量にいるのだが、彼はそういった人々を避け、正しい価値観の元で投資が続けられるように受講生や出席者を助けてくれる。

Bobは作家として認知されていて、彼の著者の一部は日本語にも翻訳されている。The Warren Buffett CEOの邦訳を紹介しておくが、Warren Buffet Wealthもお勧めである。

最高経営責任者バフェット~あなたも「世界最高のボス」になれる (ウィザードブックシリーズ)

Warren Buffett Wealth: Principles and Practical Methods Used by the World’s Greatest Investor

著者はGOBコースの日本人修了生第1号だそうであるが、第2号以降が読者の中から現れることを願っている。たった3日間の受講で、日本の国立大学授業料の半年分くらいの費用がかかってしまうのだが、この講座で身につけた倫理観と規律はこの後の人生においてずっとあなたを助けてくれると思う。リターンを追求する投資だけではなく、投資による資本配分がリアルのビジネスにどう影響するのか、なぜintegrityがmatterするのかがよく分かるのだ。

ここではGOBおよびVICに来てくれた講演者の中で特に印象的だった2人をピックアップしたい。1人目はNebraska Furniture Mart (NFM)の前CEOであるBob Battである。2人目はInvesting Between the Linesを出版したL.J. Rittenhouseである。彼ら以外にもWarrenの長女であるSusie BuffettやNational Indemnity Company (Berkshire傘下で大変な利益をあげている保険会社である)のCEOであるDonald F. Wursterといった豪華スピーカーと身近に話すことができて大変貴重な時間であった。

Integrityと再投資との関係

Bob Battは慎重さとリテール・ビジネスにおけるあらゆる知見、そして何より次世代に対する思いやりを持った、尊敬できる老人の代表みたいな人である。バフェットの専門をCapital AllocationからRetail Businessに変えると全てそのまま彼になるかのようだった。彼はcandorのある人物で、オンラインのe-コマースや消費にお金を使わないミレニアル世代など、自分たちのビジネスに現在吹いている逆風についても率直に語った。NFMはMrs. Bとして知られるRose Blumkinが創業した。Bobは彼の家系がMinsk (今はベラルーシ、当時はロシア)からどうアメリカに渡って来たのか話してくれた。

NFMは巨大な一店舗にあらゆる家具とアプライアンスが置いてあるblock and mortal storeである。実際のところAshley (たまたまであるが著者の自宅の近所に日本支店があって知っている) など質の高い家具がかなり安く買えるので、インテリア好きの人はアメリカ中西部に行くチャンスがあったらぜひ訪問してみることをお勧めする。Bob自身はNFMからは引退して今は子供たちを助ける慈善事業に全力を注いでいる。リテール・ビジネスにおけるインサイトは慈善事業の経営や政府の運営など公益の追及にもとても役立つそうだ。

NFMや同じくBerkshire傘下で宝飾品の販売を手がけているBorsheimsなどは、他のリテールビジネスとは異なった性質を持っている。店舗数がものすごく少なくて基本的にはsingle-storeで全てを提供するのだ(注: NFMは全米で4つしか店舗がなく、そのいずれも巨大である)。多くのbrick & mortal retail businessでは、小さな店舗をたくさん建設するfranchiseの形式を取る。NFMやBorsheimsは逆である。しかし、たった1店舗にものすごい在庫があってなかなか買い物が楽しく、しかも価格も競合より安い。日本で言うと、東急ハンズが定価販売ではなく量販店と同じ値段で売っているようなイメージだろうか。

このsingle-store policyはWarren Buffettの注意深いcapital allocation能力によってもたらされたものである。彼は合計売上高を増やすのではなく利益率を増やすことを傘下企業に強く求めるそうだ。もし店舗数の増大がコストの増大か顧客の低価格志向によるマージン低下につながるようであれば、Warrenは傘下CEOたちにむしろビジネスの拡大を避けさせるのである。

NFMでは比較的安いNebraska州での流通コストや人件費を武器に低コスト優位性を維持している。販売価格も安いがコストがそれよりさらに安く高い利益率が維持される。他者がこれを真似ようとしても同レベルの低コストが実現できないので、高価格販売して顧客からそっぽを向かれるか無理して値下げして破綻するかのいずれかになる(日本の量販店は後者の道に向かっている印象がある)。Bobは”We are conservative.”と率直に語っていた。政治の世界でのconservativeは色々議論があるが、このビジネスに関するconservativeは著者には心地よく聞こえた。低コストを武器にするのはAmazonのe-Commerce部門も同様だろう。自称高付加価値ビジネスは競合が参入するとあっさりと値下げの妥協を強いられるが、流通網の強さによる低コスト優位性は競合が真似できないのである。Amazonの場合は直近の利益率を犠牲にして世界中で低コスト状態を実現するべく拡大を続けているが、NFMは高利益率を維持する代わりにNebraskaから外に出ないのである。そして全米中から消費者をOmahaに連れてくる

Growthとかbig businessといった言葉に踊らされている人にはNFMのpolicyは奇妙に映るかもしれない。しかし資本の効率性を最大化する観点からはこのアプローチが正しいのであり、しかもこのやり方だと雇用を最大限守ることができる。どういうことだろうか。

Buffettは複数のビジネス領域に極めて通じた投資家である。彼は同じ1ドルを追加投資するならどこに投じたら良いのかが的確にわかる。NFMやBorsheimsの店舗をどこかの州にもう一つ作るのと、それとも傘下の保険会社の拡大に当てるのと、リターンがどちらが大きいのか判断できるのである。彼はdiminishing returnによって利益率がさちってしまったビジネス領域にお金を放り込む愚を犯さない。そしてNFMは店舗を増やさずとも、Omahaにとどまっている限り儲けた利益を翌年の運営のために再投資して、高い利益率を保ったまま安定的に売上も拡大することができる

テストステロンに心を支配された愚かな経営者は店舗を増やせばビジネスが短期間で飛躍的に増大して利益もうなぎ登りかもしれないと楽観サイドだけを考え、短期間で急激な拡大を狙うが失敗して多額の負債を背負う。従業員も急拡大して大量に雇ったと思ったら急に大量に解雇する(人の人生をなんだと思っているのだ)。NFMのやり方だと、circle of competenceを守ることで持続的雇用を提供できる。もちろん絶対的な雇用人数が大きく増えるわけではないが、やっと仕事が見つかったと思って働き始めたら急に解雇されて今までの時間はなんだったのだと、せっかく働きに来てくれる従業員を途方にくれさせるような事態を賢明にも避けているわけだ。実際、Berkshireではlay-offをしないことを大事にしているそうだ。昔のDempsterの件ではBuffettは誤りを犯したと考えているらしい。

そしてこのアプローチは投資としても非常に成功する。高い利益率を維持して再投資を続けることで、長い目で見ると複利によって資本が膨れ上がっていくのである。ある時+50%で増えたと思ったら翌年から+3%しか増えなくなってしまったなどというビジネスよりも、毎年+15%がコンスタントに続き際限なく増えていくようなビジネスの方が望ましい。グロース株などと呼ばれている銘柄の一部は前者のような一発あたり市場しか取れなかったりするし、一発狙いの短期思考の人は、利益の再投資によって膨れ上がる複利を過少評価する傾向がある。アインシュタインも人間が複利の効果に気づかないことについて言及しているようだ。ぜひ後者のビジネスを探してみて欲しい。

Integrityとデータ解析

実はバリュー投資家のコミュニティでは最近、quality of investmentsが成功の鍵だと言う意見が強くなっている。財務書評から読める定量的ファンダメンタルズも大事だが(これが分かるだけでロクでもない会社をお金を放り込む愚は避けることができる)、それ以上にCEOや会社の人格・価値観こそがリターンを決めるのだという見方だ。

L.J. Rittenhouseはcandorをshareholder letterやannual reportsのテキストから分析する方法を見出してきた。良いニュースだけでなく悪いニュースも率直に伝える正直さ・自分の誤り認める態度があるとか、株主への手紙で英作文に時間をかけて丁寧に最適な単語を選ぶような経営者のいる会社は成功確率が高いのである。経済と倫理との関係を大切にしている人にとっては朗報ではないか。この世界は技術者の人にとっても面白いかもしれない。彼女らのアプローチを参考に、自然言語処理を用いて株式のリターンを予測しても良いわけだ。著者も以下の書にサインをもらった。

Investing Between the Lines: How to Make Smarter Decisions By Decoding CEO Communications

Quality of investmentsの世界には心理学者も研究フィールドを広げている。昨年のVICにはFred Kielが以下の書の紹介も含めて来ていた。Rittenhouseに興味を持たれた方はFred Kielも合わせて追いかけると良いことがあるかもしれない。

Return on Character: The Real Reason Leaders and Their Companies Win

合理化途中の過渡状態と不合理を受け入れた定常状態

母校の集中講義で機械学習とゲーム理論の数理的類似性に関して話してきた。大学からの依頼で行ったものであるが、その要請はかつての自分と同様に社会人博士課程に通う学生への助言である。在学中の研究とその後の展開や、研究成果をどう実ビジネスや仕事に生かしていくかを体験談として話して欲しいというものだった。博士取得後に深めた知見の方が在学中の成果よりも大きいと著者は考えているので、学生時代の話は触り程度にして、その後の研究トピックの広がり方・掘り下げ方について、転職後に加わった視点も交えて紹介した。以下はその説明資料である。OpenOffice.org ImpressとLaTeX beamerが混在しているのは全てをbeamerで準備する時間がなかったことによる、デザイン上の妥協である。

提供した視点の中で、その拡張に将来性があると2016年時点で著者が考えているのは以下に列挙した両者の対応である。特に、機械学習側の関数近似テクニックや緻密な確率的モデリングを行動ゲーム理論に持ち込むことで、人間同士が相互作用する社会環境 (人間系) における意思決定を、もっと数値的根拠が確かな状況で行えるものと期待している。

  • 正則化のない最尤推定はナッシュ均衡の計算に類似しており、
  • 事前分布を用いるベイズ推定やJames-Steinの縮小推定は限定合理性を扱う行動ゲーム理論における、Quantal Response Equilibrium (QRE)の計算に似ている
  • 明示的な正則化項を追加する代わりに最尤推定の最適化ステップを途中で中断するアプローチであるearly stoppingはCognitive Hierarchy Theoryと似ており、これも行動ゲーム理論で使われるテクニックである

Google DeepMindはAlphaGoでDeep Reinforcement Learning (深層強化学習)を用いたが、Deep Belief Learning (深層信念学習)という社会科学技術がイノベーションを起こす、というのが著者の大胆な予想である。しかしこれは当たるも八卦当たらぬも八卦の話なので、もう少しsolidな上記メッセージに戻ると、用いた資料で最も重要な一枚は次のスライドだろう。

ml-vs-gt

 

与えられた特定のゲームにおける実現シナリオの候補として、ナッシュ均衡はその定義は厳密ではあるが、実社会でのゲームにおいて実際に発生するシナリオからはしばしば乖離した予測を示す。最尤推定が学習データという狭いデータセットに対しては最大の予測能力を示しても、テストデータを持ってくるとそうはならない点と似てるとは感じないだろうか。

一方、ベイズ推定は事前分布という固定点を導入し、そちらにshrink(縮小)させることで、学習データに対する説明能力を少し妥協する。しかしこの小さな妥協はテストデータに対する予測能力を大きく向上させる。QREも同様で、他のプレイヤーの合理性に確信が持てない状況で、不確実性を撹乱項として明示的に確率モデル化することで、より実社会の集団的意思決定結果に近い予測結果を返してくれる。ベイズ推定もQREも、データやゲームに依存しない固有の確率モデルを入れることで汎化能力を上げる、という思想が共通している。

加えて、実用上は、固定点への縮小戦略ないしアルゴリズムは厳密なベイズ推定解でなくても良い。要は、事前分布の中心に相当する固定点があって、そこに少し近づける方法論であれば何でもよく、その一つがDeep Learningでよく使われるEarly Stoppingである。Early Stoppingは、複雑なゲームの均衡を数値的に計算する場合に使われる Belief Learning (信念学習) を途中で打ち止めにする方法と類似しており、Cognitive Hierarchy Theoryはこの打ち止め自体を確率モデル化したものである。

機械学習研究者コミュニティの中には、統計学だけでなく認知科学の研究も行っており、行動経済学的な現象の発生メカニズムを数理モデル化している人たちがいる。著者もその端くれであると自負している。昨年、著名な国際会議のNeural Information Processing Systems (NIPS)に出席した際には、パネルディスカッションにおいてBayesian Nonparametricsの大家の教授が同様の見方を他の認知科学研究者から聞いたと言っていた。この教授が誰であるか業界人にはバレバレであるが、著者の記憶が間違っている可能性もある。後で「私はそんなことは言ってない」というクレームが発生しても責任は持てないので名前は伏せることにしておく。

講義は機械学習と行動ゲーム理論の接続に限らず、与太話も含めていろいろ話してみた。科学的根拠の薄い仮説であることを断った上で、スライドの最後のセクションには私見をいろいろ載せている。一方で全ての意見が無根拠というわけでもない。例えば、リスクは避けろ、不確実性はテイクしろというメッセージは i) 偉大なバリュー投資家たちのコアとなる考え方で、ii) 多腕バンディット問題におけるexplorationのgainがどういうときに最大になるか考えた上で 持っている意見である。すぐれた起業家や研究者がリスクテイカーだというのはおそらく嘘だ。彼らは不確実性をテイクしているのであって、避けられるリスクは極力全て避けている。製鉄ビジネスを始めるときにいきなり自力で始めるのではなく破綻した製鉄所を安く買い取って始める、とかね。

これから博士課程に通おうと思っている人や、社会人博士における研究テーマの選定で迷いがある人は参考にしていただければ幸いであるし、個人的な質問があれば twitter account @rikija に連絡くだされば話せる範囲でお答えします。

集合知の質: 1ドル1票か1人1票かあるいは? (2)

衆愚制や民主主義の危機が叫ばれる中で、単純な均等投票以外の集合知が民主主義陣営の強力なサポーターになってくれるかもしれない。集合知の質: 1ドル1票か1人1票かあるいは? (1) で、集合的意思決定手法の一つである予測市場について紹介し、その光と闇について論じた。予測市場の株価は予測対象に対する知見が高い人の予測に高いウェイトを振った加重平均値であり、これを予測値とした意思決定は低いバイアスを享受できる。実際にお金をかけさせることで真剣な予測値を作り出すことができる点、加えて人工知能・統計学アプローチと違って既存のビッグデータがなくても意思決定できる点は、プラットフォームとしてのアドバンテージとなる。しかし最近はUKのEU離脱をバイナリー値としては予測し損ねたという失敗例もある。最終株価が単純なアンケート or 選挙に比べて未来を正確に予想しているかどうかには、依然として議論があるだろう点を前回議論した。


普通の人たちを予言者に変える 「予測市場」という新戦略

今日は予測市場の最終株価以外の産物を役に立てられないか考えてみる。最終株価よりもすぐれた予測値を、統計学もしくは金融工学を駆使することで得られないだろうか。具体的には、予測市場が産み出した株価の時系列データと出来高等の個々の取引記録を利用することを想定する。議論のスコープからは今回は外すけども、予測市場株価を原資産に見立てたデリバティブ: 先物, オプションを作ったら更に予測精度が上がるかもしれない。

予測市場及びその派生市場で得られた多くの証券データは、それらを統計的アルゴリズムに入力することで最終株価よりも優れた予測値を生み出す可能性がある。また予測精度自体は同じであったとしても、過渡的なデータが予測対象に関するインサイトを提供する場合があり、その情報自体が市場参加者、つまり一般市民の政治的意思決定能力を向上する可能性もあるのだ。

過渡的な情報に価値があるという見解は、著者が効率市場仮説 (Efficient Market Hypothesis; EMH)を支持していないことに由来する。EMHが完全に成り立つなら最終株価以外の指標は役に立たない。EMHは市場が常に定常状態(=均衡)にいる、もしくは一瞬で定常状態に遷移すると仮定することでほとんどのトレーダーがリターンを取れない、と主張する。EMHの反証は統計的裁定機会の存在を示すことによって行われることが多いが、少なくとも短期トレードではこの裁定機会を見つける困難さゆえにEMHが想像以上に妥当に思えてしまうトレーダーも多い。ファンダメンタルズに基づいた中長期投資ではそれほど反証は難しくないのだが。

短期トレードが難しいとしてもEMHが完全には成り立っていないと言える根拠は、そのおかしな仮定にある。過渡状態と定常状態(=均衡)は明確に区別して議論しなければいけない。またこれらを明示的に区別することで、EMHが成り立たないなら株価はどうやって動くのかある程度モデルを立てることができる。モデルの設計と検証を立てるのはアカデミックな成果を争う研究領域となるのでブログでは避けることとしつつ、今回は過渡状態の方が定常状態よりも重要であるケースの一つを紹介したい。この背景を経て、予測市場の時系列データを残していくことが民主主義社会における大きな遺産になり得る可能性に気づいてもらえれば幸いである。

今回、過渡状態と定常状態の違いについて導入した上で、次回はどのような予測市場の過渡状態を残したいか、著者なりの政治的見解を書いてみようかと思う。今の所の素案にあるのは、「ある政治家が政策Xを実現するか否か」に賭ける予測市場であるが、もっと良いアイデアがあるだろうと思う。

定常状態(=均衡)はしばしば非現実的に見える

突然ではあるが p-美人投票 (p-beauty contest) というゲームを紹介したい。ここではp=2/3のケースを取り上げる。以下のルールのゲームで、各プレイヤーはどのような選択をするだろうか?

  • n (\geq 3)人いるプレイヤーが0以上100以上の整数を一つ、同時に選択する
  • 全プレイヤーの数値の平均値の2/3倍に最も近かったプレイヤーが優勝する

特に難しい点のない単純なルールであるが、図で例時すると図1のとおりである。この例では#1, #2, #3の3人のプレイヤーがそれぞれ35, 15, 22 と宣言し、平均の2/3倍である16に最も近かった#2が優勝した。あなたがプレイヤーの一人だとして、どの数字を選ぶか想像してほしい。平均値は他のプレイヤーの数字によって変わるわけだから、あなたはライバルを出し抜かなければいけない。

pBeautyContest

図1. (2/3)-beauty contestにおける意思決定と結果例

十分に頭の中で想像してもらえただろうか。そうであれば次に進もう。このゲームにはナッシュ均衡が一つだけある。それは全員が0を選択するというものである。そのロジックは次の通りである。

  • ゲームのルールを全くわかっていないナイーブなプレイヤー (これを0-step playerと呼ぼう)を想定すると彼らは0から100をランダムに選ぶのでその期待値は50である
  • 0-step playerを倒すことを想定している1-step playerは50 \times 2/3 = 33.33\ldots のため 33を選ぶだろう。1-step playerは0-step playerよりちょっとだけ先読みしている
  • 1-step playerを更に倒すことを想定している2-step playerは33 \times 2/3 = 22より22を選ぶだろう

こうしてk-step playerを倒す (k+1)-step playerのことを考えていき、全てのプレイヤーがお互いが完全合理的であると予想して無限遠まで読み切ると全員が0を選択することになる。簡単のためにk-step目までの期待値による説明を書いたが、期待値でなく他の代表値を使ったり、0-step, 1-step, …, k-step playersがそれぞれいる状況で(k+1)-step playerの振る舞いを考えても結論は同じである。2/3をどんどんかけていく等比級数の極限である0が均衡となる。先読みばかりしているエリートの選択というのはお互いに似てくるわけだ。またそのような共通の思考回路を暗黙に持つことで無難な幕引きを図るのがエリートの特徴とも言えるし、それこそが彼らがつまらない人物に見える主因かもしれない。

「今」は定常状態 or 過渡状態?

さて、ナッシュ均衡が0だということはわかった。しかしながら、あなたは本当に全員が0を選択すると思うだろうか? あなた個人が0を選択する可能性は十分著者も予見しているが、あなた以外の全員が0を選ぶとあなたが考えているとは、著者は思わない。実際のところ、この「全員が0」という均衡からは、ちょっとした撹乱によって容易に乖離しうる。例えば、

  1. もし他のプレイヤーがゲームの本質に気付いておらず、0よりずっと大きい数字を選択したら?
  2. もしプレイヤーの一人が、自分が負けてもいいのでエリート連中にダメージを与えてやろうと考えたら?

1.はプレーヤーの知性に限界を設けたケースで、2.はプレーヤーは賢いがわざと愚かに振る舞うケースである。理知的な大国間の交渉に比べて、テロリストやヒステリックな人物との交渉はより難しい。現実世界でのそのような読みの難しさをp-beauty contestは簡潔に表現している。

ナッシュ均衡の非現実性は、i) すべての人が一様に無限遠を見通している非現実的仮定や、ii) 確率的な撹乱を無視した決定論的思考 に由来する。実際のところ、[1][2]に掲載された実際の選択は表1の通りである。ゲーム理論家であっても彼らはこのような撹乱を想定しているのであって、0は選択していない。

  • ここでは[2]に掲載された簡略化された表を抜粋している。より広範な調査は[1]に掲載されている。

表1. (2/3)-beauty contestで実際の人間が選んだ平均値

グループ名 n: プレーヤー数
(グループから抽出)
グループの合計人数 選択された平均値
Caltech Board 73 73 49.4
80 year olds 33 33 37.0
High School Students 20-32 52 32.5
Economics PhDs 16 16 27.4
Portfolio Managers 26 26 24.3
Caltech Students 3 24 21.5
Game Theorists 27-54 136 19.1

表1で各グループの性質と選択結果を眺めてみるのはなかなか面白い。カリフォルニア工科大学のボードのお偉いさんたちはほとんどナイーブなプレーヤーのように振舞っていて、学生さんよりもずいぶん値が高い。お年を召されて真面目に考えなくなってしまったのだろうか? などと不謹慎な想像だって出来る – 実際のところ80歳の人たちの平均値も結構高い。さらに学びたい方のために補足: p-beauty contestはリチャード・セイラーの最新刊でも紹介されている。セイラー教授のキャリアの築き方も含めて (学生からの人気を維持するために137点満点のテストを作った話とか) 面白い一冊なので興味のある方はどうぞ。


行動経済学の逆襲 (早川書房)

表1で示されたように、ゲームの中に完全合理的でないプレイヤーが混じっている場合、たとえあなたがとても合理的であったとしても考え直す必要がある。そのような状況における予測値を定量的に与えてくれる方法論は認知階層理論 (Cognitive Hierarchy Theory; CHT) [1] と呼ばれている。各プレイヤーは自分は (k+1)-stepまで読めるが他人は最大でもk-stepまでしか読めないと考えている自信過剰家であり、0-step, 1-step, …, k-step playerの人口比を予想して選択を行っているというモデルを導入するのである。そして kの値と人口比分布を実データから推定することで高い予測値を得ようとするところが、完全合理性一本やりのナッシュ均衡と違っているわけだ。

参考: 機械学習アルゴリズムと行動ゲーム理論との関係

(この項目は参考文献を探している研究者向けである)

さらに撹乱を加えてより予測を精確にする場合、ナッシュ均衡を確率モデル的に一般化した質的応答均衡 (Quantal Response Equilibrium; QRE)を数値計算することになる。CHTが過渡状態で計算を止めるearly stoppingを行うのに対して、QREは確率を入れた上で無限遠まで計算する。しかしどちらもナッシュ均衡よりも初期状態 or 一様分布のような固定点に近づける 正則化として働く点は共通している。その具体論に立ち入るのは予測市場について議論する本題から外れるので割愛する。

参考書としては以下が優れているほか、そのうち機械学習との接点について別エントリーで紹介しようと思うので興味ある人は楽しみにしててほしい。ナッシュ均衡の計算は最尤推定と類似しており、QREの計算は明示的に事前分布を入れたMAP推定に近い。CHTはearly stoppingすることによって結果的に初期状態に近い予測値を出すため、近年のdeep learningで使われているearly stopping によるregularization (初期値に近づける)と類似している。


行動ゲーム理論入門

過渡株価を見ながら定常株価を予測する

p-beauty contestの(狭い)理論と現実との関係から一般化したいstatementは単純である。無限遠まで計算した定常状態よりも、過渡状態の方が現実に近い場合が存在する。あるいは撹乱を入れながら計算した「アニーリングされた定常状態」を計算するべきなのである。そのようなインプリケーションを予測市場に対して適用した場合、我々のやるべきことは明確だ。過渡状態とは個々の意思決定者が残した途中の記録であるから、注文情報や株価時系列データにその情報が含まれており、それを積極的に利用するということである。

p-beauty contestにおいてはk-step playerに(k+1)-step playerが勝とうとするプロセスは心の中で走る時間経過であった。一方、予測市場では 時刻 tまでの株価を見て 時刻(t+1)における投資家の振る舞いが決まってくる。この時刻は物理世界における実時間である。しかし各時刻 t のそれぞれにおいては、各投資家は他の投資家を出し抜こうとする心的プロセスを走らせる。つまるところ心的時間と物理的時間の両方における動力学が働くことになる。他の投資家が完全に合理的で彼らより高いリターンがあげられないのなら、どうして市場に参入するだろうか? 市場に参加するものはすべからく何処かで自信過剰なのであり、その自信過剰性と市場の相互作用が結果的に高精度な政治的意思決定を可能にするのである。

投資家の間の激しい競争を踏まえると、基本的には過去の株価の方が現在株価より正しいというケースは少ないであろう。しかしp-beauty contestの実データに見られる限定合理性からは、過去の株価から背後のマスター方程式を推定して現在株価よりも妥当な推定値を予測するというアプローチが不可能でないことも示唆される。より優れた計量アプローチでは、現在の株価 (price)をvalueの最良推定値とは考えないファンダメンタル投資家に発想が近くなるだろう。長期のファンダメンタル投資家は、定常状態から離れたおかしな過渡状態にいると判断した株式を購入する。そしてその過渡状態から数年のうちに定常状態に収束すると考える。定常状態を理解した上で過渡状態をモニターすることが大事だと見なしているわけだ。

民主主義の強化という我々の目的の場合、一つの政治的意思決定のために数年も待つことはできない。定常状態に収束するまで待っていられないケースが度々ある。UKのEU離脱予測失敗のケースでは、予測市場が本来持っている「賢い投資家に力を与え愚かな投資家を退場させる」時間が投票前に確保できなかった。ならば、過渡状態から計算機上でマルコフ連鎖を回して定常状態を先読みするとか、一部の投資家の認知バイアスをアラートで察知して異常値を排除する、といったデータ加工をしても良いはずだ。そのようにして修正された予測市場株価時系列の方が市場そのままの値よりも本質を突いているかもしれない。加えて、そのようなデータ加工プロセスをも公開することで、市民の意思決定能力が高まる可能性もある。

最後に一つだけ実例を紹介させていただきたい。2013年のACM SIGKDD (データマイニング領域におけるトップ国際会議) で発表された [3] では、フォード社が意思決定インフラとして予測市場を導入したことで得られたメリットについて言及している。この場合、例えば青い車を増やすべきか赤い車を増やすべきかという意思決定において、世界中の社員のボトムアップな知恵を集約するためのインフラとして、投資家である社員が賭ける予測市場が導入された。賭けに勝とうと思うと、各社員が一丸となって今の消費者の好みを調査したりお得意さんにヒアリングしたりする。

株価自体もそれなりに役立ったようであるが印象的な言及として、ニュースイベントと株価時系列との対応関係を取ることで、どういうニュースに社員が過剰反応したりするのか、どこで市場の変化があったのかがモニタリングできるようになった点があった。株価時系列一つ残すメリットは、その株価自身だけではない。他のデータと組み合わせて回帰分析を行うなど、もっと高度な知見収集インフラとして役立つわけである。ビジネスで勝利すべく血眼になって予想を行う投資家の知恵を公的・政治的領域にも役立てられるようになったら我々は民主主義国に暮らしていたことを今よりもずっと感謝するようになるだろう。

References

[1] C. F. Camerer, T.-H. Ho and J.-K. Chong, “A Cognitive Hierarchy Model of Games,” The Quarterly Journal of Economics, 119(3):861-898,  2004.

[2] T. H. Ho, N. Lim, and C. F. Camerer, “Modeling the psychology of consumer and firm behavior with behavioral economics,” Journal of Marketing Research, 43(3):307–331, 2006.

[3] T. A. Montgomery, P. M. Stieg, M. J. Cavaretta, and P. E. Moraal,
“Experience from Hosting a Corporate Prediction Market: Benefits Beyond the Forecasts,” Proceedings of the 19th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD 13), 1384-1392, 2013.

パワードスーツを着た消費者と対話する

あなたが財やサービスを売りたいお客さんはどのような情報源を信頼して購買判断しているだろうか? あなたがたマーケターのメッセージと、Yelpやbooking.comに寄せられるレビューとどちらを信頼しているだろうか。もし、あなたが今までブランド広告で成功してきた人で、商品の本質の代わりに無関係なステータス・イメージの刷り込みに注力してきたなら、これからはその成功体験に殺されないよう警戒しよう。お客さん達の習慣が昔と同じままかどうか、良く考える必要がある。そして今のお客さんが後者のタイプであることに気づいたら、自分のできることは昔よりもずっと少なくなったことを認めたほうがいい。今の消費者は手強い軍人ではない。しかし最強のパワードスーツを着た小学生であってあなたを狙い撃ちにしている。マーケターのやれることはまだいくらかあるが、これからはB2Cのマーケティングは花形の職業ではなくなっていくかもしれない。

統計バカごときが俺たちセンス抜群のマーケターに物申すなって? オーケー。そもそもこんな態度をとるマーケターは仕事上見たことないけども(笑)、そういう人が現れたとしても著者は伝えるべきメッセージがある。このブログの著者が信用できなくても、スタンフォード大学教授で消費者心理を利用したマーケティング理論の第一人者の話は聞いてみる気にならないだろうか? 彼はノーベル経済学賞を受賞したDaniel KahnemanやAmos Tverskyの重要な共同研究者でもある。そしてその彼が、自分の成功をもたらした心理学上の発見を自己否定するかのごとく、新しい時代のマーケティング・コミュニケーションについて論じているのが本書である。真の賢者は自己破壊的な衝動を持つことでイノベーションのジレンマから逃れるものだが、彼の衝動に我々も習うべきではないだろうか。

ウソはバレる―――「定説」が通用しない時代の新しいマーケティング

彼の名はItamar Simonson。マーケティング、特に機械学習モデルと心理学モデルの境界領域をターゲット研究分野に定めた著者にとっては、キャリア上絶大な影響を受けた恩師にも当たるだろう。彼は消費者が商品を選択する際に発生するcompromise effect (1989)と呼ばれる心理学的効果を発見した。それにより、新古典派の経済学者が仮定するような一貫した効用関数を一般消費者が持たない、という事実を劇的な形で示した。Compromise effectや、あるいは別の認知バイアスであるattraction effectと呼ばれる心理現象では、消費者はどのような選択肢が提示されたかによって商品の選好順序を変えてしまう。そこでマーケターたるあなたは、店頭で提示する商品の組み合わせを意地悪く操作することで、割高な商品をいとも簡単に売りつけることができる。この心理学的テクニックは実際に多くの店舗販売で利用されてきた。

  • 便乗宣伝で申し訳ないが、著者は、compromise effectを再現しデータを元に定量予測できる特殊な機械学習モデルを2015年に発表している。論文はこちら

Compromise effectとは、トレードオフの関係にある選択肢集合からは真ん中の妥協した選択肢が選ばれやすい、という現象のことである。例えば下図のように価格と品質とにトレードオフがある選択肢をランダムに分けた被験者に見せる。Windows OSのhome edition, professional edition, ultimate editionみたいなものを想像するのが簡単だろう。この時、存在するすべての選択肢を一度に見せないのが心理実験の肝で、グループ1には選択肢集合{A,B,C}を、グループ2には{B,C,D}を、グループ3には{C,D,E}を見せる。結果はグループ1ではB、グループ2ではC、グループ3ではDが最も人気を得る。見せ方によってB>CなのかC>Bなのかが逆転してしまうわけだ。

NIPS2014

実商品の例が見たい人は下記スライドのpage 5に示した、パソコンを選ぶ例を参照してほしい。

さて、なぜこの現象がマーケティング上そんなに重要なのだろうか? それは絶対効用に基づく競争から逃れるヒントになっているからである。資本主義社会で生きる我々は常に、競合他社との競争にさらされている。たとえ良い製品を作ったとしても、似たスペックの製品を他社が出してきたら? 顧客を他社に取られないためには、同じ値段でさらに良い製品に変えるか、または値下げをして利益を諦めなければならない。ところがcompromise effectに頼ると、たとえ今の製品を改善 or 値下げしなくても、二つの追加の囮の商品: 品質が良いが値段も高い商品と値段が安いが品質も悪い商品を棚に並べておけば、あなたの商品を消費者がさも納得して買って行ってくれるのだ。これは消費者が世の中にあるすべての商品を比較して絶対効用が最大のものを探すことをせず、目の前にある3つの選択肢から相対比較だけを元に選ぶことを強要されていると発生しやすい。

ところがSimonsonは、compromise effectのような心理学効果は今日の実際の購買シチュエーションでは消えてしまうことを確認した。つまりAmazon.comやkakaku.comで類似商品を検索し、種々の商品のレビューを読んで比較して納得した一品を最後にカートに入れるという一連の行動を伴う状況では、目の前の選択肢に集中させて騙す方法が通用しないのである。

彼ら心理学者のグループは、compromise effectを含む認知バイアスが人間から消えたわけではないことも確認している。たとえオンライン・ショッピングであっても、検索行動をさせなかった場合にはcompromise effectが再現する。人間自体が賢くなったわけではないのだ。人間は依然として、有限の記憶しか持たず余計な思考を省こうとする堕落した存在であり続けている。しかし環境は大きく変わった。kakaku.comで同一製品の最安店舗を検索したり、skyscanner.comで所定のルートを飛ぶ最も有利な航空券を店舗横断で探してしまう。製品それ自体の質が不確かな場合でもレビューサイトのおかげでどの競合製品なら欲しいものを代替できるか今日では分かってしまうし、そしてその検索を更に直感的にするiPhone / Androidアプリなどが登場してきた。その結果、怠惰で間抜けな人々であっても新古典派経済学が仮定する合理的なeconomic man (経済人)と似た振る舞いを示すようになってきた。つまるところ、ヘンリー・キッシンジャー博士も真っ青の賢い軍師ではなく、インターネットという最強のパワードスーツを着た本来は非力な村人が今日の消費者であって、その村人がマーケターの仕事を奪おうとしているわけだ。

この大きな変化は、単価が高くて質の評価が容易な商品、例えばパソコンや自動車で顕著になってきている。FMCG (Fast Moving Consumer Goods)のように単価が低くていちいち真面目に検索しない商品や、芸術性を価格に転嫁している商品ではまだブランドの力が残っているだろう。しかしどのような新しいwebサービスがこれら残り少ないブランドの力を奪ってしまうかはわからない。

Simonsonたちは新しい時代の良い点も積極的に説明している。マーケターが刷り込もうとするブランドイメージがなくても、他の消費者のレビューが良ければ製品が売れるケースが出てきた。純粋に良い製品を作った人・純粋に良いサービスを提供するホテルやレストランが評価されやすい時代に変わってきたのだ。また、イメージを刷り込む代わりに、レビューコミュニティに商品の実際の利点を評価してもらうことでも売り上げを増やせる可能性がある。誤った刷り込みのおかげで高い利益率を享受してきた悪党には厳しい時代になったが、本質的な価値を実際に創造する人々には恩恵がもたらされつつあるわけだ。

本書はマーケティングだけでなくバリュー投資にとってもインプリケーションがある。オールドエコノミーに属するバリュー株銘柄の幾つかは、消費者自身の過去の経験への執着を担保としたブランド力によって価値を維持している。FMCGかつ味への執着という恩恵を受けているコカ・コーラのブランドはそう簡単に毀損しないだろう。しかし時計ブランドのバリュー株は再考が必要そうだ。他にも、B2C事業ではブランドが毀損しやすくなってもB2Bのサービスの幾つかは事前に評価することが困難なものもある。クラウド・コンピューティングのサーバーならコストパフォーマンスが客観的で他ユーザーのレビューも参考にできるだろう。一方でクライアント企業の本業ビジネスを変革するコンサルティングは、クライアントにとっての事前評価が難しくブランドの毀損は比較的ゆっくり進むだろう。未来志向のマーケター・投資家の双方にとってmust readな一冊である。

References

I. Simonson. Choice based on reasons: The case of attraction and compromise effects. Journal of Consumer Research, 16:158–174, 1989.