あなたの中にあるコールオプションを見つけて欲しい

前回の投稿 – 大切なことは(実は)ギャンブルが教えてくれる: 集中と分散の両取りと「良い宗教」による演繹はそれ以前の筆者のブログ記事とは桁違いの反響があった。記事に対する意見・質問などはtwitterなどで直接コメント頂いた方を除いて把握していないが、いわゆるpageviewは日頃の記事よりも非常に大きかった。Positive skewnessがもたらす良い方のoutlierの果実をどう取り入れていくのかがメインテーマだったが、wordpress.comに付属しているアクセス解析を見る限りは、この記事自体がoutlierだったようである。

今回はその鏡像である悪い方のoutlier, negative skewnessとどう付き合っていくべきか、少し暗い(?)話をしてみようと思う。その上で、一見negative skewedな報酬しかないように見える環境にも、実はpositive skewedなものが隠れていることがある、アップサイドがないなどと諦めず、読者個人の自分なりの分析をもとにpositive skewnessを見つけ出して欲しいというのが今回のメインメッセージである。

いつものスタイルであるが、メインメッセージ以外にも事例をかなり入れて分量を多くしてある。無理に一度に読まず回数を分けて理解してもらえれば幸いである – そもそも次回の投稿は当分先であるだろうから。社会に広く散見される問題が、skewnessを軸に共通化して議論できて一連のトピックがつながることを体感して頂きたいと思っている。

金融市場においては、多くのリスクプレミアムにはnegative skewness が付きまとっている [1]。投資戦略に関するファイナンス論文をいくつか読むと、小さな利益を積み重ねるが時々大きな損失を被る、ただしそれまで積み重ねた利益を全て吹き飛ばすほどではなく期待値はプラスである性質をもった投資戦略が多いことに気づくだろう。保険販売ビジネスと類似した収益構造である。実は、特に複利で利益を増やす場合において、negative skewnessは多くの問題をもたらすことを最初に数値例で紹介する。たとえば(方向中立な)トレンドフォロー戦略のようにpositive skewedかつ期待値がプラスになるようなリスクプレミアム [2] が手に入れば無理してnegative skewedな資産と付き合わなくても良いのだが、positive skewedなプレミアムを見つけることは想像以上に難しい。一方negative skewedなものは比較的簡単に見つかる。

  • 筆者が機械学習を使って戦略を組む際に、人から要求されずとも強く意識していることの一つに、目的関数や特徴エンジニアリングをいじることでskewnessをゼロか正の値に持っていけないか絶えず探求する、というものがある
  • たとえ同じデータセットを扱っていても、モデルのフォーカスを変えることで違ったタイプの戦略が見つけられることがあり、この仕事の楽しさの一つでもある

この一年半の金融業界での労働経験 (職場にはいわゆる投資銀行から移ってきた人が多く在籍しており、投資銀行出身者の多くは金融業界でのみ働いてきた) も踏まえて、ここで筆者が思い出すのは、現職への転職を決断する際に助言をくれた起業家友人のコメントだ。 「金融業界人はメンタリティが似過ぎていて問題だ」と。この「似過ぎたメンタリティ」はnegative skewedな戦略を選択せざるを得ない市場の厳しさに起因しているのではないかというのが筆者の仮説である。そして、このnegative skewedなプレミアムを稼ぐしかない環境は実は金融業界に限らず広く世界に蔓延していて、日本の職場のモラルの低さもこれと関係しているのではないかという仮説を後半では議論していく。

  • この起業家友人は、自身の広範なビジネス人脈から金融業界の問題を知っている。非金融出身者であるお前の強みを生かすべきだという激励も含めてこうコメントしたのだろう
  • 日本の労働者のモラルについては、実際に日本で働いている読者諸賢は自分にはガッツがあると反論するだろうし、本ブログのような奇妙なコンテンツを読んでくださる方の多くは実際そうだと思う
  • しかし最初の職場でB2Bのビジネスに関わった筆者の目には、多くの日本企業従業員の士気の低さは顕著に映った。これは労働者個人のインセンティブと関係があり後述する

Positive skewedな戦略を見つける実務的困難さと、金融業界の人間が良い意味だけでなく時々は悪い意味でも保守的なこととの間には、双方向にいくらかの因果関係があるのではないかと感じている。野心的で、確率は低いが成功時にはとてつもない報酬がある目標を目指すのではなく、成功確率は高くとも報酬はほどほどのことに集中して挑戦を諦める人、成功者は運が良かっただけと切り捨てる皮肉屋に転落してしまう人は、過去の自分の失敗を思い出すのが辛いのかもしれない。「自分も若かったときは夢を持ってpositive skewed戦略を探したが不可能だった。ベンチャー起業、一攫千金な話は確かに夢があるが、その実態は政府発行宝くじを買うのと同じで期待値がマイナスなのだ」と。Skewnessの正負と期待値の正負は別個の概念であるが、金融市場での取引の多くはnegative skewedでプラス期待値か、positive skewedでマイナス期待値のポジションが多いため、この見かけの相関からpositive skewedだと「常に」期待値がマイナスだと過剰一般化してしまったのかもしれない。Positive skewedだと「多くの場合は」期待値がマイナスであるものの常にそうとは限らない。しかし日頃の労働で認知資源を使い切ってしまった彼らには、「常に」と「多くの場合」の違い、数少ない例外について塾考する余裕がないのかもしれない。

今日のSummary

  • 複利でのものごとを考えない一部の学者・銀行家が本来は合理的な選択を非合理であると言っていることがある。Skewnessの役割を理解することが鍵であり、期待値がたとえプラスでもnegative skewedな投資はpositive skewedなものより小さく賭ける必要がある
  • Positive skewedな起業家とnegatie skewedなサラリーマンの違いはペイオフの構造がコール買いかプット売りかの違いであり、どちらが無条件で優れているということはない
  • 日本のサラリーマンの無気力の根源はペイオフが極端にプット売りに偏っていることにある。従業員個人は合理的に行動しているだけで彼らを非難するのは的外れである
  • プット売りをしている従業員個人には、テールリスクを抑えるDOTMプットを買う投資が過剰に魅力的に移ってしまい、日本社会全体では大きなコストを払う羽目に陥っている。経営者は労働者にコールオプションを売ってインセンティブ構造を変えなくてはいけない
  • 労働者個人も絶望せずに、自分の仕事の中に隠れたコールオプションを探してほしい
    • 金銭のアップサイドがある(=コール買いしている)経営者は実はスキルのダウンサイドを負っている(=プット売りしている)
    • 金銭をプット売りしているサラリーマンは実はスキルのコール買いをしている
  • ただし無節操なコール買いにも問題はある。「労働者のチャレンジ精神を奪う」と非難されることの多い福祉国家システムの実態は株式のロング + プット買いであるプロテクティブ・プット・ポジションであり、ダウンサイドが限定されることでむしろ国民を過剰にリスクテイクさせる傾向がある(=Kelly Criterionを超えて投資してしまう二流ギャンブラー)。福祉政策を推進したい左派政治家・経済学者は、国民のやる気の減退リスクという右派からの的外れの批判よりも過剰投資問題の方に真剣に回答すべきである
  • 負の側面が目立つプット売りも、それを行なっている人たちは社会的には大きな役割を担っている。Negative skewedな投資自体を否定するよりも、むしろnegativeなテールリスクを負う義務が生じた人たちへの社会的理解は大切である。Skewnessはcounterparty間で常に鏡像の関係にある
  • 高次モーメントが発散するような極端にテールリスクの大きい投資を、期待値がプラスであることだけを根拠に合理化し、テールリスクを避けている市政の人を「非科学的」と罵る人を見かけることがある。モーメントが発散する投資は期待値がプラスでも「長期的には我々はみな死んでいる」状況でruinを避けることができない。Kelly Criterionが示唆する許容可能投資水準を例えば参考にして、科学的だと思われている政策提言にも非科学性が隠されていることを認め、専門家は常に自らの判断を再考していく必要がある

行動経済学者が「非合理的」と言ったら疑おう

まず最初に紹介するのは、前回導入したKelly Criterionの、skewedな場合への拡張である。一般の連続値確率分布のケースを導入するのはしきい高く感じる読者もいるだろうから、離散化した単純例を導入しよう。ここでは次の二つのクジのどちらが魅力的か考えてもらいたい。現実世界とは違って確率分布が事前に完全にわかっているため、帰納につきまとう推定誤差のことは忘れて、今は演繹的思考に集中してもらえば幸いである。

  • くじA: 5%の確率で掛け金を全額失う。90%の確率で掛け金の10%を手に入れる (1.1倍になって戻ってくる)。残り5%の確率で掛け金の20%を手に入れる (1.2倍になる)
  • くじB: 5%の確率で掛け金の11.5%を失う (0.885倍になる)。90%の確率で掛け金の1.5%を失う (0.9985倍)。残り5%の確率で掛け金の108.5%を手に入れる (2.085倍)

くじAとくじBは一度選んだらもう片方は二度と選択できない、ただし選んだクジにいくら賭けるかは自分でコントロール出来て、選んだ方の賭けを何回でもやることができるとしたら、貴方にはどちらが魅力的だろうか? 筆者の回答を見る前に少し考えてみてほしい。


行動意思決定論―経済行動の心理学

くじAは大概の場合は少し儲かるが低い確率で大きな損失を被る。一方のくじBに賭け続けると長い間少しずつお金がなくなっていくが、たまに大きな利益を得る。

筆者にはくじBの方が魅力的である。直感の時点でそうであるし、数理的に分析してみても同じ結論だ。しかし学会等で業界が長い人と雑談してみると逆の観察が得られる。一部の経済学者 (このケースでは行動経済学者が該当する)や銀行家は、くじBをくじAよりも選好する筆者は非合理的であるとのたまうのである。これを最初に聞いたときには正直驚いた。本当にそう思っているのか? 筆者を騙してお金をむしり取るために、銀行家たる彼らはバカのフリをしているだけで、実は彼らもBを選ぼうとしているのではないか? 貴重なくじBへの投資機会 (良い投資機会というのはそんなに無数にあるものではなく、普通は誰がそのプレミアムを取るのかの競争になる) を筆者に渡さないために、Aが魅力的であるという屁理屈をでっち上げて騙そうとしてるのでは? それとも、仕事上パワハラか何かを受け続けてきて正気でないなどの理由で知性が働いていないのか?

  • 幼少期より中国の歴史に親しんできた筆者としては、敵を買いかぶり過ぎて小さく失敗するのは構わないが、敵を侮って致命的な損失を負うのは恐ろしい
  • よってこういう場合は常に、相手はバカではなくて単に筆者を騙そうとしているだけである、と考えることにしている。敵は常に最強の知性を持っていると仮定する方が安全である – それこそ経済学でスタンダードに使われるゲーム理論が想定すること(=∞-stepの予測ができるエージェントで満たされた世界を仮定する)だ

彼らのロジックはこんな感じである。基礎の確率論 or 統計学で習う概念である平均と標準偏差を評価せよと。計算すると以下のとおりである。

  • くじA: 期待値 +5%, 標準偏差 24.19%
  • くじB: 期待値 +3%, 標準偏差 24.19%

「リスクの指標である標準偏差が同じで、期待値がAの方が高いのだから、Aが優れる。投資戦略の評価に使われるシャープ・レシオ(*)が くじBはくじAの60%に過ぎない。この計算結果を見てもわざわざBを選ぶのかい?」

(*) 平均を標準偏差で割ったスコアで、高ければ高いほど良い賭けであるとされる

しかしこの分析は的を射ていない。筆者の予想にすぎないのだが、金融業界に染まっていない読者諸賢の多くも同様に、別に数理的分析など講義されなくてもくじBを選んだのではないだろうか? 生半可な確率論知識こそが本来の人間の生存能力を奪ってしまう – 学校によって学生が却ってspoilされてしまうというよく聞く話 – がこんな場所でも発生するのである。

問題はこういうことだ。定額を賭け続けるのであれば確かにAを選択すべきだ。たとえば毎日このくじに1万円ずつ払うつもりであれば十分な時間たったあとには、AがBよりも大きな財産を残してくれるだろう。しかし常に調達可能と仮定されたその1万円は実際にはどこから調達してくるのか? 儲けが続いた後と、運悪くダウンサイドの5%をうけた後とで同じ金額を賭けられる保証がどこにあるだろうか。さらには、資産がたとえば1000万円規模に溜まったときも1万円、1億円溜まっても同じ1万円しか賭けないのは利率を考えると不自然なシナリオではないか? お小遣いが月500円だった小学生の頃は100円の出費を超真剣に考えていたが、月収が50万円になった今は10万円の出費を真剣に考えていることとと同じである。定額 ではなく定率で賭ける場合を考えないと非現実的なのである。

ここで前回と同様にKelly Criterionの対数期待値最大化原理が役に立つ。資産のうちどれだけの割合をくじAまたはくじBに賭けるべきだろうか? 解の導出過程は省いて数値結果だけ示すと、以下のとおりである。

  • くじA: 資産の47.40%まで賭けてよく、その場合は一回あたり+1.42%で資産が増えていく
  • くじB: 資産の100%を賭けてよい。一回あたり+1.72%で資産が増えていく
  • くじB (無利子で借金が可能な場合のレバレッジ最適解): 資産の48.85%を借金して、148.85%を賭けて良い。一回あたり+1.85%で資産が増えていく

最後のレバレッジ解は現実世界では最大ロスが完全に-11.5%で止まっていたり無利子借金できるケースが稀なので実用的ではないが、株式の代わりにコールオプションへの投資を考える場合の参考にはなる。そしてレバレッジなどかけなくても、くじBの方が複利での資産増加率がくじAより高いことが一目瞭然である。

  • なおこのくじA, Bのケースは解析的にも解くことができる。筆者は数値計算で出した
  • 今回のケースに限っては三次方程式の解の公式で解析的に導出できる。しかし現実世界の一般ケースでは確率分布はもっと複雑であり、モンテカルロ法を用いた数値計算に頼る必要がある
  • 余談だがこの手の数値計算には筆者はpythonのscipy.optimize.minimizeパッケージを愛用している – ver 1.1.0から内点法による制約つき一般非線形最適化モジュールのtrust-constr solverが入ってやれることが劇的に広がった。scikit-learnRegressorMixinクラスおよびClassifierMixinクラス, TransformerMixinクラスを拡張して内部的にはscipy.optimize.minimizeを呼び出した独自機械学習モデルクラスを作るのが筆者のスタイルである。筆者の真似はせずとも、読者諸賢も各種ソルバーの性質や利用可能制約について知っておいて損はないと思う

さて、厳密な最大資産増加率の計算はコンピューターに頼ることにはなったが、AよりBを好む直感自体は別におかしくなかったではないか。定性的にはこういうことだ: 確かにくじAはくじBよりもシャープ・レシオが高いが、一発退場のリスクがあるため一回あたりの投下可能金額に制限がある。一方くじBは、一回あたりではどんなにダメージを食らってもたかだか-11.5%で底がキャップされているため大きな金額を賭けても生き残れる。Bはたとえシャープ・レシオで負けていても、投下可能金額とシャープ・レシオの合わせ技で、シャープ・レシオ単独のAよりも優れた賭けに変わるのである。

たとえばプロスペクト理論における極小確率の過大評価 [3] など、行動経済学でアノマリー・非合理とされている人間の行動のいくらかは、生き物が本能的にpositive skewedな戦略を好むところから来ている。その副作用として、期待値マイナスが確定している政府発行宝くじまで買ってしまうのは確かに問題だが、期待値プラスのものを見つけられる前提であれば、positive skewnessの選好は長い目で見た生存と繁栄を目指す上で理にかなっている。

行動経済学者が人間の行動を非合理的といったときに、非合理的なのは直感で行動している人間の方ではなくて用いるべき解析技術を間違えた行動経済学者の方であるケースがしばしばある。筆者も以前の研究で例えば [4] で行動経済学と関わったし、行動経済学・認知心理学からは研究の幅を深める機会をもらった。なので行動経済学の既存成果を全否定する気はないが、経済学者が合理的と主張する意思決定はよく考えると実は直感よりもむしろ不合理な場合が多々あることを覚えておいてほしい。確率分布が完全に既知で帰納が不要な今回のケースでさえ、ナイーブな解析が非合理的な選択を合理化しようとした。確率分布が不完全にしかわからず帰納が混じるタスク (ヘッジファンドが扱うケースも含む) では、従来合理的とされたものが非合理的で、非合理的とされたものが実は合理的なケースがさらに増えていく。


ファスト&スロー (上)

平均・分散あるいはシャープ・レシオの罠

定額で考えた場合と定率で考えた場合で有利不利が逆転してしまう、というのは現代生活に毒されてしまった人には自明ではないようである。シャープ・レシオで劣るくじBがなぜ、くじAよりも優れていることになったのか? 答えは、Kelly Criterionの中に、同一平均・同一分散であればpositive skewedな戦略を好む性質がビルトインされているからだ。複利での資産最大化は、より経済学的表現を使えば対数効用関数 (logarithmic utility)最大化 と呼ばれる前回と同様、ある賭けの損益 (Profit & Loss: PnL)を確率変数Xであらわし、資産のうち\alphaの割合を賭けるとしよう。最大化すべき目的関数はU_p(\alpha)\triangleq{\mathbb E}_{p(X)}\left[\log (1+\alpha X)\right]である。確率変数X4次モーメントが有限であると仮定し、確率分布p(X)で積分される項をテーラー展開した上で各項を積分することで、以下の式(1)が導出される。

U_p(\alpha)=\alpha \underbrace{{\mathbb E}_{p(X)}[X]}_{mean} - \frac{1}{2}\alpha^2 \underbrace{{\mathbb E}_{p(X)}[X^2]}_{\simeq variance} + \frac{1}{3}\alpha^3 \underbrace{{\mathbb E}_{p(X)}[X^3]}_{\simeq skewness} - \frac{1}{4}\alpha^4 \underbrace{{\mathbb E}_{p(X)}[X^4]}_{\simeq kurtosis} + o(\alpha^4)    (1)

  • 4次モーメント有限の仮定は一般には成り立たず、現実にそのようなケースはしばしば存在する。そのようなクリティカルなケースではより慎重に考える必要があり、原子力発電と遺伝子操作を例として最後に議論するが最初はモーメント有限のケースで議論しよう

式(1)の第一項は確率変数Xの平均そのものに比例する。第二項は正確には(分散+平均の二乗)に比例しているが、通常この手の賭けは期待値に比べて標準偏差の方がずっとオーダーが大きい(=S/N比が小さい)ため、ほぼ分散に比例する。第三項がこれまで議論してきたskewness (歪度)と関係する。そして第四項はkurtosis (尖度)と関係する項である。小さな損失がたくさんあり大利益がたまにある確率分布では歪度はプラスの大きな値を取り、逆に小さな利益がたくさんあり大損失がたまにある確率分布では歪度はマイナスの大きな値になる。正規分布のような対称な確率分布では歪度はゼロである。尖度は確率分布の裾野の重たさを表現する統計量であり、大利益 or 大損失の確率が10%の分布よりも1%の分布の方が大きな値をとる。0.1%になれば更に大きな値をとる。

\alpha>0の場合の第一項から第四項それぞれの係数の符号を見て欲しい。効用関数U_p(\alpha)は平均が高いほど良く、分散が低いほど良く、歪度が高いほど良く、尖度が低いほど良いことがわかる。つまりKelly Criterionの最大化は、平均が高くて分散の低い(つまりシャープ・レシオの高い)投資を一応は好むが、同じシャープ・レシオなら歪度が正(positive skewed)の大きなものの方が好まれるのである。一方で前回議論した、アップサイドに魅惑されて賭けすぎる二流ギャンブラーが示唆するように、たとえpositive skewedであっても成功する場合の確率が極端に低いと四次モーメントが大きすぎて効用が落ちることにも気づくだろう。

Positive skewnessの場合は尖度が高すぎないよう注意すれば良いが、negative skewedでテールリスクがある投資は歪度の項と尖度の項の双方においてdiscourageされる。シャープ・レシオという指標は三次以降のモーメントを無視できる場合のみに有用なのであって、単にシャープ・レシオ最大の投資を選ぶといずれ痛い目に会う。モーメントに着目すると、以下を覚えておくと良い。

  • Kelly Criterionを最大化する場合は確率変数Xの全ての高次モーメントが効用に影響する。\log(1+x)をテーラー展開した場合は無限に項が継続するため
  • \alphaが小さい場合には低次モーメントだけでだいたいの投資成績が決まる。規律を持って少額を賭けている限りは統計学の基礎で習う指標だけで判断しても問題ない
  • 平均がプラスである限りは、分散やnegative skewnessが大きくても利益を上げること自体は可能である。掛け金を0.1%、0.01%といった小さい値にもっていけば一次の項しか関係しないためである。ただし最終章で議論するモーメントが発散する場合を除く
  • 高額を賭けるときに少額で賭けるときの基準を適用すると痛い目にあう。高額の賭けでは、平均のような低次モーメントよりも高次モーメントの方がクリティカルになるため

Negative skewedかつ期待値が正の賭けはたくさん存在し、規律を持って掛け金を小さくできるならそのような賭けを行っても問題はない。規律を保てなくなる原因は、多くのケースでは帰納の誤りにある。小さな成功体験を納めすぎると、真の勝率が実は95%しかないのに99%あると勘違いしたりする。その結果Kelly Criterionで許される金額を超えて賭けてしまう。Left tailが重たい場合はもっと悲惨である。本当は成功確率99.5%なのに99.9%あると勘違いし、少額利益のために0.5%の確率で大災害が起きるような巨大なリスクを取ってしまう。そして、いずれやってくる大災害で破産もしくは債務超過になる。お金だけの話に限定しても、自己破産が許されなければ貴方は高利貸しの言いなりになってしまうだろう(注: 2018年現在日本では救済としての破産は可能なので、本当に困っている方は素人考えで変な行動を起こさず弁護士にまず相談すること)。お金よりもっと大事な人類全体の課題に対する一般的な投資のケースでは、我々は二度と復活できない。たとえ真の期待値がプラスであっても

大損失の発生確率または発生時の損失の大きさを過少評価する戦略上の間違いは、金融市場ではオプションを売る投資家に散見される。典型的にはDeep Out-of-The-Money (DOTM)のオプションをキャッシュでカバーできる許容金額を超えて売ってしまう人たちで、資産価格がジャンプして動いたときにこの手の暗い話題は事欠かない (DOTMが何なのかわからない読者諸賢は特に気にする必要はない。地震保険を売るのと同じだと思えばよい)。

オプション投資から学べることはビジネスや人生設計に大変有用であるので、今回の議論ではオプション用語を使わせていただく。以降の議論でもオプション・プライシングの数理などは特に使わないが、オプション取引に馴染みがない人のためにコールオプションの買いとプットオプションの売りという単純な二つの取引がどういう性質を持っているか少しだけ紹介する。すでにオプション取引の経験がある人は次節は飛ばしていただければ幸いであるし、また初めてご覧になる方も筆者の主張を理解するのにオプション・トレーダーの深い蘊蓄は必要ない。

その後、これらの単純な二つの取引と類似したビジネス・仕事が世の中のいろいろな場所に転がっていることを観察し、それぞれのペイオフ構造がどのような問題を引き起こすか、どのように変えていけば良いのか見ていこう。

      • なお巷の金融工学のテキストの多くは結局のところオプション価格の期待値がどうあるべきか or なるかを議論しているだけである。平均だけを見るリスク中立の世界は、複利で賭けていく投資家にとっては参考になることが少ない
      • どのようなネーミングが適切かわからないが、「対数期待値中立」みたいなプライシングの概念があったら筆者も学んでみたいので、もしご存知の方がいれば文献を教えてほしい
      • 現在のところ、筆者が個人的にオプションを評価する上で重視するのはリスク中立価格と市場価格の差ではなく、(1)式のU_p(\alpha)を最大化する\alphaにおいて、p(X)にある程度の精確な推定値を用いたときに効用が実際にどのような値になっているか、つまり実現可能な最大対数増加率 \max_{\alpha} U_p(\alpha)である。この評価方法は金融工学専門家が見たら首を傾げるかもしれないが、筆者はこれに深く納得している
      • プライシング理論よりも注意すべきなのはむしろ、p(X)のオーバーフィッティング、推定誤差の過小評価である。p(X)の推定値の不確実性を効用にどう反映するか考えるわけだが、古典的なブートストラッピング、あるいはBayesian bootstrap [5] は個人的にはとても役立っている
      • この蛇足まで読んでくれた方のために、オックスフォードの地の利のおかげで筆者が手に入れた知見をもう一つシェアしておこう。ベイズ推定における不確実性の評価方法のスタンダードは事後分布の解析評価 or 事後分布からのサンプリングだが、この事後分布はモデルが正しいときのみに正確な不確実性を与える(正確不確実性って不思議な表現だね)。仮定しているモデルのクラスが真のデータ生成過程を含まない場合に、ベイズ推定は不確実性を過少 or 過大評価する(過少評価が大半)。モデルのmisspecificationを許す場合の正確な不確実性の評価法にはいくつかあるが、たとえば [6] では真のデータ生成過程が、中心が仮定されたモデルそのものであるDirichlet processからのサンプリングであるというメタモデル化を行っている。その結果、Bayesian bootstrapとMAP推定の組み合わせがmisspecifiedモデルに対する不確実性評価の優れた方法であることが示されている。計算時間のかかるMCMCを行わずともbootstrap標本を数百程度生成して、それぞれの標本上でMAP推定をするだけで非常に良い不確実性評価ができていたわけだ。統計学部のChris Holmes教授はmisspecifiedなモデルにおけるベイズ推定について多くの成果を出しているので、興味がある人は参考文献を辿ってみると良い

コール買いと起業家・研究者

大半の労働者にとっては、景気が良くなった方が生活が安定し幸福度も上がる。株価と経済状況の相関がプラスであると言ってしまうのは実はとてもナイーブなのだが(歴戦の投資家先輩方から怒られてしまうであろう)、説明の簡便さのために、経済が良くなること、売上が増えること、仕事がうまく行くこと、給与が上がることなどポジティブな現象全般を単にアナロジーとして「株価が上がる」と表現することにする。そして多くの人が株価が上がる方向に賭けている世界を考える。

同じ株価の上がり方でも、人によって賭け方が違うため、利益の享受の仕方が異なってくる。株価が+30%上がった場合でも、ポジションの取り方によって+60%になる人や+10%で終わる人などいろいろな取引がある。上場企業C社の株価が上がる方向に賭ける場合、簡単なものでも以下の三種類の取引を行うことができる。最初の選択肢である原資産の株式を買う場合は、アップサイドもダウンサイドも一体となって享受するだけである。

  • C社の株式を買う
  • C社のコールオプションを買う
  • C社のプットオプションを売る

2番目の選択肢について、特にOut-of-The-Money (OTM)のコールオプションを買う場合について説明しよう。たとえばC社の現在株価が$100だとする。1年後に$120で株式を買う権利はコールオプションと呼ばれ、これが例えば一株あたり$0.5で売られている。もし株価が本当に大きく上がって一年後に$130になった場合、権利行使して$120で買って$130で売れば差額の$10が手に入る。権利自体は$0.5で買っていたのだから、$0.5が$10になって掛け金の20倍が帰ってきた! 原資産をそのまま$100で買っても$100が$130になるだけだが、もしOTMのコールオプションを買えば$100 / $0.5 = 200株 分のオプションを買うことができ、本当に株価が上がれば $100が$130ではなく$2,000に化けることになる。

無論こんなうまい話は実際には殆どない。株価が$130になる確率はごくわずかであり、むしろ一年後も$120未満である可能性の方がずっと高い。もし$100を全額OTMコールオプションに投下して、株価が上がらなければあなたは破産である (賭けすぎの二流ギャンブラー)。しかし投下金額を$100ではなく例えば$10に減らすことで最大損失を$10に限定しつつ、アップサイドも+$30ではなく+$100に増幅することができる。これでも楽観的すぎで、現実の金融市場では、殆どの場合において理想的なポジションサイズは更に小さいものだろう。

つまりコールオプションは、ダウンサイドを限定しつつアップサイドを拡大するギャンブル・安全弁のついたレバレッジとして用いることができる。その代わり成功確率が低くなる代償が存在する。株価が$110まで上がった場合、素直に株式を買っておけば+10%のリターンはもらえたのにOTMコールオプションの場合はゼロである。


グリーンブラット投資法 ──M&A、企業分割、倒産、リストラは宝の山

それでも、ダウンサイド限定・アップサイド拡大の双方を併せ持つ魅力が強すぎるゆえ、宝くじ買いをする投資家が後を絶たない。それを見透かしたオプションの売り手、たとえば前述した銀行家や、手持ち株を利用したカバードコール戦略で小遣いを稼ぐ機関投資家は、ここぞとばかりに宝くじを高値で売りつける。最初の例のように$0.5で買えた場合はいいものの、$1、$2とコストが増えるに従い確実なダウンサイドであるコストに対する不確実なアップサイドが見合わなくなっていくことを想像してほしい。コールオプションの買い手にとって重要なことは、売り手が成功確率を過少評価しているような投資機会・優れた企業を見つけ出し、売り手がその誤りに気づく前に買うことだ。これはつまりところ、起業家や研究者が他人からバカにされている・過小評価されているビジネス機会や研究テーマを見つけ出して先に着手することと似ている。たとえ夢はあっても成功確率が低いのも同様である。

コール買いをすると、なかなか簡単に成功が出ないので、来たるべき日が来るのはいつだ、まだかまだかと「イライラ」することになる。

プット売りと保険屋・サラリーマン

第三の選択肢に使われるプットオプションは、株価を指定された行使価格で売却する権利である。プットオプションを「売る」投資家は、株価が下がった場合に時価が行使価格より低くて割高な行使価格でも株式を買い取る義務に同意する。プットオプションの買い手は株価が暴落した場合の恐怖から解放されるために、保険を売り手から購入するのである。

プット売りのペイオフを簡単に見ておこう。C社の株価が$100から残念ながら$60に下落してしまったとする。一方のあなたは行使価格$80のプットオプションを他の投資家に販売し、保険料$5を先に受け取っていた。しかし残念ながら時価$60の株式を引き取ることになり、差額$20の損失、プレミアムで少し軽減されて正味$15の損失を負うこととなった。

ただしこのようになるケースは希である。株価が下がったといっても$85までしか下がらなかった場合、買い手は(誤発注などをしない限りは)プットオプションを行使しないので、あなたが株式を買い取ることはない。結果としてあなたの手元には$5残る。株価が$100のまま、$110に上がった場合、$130に暴騰した場合も買取は発生しないのであなたの売上$5は残る。

つまりOTMのプット売りは基本的には株価の上昇局面で利益が出る。ほぼ確実に少額の利益が得られるが、低い確率で大きな損失を負う。とはいえ、株価の暴落局面やバブルの疑いがある局面では投資家は恐怖にかられるため、高い保険料の支払いに同意することが多い。その結果、注意深く取引していればプット売りも期待値をプラスに持っていくことができる。

C社が顧客を独占できるような画期的な技術を開発して株価が暴騰した場合でも、あなたの利益は一定金額である。しかし逆に大スキャンダルが起きた場合にはあなたは大きな痛みを味わう。保険販売はプットオプションの販売そのものだが、たとえば(特に日本で)サラリーマンとして会社に勤務することもプット売りに酷似している。成果が並でも凄くても毎回一定金額のサラリーをだいたい受け取るし、名の通った一流企業であれば今までの業務通りのやり方をしてもだいたいは利益が維持できる。ただし低い確率で、勤務先のビジネスは新興のベンチャー企業や異業種参入してきた海外資本などに根幹からdisruptされ、ある日突然集団リストラ。手に入ると思っていたサラリーがいきなりゼロになった(生活費を考えればネット収支はマイナス)、などという事態に陥る。ベンチャー企業にdisruptされるなんてアリエナイと言ってるみなさん。Apple (この会社はベンチャーですらなかった)のiPhoneが出たあとNokiaがどうなったのかを思い出して欲しい。一時期ニュースを騒がせた「想定外」である。

Disclosure: ただし筆者個人はNokiaが好きでイギリスで購入した携帯はNokiaブランドのHMD Global製である。新興企業のHMD Global社がこれから何をしてくれるかは分からないが、Nokia復活の日を見るのが個人的な楽しみである (そのためにはHMD Global社は今までのプロダクトと少し違った何かには賭ける必要があるが)

プット売りをすると、低い確率の大暴落に対する恐怖と戦うことになる。その結果、プットセラーは「ビクビク」した生活を送ることになる。

プット売りサラリーマンの恐怖と無気力

イライラしているコール・ロングとビクビクしているプット・ショート。雇用主からの報酬パッケージがほとんど定額サラリーで占められており、RSU/ストックオプションやボーナスといったアップサイドが雇用契約に含まれないタイプのサラリーマンは、プット・ショートonlyのポジションを取っているに等しい (債券ロングとどちらが近いか思案したが、大企業の経営危機が増えた最近はプット・ショートの方が実態に近いと思う)。成功確率は高いがアップサイドが上限キャップされている一方で、もし業界変革でリストラになったりすると大きな損失を被るプット・ショート、サラリーマン報酬にはnegative skewnessが伴う。それでも多くのサラリーマンが、少なくとも先進国では自分と家族を養って無事に引退していくことを考えれば、このプット・ショート・ポジションの期待値自体はプラスである、と言ってよいだろう。

  • なおサラリーマンでもこれに該当しない業種はいくつかあり、たとえばスタートアップの初期従業員やヘッジファンド社員の実質ポジションはOTMのコール・ロングとOTMのプット・ショートの合成になっている。fixed incomeとコール・ロングの組み合わせゆえに転換社債ロングにも似ているが、ここではその議論は省く

ここで「期待値プラスでもnegative skewnessの場合は賭けすぎに要注意」の議論が出てくる。レバレッジをかけるなど基本的には論外である。自分という資本が100%しかないのに150%とか200%をプット・ショート的ポジションに張ってはいけない。具体的には、不必要な長時間労働をしたり、アップサイド固定の副業をしてはいけない。自分の健康を担保に将来から借金をして、直近のお金を稼いでいるだけにすぎないからだ。少し余計な病気にかかっただけでこのポジションはすぐ破綻する。サラリーマン就労自体は期待値がプラスの賭けであるが、労働集約的な副業でレバレッジをかけると対数期待値がマイナスの領域に突入してしまうことになる。

  • Negative skewedポジションのレバレッジ禁止から示唆されることとして、副業をする場合に選ぶ仕事はサラリーマン的なものは避ける必要がある
  • 起業家/研究者的な何かでしかも少額betができるものが望ましい。データサイエンティストならkaggleの比較的新しいタイプのタスクで小遣い稼ぎとか (スキルが水準に到達している人に限るが)
  • 長時間労働を要求されても、同業者が身につけることのできない特別スキルが身につかない限りは拒絶すること。企業は「残業を拒否できない」と雇用契約書面に書くものだが、不要な残業が発生しないように顧客との交渉をする責任は企業側と労働者双方にある。個別に交渉する勇気があなたにないと、レバレッジによるもっと大きな損失がやってくる
    • 一方でその特別業務にスキルと特殊知見獲得の莫大なアップサイドがあるなら、その余計な負荷に没頭してみても良いことになる
    • その場合でもリスクを抑えるためメインの業務量を減らす必要性は変わらない

長時間労働 or 副業によるレバレッジは、ある程度常識が働く人なら回避できるかもしれない。しかし過労死等の痛ましいニュースがまだ日本社会に残ることを見る限り、全ての人が正しくこの過剰レバレッジを回避できているとは言い難い。成長のために借金によるレバレッジをかけろとフェイク・アドバイスをしてくる大人たちも罪深い。ただしく長期成長するためには借金を伴わないタイプのダウンサイド限定レバレッジ機会を「探す」必要がある。間違っても今すでに確定している業務を単に物量増やしてこなすことは正解ではない。この辺りの意思決定で必要となるセンスは、資産運用と自分のスキル開発とでほぼ同一である。

しかし常識をもって借金は回避できたとしても(ネットのポジションはキャッシュ・セキュアード・プットと同様になるだろう)、低い確率の大きなダウンサイド自体は依然としてサラリーマン生活に付随し続ける。筆者の個人的印象では、この恒常的なダウンサイド / プット売りに起因する恐怖と無気力が、日本の労働者たちの活力を奪っているように映るのである。

悪魔のモラルハザード契約: ネイキッド・プットをスプレッドに変えて無気力続行

プットオプションを売るだけの取引がリスクが大きすぎると感じるときに、リスクを限定するためのポジションの一つにブル・プット・スプレッドがある。OTMのプットを売ると同時に、より行使価格の低い (よりskewedな) OTMのプットに買いを入れることで損失を限定する。保険を売りつつ、再保険会社と契約するようなものだ。ブル・プット・スプレッドにもnegative skewnessは残るのだが、left-tailをキャップする効果があるためテールリスクは大幅に減少する。単なるプット・ショートよりも大きなポジションが持てるようになる。

あなたがプット・ショートせざるを得ないサラリーマンだとする。ある事業がすごくうまく行っても会社が利益の大半を持って行ってしまい、あなたにはアップサイドがない。一方で低い確率の大暴落を受けた場合、それがあなたの選択の失敗に起因するものだった場合、社内で非難大合唱が始まり精神を病んでしまうかもしれない。あなた個人のせいではなかったとしても、部署全体が取り潰しになり今後の生活不安が爆発する。そんなときに、取引先会社がさらなるOTMプット・保険を売ってあげるよ? と提案してきた。何ということだ。これで自分の人生は安泰だ・・・そんなデタラメな話があるかと読者諸賢は訝しむかもしれないが、筆者の見立てでは日本の企業間取引 (Business to Business: B2B)ではこれが蔓延している。

ITベンダーとの共同プロジェクトで、競合関係にある2社が異なる提案を持ってきた。ユーザー企業であるあなたはどちらを選ぶだろうか?

  • ベンダーA: 一定の成果がほぼ確実に期待できるプロジェクトを提案してきた。そして納期がXXX日以上遅れた場合には全てのコストをベンダーが負担する保証が入っている
  • ベンダーB: 面白く新しいビジネスモデル開拓につながりそうだが失敗する可能性の高いプロジェクトを提案してきた。失敗覚悟で我々の投資資金を「賭ける」べきだと説得された。ただし失敗の責任はベンダーではなく我々にある

こういう営業・取引交渉が何百・何万と行われている世界を考えよう。マクロな経済システムの発展を考えたときに、ベンダーAを選択する企業が大半になると日本社会にとっては悪夢である。個々の企業あるいは企業内部署はベンダーBが提案するプロジェクトのように、positive skewedリスクを取る必要がある。ただし種々の異なるプロジェクトに分散投資することでドローダウンを抑えていく。もしあなたが謂わゆる賢明な独裁者で全ての契約に口を出すことができるなら、ベンダーBタイプを選定する強い圧力をかけることになるだろう。

だがベンダーBを採択するよう促すのに、冷酷な独裁者による強制は別に必要ない。ベンダーBを選んで、うまく行った場合には担当者である社員にもどーんとアップサイドの成果報酬を渡す、つまりコールオプションを売ってあげるだけで十分なのだ。わざわざ社長が説教しなくても社員はBを選択するだろう。

しかし、日本のB2Bビジネスに触れたことがある人はすでに分かっており、馴染みがなくかつB2B企業への転職を考えている人は覚悟して欲しいのだが、日本企業の社員はベンダーAを好むことが大半なのである。なぜか。その答えは従業員個人が意思決定する点にある。

端的に言って、この現象は経営者が社員をincentiviseする方法を間違えたがために起きている。従業員にとってはベンダーAの選択は完全に合理的である: ベンダーBを選んでも利益は社長か資本家が持っていくだけだ。一方で高い確率の失敗は自分たちのせいにされる。一方ベンダーAを選んでおけば、万が一の失敗も彼らに責任転嫁できてクビを回避しやすい。どちらもアップサイドはないが、ベンダーAにはダウンサイドのプロテクションがついている。こんなことを多くの従業員が考えているせいで、B2B取引では保険を買うことばかりに頭がいき、肝心の事業の強化・収益力の向上を目指す本質的なプロジェクトは過少投資される。

B2B取引で経験の長い営業マンは、顧客企業ではなく顧客企業の従業員個人の潜在欲求を満たした方が売上が増えることをよくわかっている。彼らは顧客企業全体の将来のビジネスのことを本質的には考えない。代わりに、保険が欲しい従業員の心を買収して確実にディールを締結させる。さて、多くのディールのおかげで歩合ボーナスをもらうこの営業マンと責任回避を達成した顧客従業員は満足かもしれない。でも大局的に見たら我々は何をやっているのか? 日本社会の悪夢がまた一歩、実現に向かって前進してしまった。

このような状況でお偉方は「若手はチャレンジ精神が足りない」などと明後日の説教をする。しかし根本的原因を想像してほしい。元はといえば、事業成功時のアップサイドを渡す契約を忘れた経営者が愚かなのである。何の成果報酬もないのにわざわざリスクをとる人物がいたら、人格は高潔だが知性がむしろ足りないとさえ言える。だから経営者のみなさん。こんなことを続けて自社の競争力が弱っていくのは暗黒時代への片道切符でしかないのだから、なんとかしてコールオプションを社員に渡してあげましょう。そしたら社員も保険買いをやめてリスクテイカーに変わってくれる。誰のプロジェクトが成功するかはわからないが、誰かはいずれ画期的な発見をする。社員に自社株買いを奨励するのも良いが、現物自社株だけだとこれらの社員にとっては少々レバレッジが足りない。株主に配当やキャピタルゲインを渡すためには、社員を良い方向に刺激してとにかくまず収益力を強化しないといけないのである。

経営者に全ての責任があるとは言わない。経営者が従業員のincentivisationを訴えても却下してしまうような、株主にも問題があるかもしれない。しかしそのようなコミュニケーションも含めて重い責任があるからこそ、経営者は大きな報酬を受け取る資格があるのである。経営者は努めて、そのような株主ではなくて真に投資眼のある株主を集めるようコミュニケーションを図らなくてはいけない。Amazonにおいて、ジェフ・ベゾスCEOがともかく新しいチャレンジをした社員には結果に関わらず表彰していたことを思い出そう。


ジェフ・ベゾス 果てなき野望

お金だけではないアップサイド

さて、ここまでの議論だとサラリーマンは踏んだりけったりにも見えてしまう。期待値プラスであること以外は何も救いがない。一方の経営者・資本家はやりたい放題・・・などと勘違いするのは経営者と話したことのない労働者だけである。サラリーマン家庭に生まれた筆者も30歳ごろまでそうだったが、友人が起業や経営に関わるようになってから違う見方もでてきた。

実は、経営者はお金のアップサイドと引き換えにスキルのダウンサイドを負っている。上場企業であれば投資家とのコミュニケーション、各種事業責任者から上がってくる情報の整理と資本配分の再考といった膨大なプロセスをこなしていく多忙な日々のせいで、たとえば元々は一流のソフトウェア・エンジニアであった人も気がつくとテクノロジーの最先端がわからなくなっていたりする。本質的には経営者は資本配分のスペシャリストであって、それ以外のことを担当者にdelegateする必要がある。しかし配分を適正化するだけに足る市場と自社技術の現在および将来に関する深い洞察は常に持っていなければならない。忙殺は資本配分に必要な後者のスキルを奪ってしまうことも多い。そこまで含めてマネジメントするのが経営者の責任であるわけだ。経営者が「忙しくてよく考えられない」と感じたら、その経営者はそもそも仕事をしていない。

アマゾンのベゾス氏:1日3つ良い決定をすれば「仕事は十分」

一方で金銭的成果報酬部分のレバレッジがあまりない労働者であっても、スキル向上機会のアップサイドには恵まれていることが多い。保守的であると型に当てはめられて説明される大企業では、実際には多くのスキル向上機会が提供されている。規模の経済に必要な関係で運用されているインフラが巨大であり、利害関係人物が多様であることによるものだ。

  • なお自分の会社では金銭もスキルもアップサイドがないと、何度真剣に考えてもあなたがそう思うなら、それは実際におそらく転職しなければならない状況だろう

労働者は実際にはスキルのコールオプションを雇用主から買っている。このオプションを手に入れるために、従業員は、経営者あるいはもっと金銭的報酬が多いがより忙殺されている人々よりも低い現在賃金に同意する(プレミアムを雇用主に払う)。その代わり、雇用先企業のインフラおよび人的ネットワークを使って、self-employedで働いていた場合では到底手にできないスキル獲得を狙う。このコールオプションは、可能性としては獲得したスキルをレバレッジして将来大きく稼ぐ宝くじになっている。スキルが獲得できる保証自体はなく従業員自身のリスクテイクによるものであるのも金融市場のコールオプションと同様だ。しかし実際にオプションがstrikeした場合には、同じ雇用主のもとで大出世するのも、他社に高額で引き抜かれるのも、はたまた自分が起業するのも、何でもアリである。雇用契約のもとで開発した知的財産自体は雇用主が差し押さえるものであるが、その知的財産を生み出すにいたったプロセスから獲得した、あなたに隠された膨大な経験を会社が差し押さえることは実質不可能だからである。

たとえば筆者の場合、現在の雇用主の元でもっとも有難いのは投資プロフェッショナルとのコミュニケーション機会である。Self-employedの個人投資家の想像とは大きくちがった、業界構造の深い知識が手に入る。

  • たとえばセルサイドであるmarket makerは、なんらかの理由でバイサイドの将来の注文が先読みできる場合には、execution algorithmを洗練させることでmarket makerにとって有利なbid-ask spreadを提供したりする
  • 一方のバイサイドはブローカーに余計なコストを払うのを防ぐために注文を乱択するなどの予測可能性を減らす対策を行う。水面下の小さな勝負があるわけだ
  • とはいえセルサイドに注文を執行してもらわなければバイサイドも商売が出来ないので、お付き合い自体を切るわけではなく、あくまで微調整をするイメージで捉えてほしいが

機械学習研究者の筆者としては、二番目だが一番目に匹敵するくらいにありがたいのは大規模な計算機を使い倒して実験ができる環境だ。最終的に構成される投資戦略はCPUが数コア程度の環境でも十分に実行可能な実装に落ち着くことが多いのだが、その戦略が将来にわたってもおそらくリターンを生み出し続けるとの確信をもつためには、たとえばbootstrap sizeを非常に大きくしたり、高次元の積分が必要なある種のノンパラメトリック検定をモンテカルロ法の力技で解決するなど、信頼性担保プロセスにマシンパワーが必要である。

  • マシンパワーの必要性は将来のリターンを予測する際のS/Nがとても小さいことから来ており、低いS/Nは金融市場で投資家が互いにしのぎを削ることで発生する
  • しかしS/Nがゼロであると考える効率市場仮説論者とは違い、低いが実際には正であるシグナルが存在する。その存在を莫大な実験を通して実証するわけである

筆者の雇用先における計算機の規模は、GoogleやAmazonといったITの真の巨人よりはずっと小さいが(社員数がそもそも3桁以上違うしファンドの運用コストを抑える義務もある)、それでもこれまでの雇用先に比べてずっと大きな規模の計算機実験ができる。このプロセスを通して構成された投資戦略は、一人の個人投資家がせいぜい100万円程度の計算機で実験して見つけたそれとは信頼性に大きな違いがある。また、大実験をする前提であっても、プロセス効率化をはかる際には投資プロフェッショナルからの知見が大きなヒントになる。予測モデルのどの部分については大きな時間をかけて厳密に調べつつ、どの部分は非金融業も含む機械学習屋のよく用いるデフォルト設定で済ませてしまうかのフォーカスが設定しやすくなるわけだ。投資知識、大規模計算機環境、そしてその非線形相互作用まで含めたパッケージこそが、筆者が雇用主から提供された大事なコールオプションである。

  • たとえば将来のある時点で、ヘッジファンド・ビジネスとは全く別だが同様にS/Nが異様に低いなんらかのデータセットと格闘しなければいけない新業種が発生したとしよう
  • この新会社は画像認識や広告ターゲティングなどの多様なバックグラウンドから多くのデータ・サイエンティストを雇ってみたが極端に低いS/Nゆえに彼らのほとんど誰も成果を出すことが出来なかったとする。このようなビジネス領域において、将来の筆者が労働市場であるいは自分のスモールビジネスにより持つ交渉力はとても大きい
    • 筆者の研究が今後十分に成功した場合に限るが
  • そのために、潤沢なキュッシュフローをもつIT企業では働かず高額従業員パッケージを逃している(=コールオプションのプレミアムを支払っている)ことを覚えておいてほしい
  • あくまでオプショナリティであることに注意: そのシナリオが将来確実に発生するわけではない。非ゼロの低確率で発生したときにstrikeするコールオプションを保持しているだけである。オプション行使は自由意志による選択であって、行使義務はない。筆者が目指すキャリアの既定路線が投資の世界での成功であることには変わりはないし、そちらの路線がうまく行けばこのオプションは別に権利放棄して良いのである
  • このオプショナリティの根源は、極端に低いS/Nデータに対する予測品質確保という仕事がいまのところ機械学習アプリケーションの世界ではメイントピックではないことに起因している。ある程度予測の成功が約束されている世界で現在引く手あまたなのに、そんな嫌がらせみたいな課題の世界に何故わざわざ行く必要がある、と同業者が将来の可能性を過少評価することで機会が発生するわけだ。端的にいって、直近の報酬を少し妥協できるマイノリティは大きなオプショナリティを持つことになる
  • 大規模実験に関してほかに感じるのは、スケーラブルなR&Dインフラにおける雇用機会の過少評価である。ITインフラを担当するソフトウェア・エンジニアの方と話していて思うこととして、e-commerceサイトなどのように直接現在のサービスを提供するフロントの部分には大規模な並列計算を用いるのに、そのプロダクトに将来導入されるアルゴリズムを開発する社内インフラはなぜか貧弱にしてある日本企業を広く散見する
  • このいびつな構造には筆者はこれらのIT投資意思決定をした担当者の近視眼性を感じるのであるが、ソフトウェア・エンジニアの人はこの近視眼性にキャリアを潰されてしまってはもったいない。顧客と接する直接サービス部分ではなくてR&Dインフラ構築にも実は大きな可能性があることを考えてみるとよい

そんなわけで、経営者が賃金を増やしてくれないと嘆く労働者のあなたも、実はコールオプションをすでにもらっていなかったかどうか、今一度よく考えてみてほしい。また経営者の方も、収益力強化をはかる上でコールオプションを社員に売ることができないか考えてみてほしい。まず理解して頂きたいことは、これは無料のフリーランチを配るモラルハザードとは大きく違っていて、互いにリスクを取った上での正当な投資にすぎないことだ。経営者であるあなたはコールオプションを売った際にプレミアムを受け取る権利があり、従業員の賃金をさらに少し低くしてもよい。あくまで少し低くである(大きく下げるのはKelly Criterionで投資可能な水準を超えた不合理なレベルのリスクテイク、二流ギャンブル性を社員に強要することにつながる)。低い確率の成功時には、溜め込んだリスクプレミアムと事業成功による大きなキャッシュフローのプールからどーんと報酬を払ってあげるだけである。本質的には、あなたが資金調達の際にequityでファイナンスするかdebtでファイナンスするか、資金提供者との関係構築時に考えていることを社員とのコミュニケーションにも適用するだけのことだ。

リスクを取らせすぎる福祉国家

さてコール買いポジションの福音を説いてきたが、賭けすぎ二流ギャンブラーになる危険性を再三伝えてきたとおり、このポジションは無節操に奨励されるべきものではない。極端にアップサイドの限定されたサラリーマンはプット売り由来の無気力が問題となるが、ダウンサイドを限定したコール買いポジションの方はそちらはそちらで、ペイオフ構造があまりに魅力的すぎてうっかり賭けすぎてしまうのである。

雇用先での報酬が一定額サラリーのみで明示的なアップサイドに馴染みがない人々は忘れているが、たとえば日本の大半の市民は、健康問題に関してこの賭けすぎギャンブルをしている。救急車を呼ぶにも20万円かかるために血だらけで病院まで歩く人々がたくさんいるアメリカ合衆国とは違い、日本やイギリスは国民皆保険国家であって治療可能な病気・怪我である限りは公的機関からの手厚いサポートがある。病に倒れた全ての人が完治するわけではないが、ほとんどの患者は病気が治癒するかどうかそのものに関心を持てており、米国のように医療破産するかどうかを先に心配する人はほとんどいない。日本でこのような心配をする人は単に高額医療補助制度など公的なシステムを理解していないだけである。

しかし困っても病院が・国が助けてくれるからと過剰に安心して予防医療に対する自己意識が低いのが日本の課題である。アルコール依存(依存している本人は依存していることに気づいていなかったりする)やたばこ依存から偏食から歯磨きでフロスを使わない怠慢まで、医療専門家に言わせると列挙すべきものがたくさんあるだろう。皆保険システムが提供してくれるプットオプションを手に入れたのはいいが、ダウンサイドがキャップされて過剰安心したせいで、不合理にレバレッジをかけてしまったのである。国民へ寛大にもプットオプションを付与する主目的は、あくまで最悪ケースからのプロテクトであって、過剰安心からくるレバレッジ: 借金して株を追加するような過剰リスクテイクの奨励ではない。NHSによる保護があるイギリスも同様で、筆者の自宅近所の名門公立病院には、金曜日になると急性アルコール中毒患者が多く運び込まれているようである。

福祉国家は市民にリスクテイクさせ過ぎる点が問題である。一部の右派的思想の持ち主は、福祉国家のもたらす安心が、ハングリー精神を失わせ経済が不活性化するという主張をして福祉国家や福利厚生システムに反対することがあるが、実態は全く逆でハングリーになりすぎるのである。たとえば左派の学者や政策担当者は、福祉が国民を羊にするというような明後日の批判にたいして自身の政策をdefendする必要は全くない。むしろそんな批判でオロオロしてしまうような左派を見ると、全体としては福祉国家をなんだかんだで良いものだと考えている筆者としては無能な味方から刺されたような気分になる。

左派は右派に対して、福祉があってもハングリー精神は失われないなどと弱腰の意味不明な反論をしてはならない。福祉のせいでハングリーになりすぎる欠点はあるが自制心を促す政策も併せて実行していく、その仕組みは・・と反駁していく必要がある。過剰リスクテイクをしない自制心を市民にどう根付かせるか、その具体案こそが左派が右派に対して真摯に回答しなければならない内容である。政府レベルの意思決定ではなくて、企業内でもときどき全社員に対して提供される福利厚生システムを憎む変な従業員がいるが(自分の給与になるべきお金が他の社員の保険に浪費されると単に思い込んでいるのだろう)、このようなケースでも同様である。明後日の方向の憎み合いと無意味な口論ではなく、ペイオフの非対称性をきちんと理解した意味ある討論を政治レベルでも民間企業レベルでも見たいものだと筆者個人は思っている。

プットセラーも重要な社会的役割を負っている

Positive skewedなポジション・コール買いの麻薬的負の側面を理解するのが大事なのと同様、negative skewedなポジション・プット売りの社会的正の側面も忘れてはならない。サラリーマンとして働く機会のように、期待値が正のポジションが広く世の中に存在している事実を忘れてはいけない。そしてなぜ期待値が正の投資戦略はnegative skewedなものが多くなってしまうのかを考えてみることは大事である。投資家や労働者が広く収益機会を探しているなら、期待値正の投資戦略はpositive skewedなものとnegative skewedなものと半々の割合で存在しても良いではないか。

なぜnegative skewedかつ期待値プラスの投資機会が多いのだろうか。この理由を考えるとき、映画 Bridge of Spiesでトム・ハンクス扮するジェームズ・ドノバン弁護士の台詞が思い出される。保険金請求に対して彼は要求額の半分だけが支払われるべきだと説くときにこんな感じのことを言う。「保険業そのものが儲からなくなるような出費が出たら、保険会社が撤退してしまいその結果誰も保険で保護されなくなる」


ブリッジ・オブ・スパイ [AmazonDVDコレクション] [Blu-ray]

この台詞は本質を集約していると思う。生命保険も自動車保険も、保険会社自体の収益はプラスでskewnessはnegativeである。保険を買っている人々はpositive skewedで期待値がマイナスの賭けをしているわけだが、彼らの目的は最悪の事態から自分の人生の続行可能性を守ることであって別に生命保険を買って金賭けをしようなどとは考えていない。もちろん、生命保険会社同士の競争はあり価格に下落圧力がないわけではないが、保険会社の利益がゼロになるまで被保険者が保険会社に圧力を加えるような事態にはならず、売り手と買い手が双方とも自然に満足する価格水準に行き着くということである。

保険会社はleft-tail riskという代償を元にプラス期待値の報酬を手に入れる権利がある。同様に、資本家と経営者、経営者と従業員のように、少なくとも人間同士の取引においてはペイオフやリスク構造は鏡像の関係にある。双方が人間である取引において、片方がリスクフリーで一方的に得をするディールは何かがおかしい。このように考えるとpositive skewedなポジションが欲しい人はnegative skewnessを負う人に対価を払うのは当然であり、双方のリスクテイカーが尊重されるべきだ。

ただし本質的にはゼロサムの保険の売買と違って、経営者から従業員へのコールオプション付与はそれ自体が余剰を産むプラスサムになる。というのはインセンティブ付与された従業員の努力と献身によって会社全体が成功すれば、コールオプションのstrikeによる支払いが生じても経営者にとってはプラスであり、オプションを行使する従業員は言うまでもなくプラスだからである。Skewnessは鏡像の関係として残るが、双方が期待値プラスの取引が作り出せないか、我々は絶えず創造性を大事にすべきだ。

高次モーメントが発散する場合: 原子力発電, 遺伝子操作, etc.

金融市場のオプション取引では、negative skewedであろうとpositive skewedであろうと、left-tailはどこかでキャップされている。DOTMのプット売りであれば、最悪のケース: 株価がゼロになった場合のstrike priceが最大支払い金額だ。最初に受け取ったプレミアムの何百倍もの支払いが発生するから問題となるだけで、最大ロス金額は確かに有限で存在し、高次モーメントも有限である。問題はレバレッジの間違いであって、Kelly Criterionから最大投資金額自体は算出できる。

しかし金融市場に限定されない人類全体の賭けについては、高次モーメントがおそらく発散しているものが存在する。筆者が最近おそろしいと感じていることは、そのような賭けを行う場合に知っておかなければならないことの多くを、一流とされる科学者が理解していないように見受けられるばかりか、懸念を正しく表明している人たちを非科学的とレッテル貼りしたりするケースさえ見られることだ。最終章の執筆意図は、これらの研究者にモーメントが発散している場合の複利投資の不毛性について数理的に理解してもらい、自らの主張や研究の方向性を再考する機会をもってもらうことである。

具体例の前に、高次モーメントが発散する確率分布を持ってきて、Kelly Criterionによる投資可能水準がどうなるか見てみよう。単純な例で使えるのはスチューデントのt分布である。この確率分布は左右対象であるため広い意味でのskewnessはゼロだが、自由度が裾野がべき乗減衰し、分散が有限であるためには自由度\nu\nu > 2でなければいけないし、3次モーメントが有限であるためには\nu > 3が要求される。

ここで、PnLが掛け金に対して期待値+50%で、誤差項がスチューデントt分布に従う賭けを考えてみよう。期待値はプラスで存在するものの、自由度\nuの値に応じて高次モーメントが発散する。\nu \to \infty (正規分布に一致する)、\nu = 1.5 (分散が無限大)、\nu = 3 (分散は存在するが3次以上のモーメントが発散)、\nu = 5 (分散・歪度・尖度は存在するが5次以上のモーメントが発散) の4種類を考えてみる。正規分布のケースは分散が1なので シャープ・レシオ0.5の賭けである。自由度が無限大ではないケースでは、対称性ゆえに、想定外のロスが発生するleft-tail riskだけでなく、right-tail riskつまり想定外の嬉しいリターンも発生する可能性がある。金融取引との違いは、left-tail riskの最大値が決まっていない点である。確率的には掛け金を全額失いさらに余計に-100% (つまり-200%のloss), -200% … と失う可能性がどれだけ低い値であってもわずかながらに存在する。

このリスク資産に対する投資を行い、複利による資産増大を行う場合の投資可能最大割合はどれだけだろうか。実は、最大ロスが確定していないケースでは正確なKelly Criterionに用いられる積分が定義できない。そこで妥協策として、下側確率\delta/2, 上側確率1-\delta/2 で確率分布をtruncateし、50\delta-percentileから(100-50\delta)-percentileの区間積分をモンテカルロ法で評価してみよう。このtruncationは積分を有限にしてある種の最適投資水準の算出を可能にする。しかしtruncationが必須であることの本質的な意味は、十分に長い時間がたった場合には我々はruinを避けられないということである(詳細な議論は [7] にある)。\deltaの選定は、たとえば太陽が赤色巨星になって地球を呑み込むまでの残り時間(億年の単位である)とか、地球温暖化がこのまま進んでしまい地球が人間の住めない場所になる残り時間(100年あるかどうかさえ危惧されている)などから設定せざるを得ない。

実際にスチューデントのt分布からサンプルサイズ n の乱数を発生させつつ、下側と上側のtail samplesを除外した経験分布に対するKelly Criterion上の最適投資水準\alpha_nを計算する。そしてサンプルサイズ nを増やしていくと\alpha_nがどのような値に収束していくか (つまり真の\alphaが何か) 観察してみよう。\delta=0.0005を今回は採用する。簡単なpythonコードは以下の通りである。手元環境のメモリ上限の関係で 100種類の異なるブートストラップ標本 (ただし経験分布からではなく既知の真の分布からの標本だが)を生成して平均している。n100\times 10^2 (1万)から100\times 10^6 (1億)まで変化させている。そして計算された、収束状況を示したグラフが図1である。

import numpy as np
from scipy.optimize import minimize_scalar
from sklearn.utils import check_random_state
import matplotlib.pyplot as plt
from matplotlib.backends.backend_pdf import PdfPages
from collections import OrderedDict
import os

def kelly(y):
    lg = lambda x: -np.log1p(x * y).mean()
    res = minimize_scalar(
        lg,
        bounds=(0.0, 1.0 if np.min(y)>=-1.0 else -1.0 / np.min(y)),
        method='bounded'
    )
    return res.x

seed=5678
n_replicates=100
delta=0.0005
key2n_vs_alpha = OrderedDict()
for key, df in [
    ('Gaussian', np.inf),
    ('Student t: nu=1.5', 1.5),
    ('Student t: nu=3', 3.0),
    ('Student t: nu=5', 5.0)]:
    n_vs_alpha = []
    for n in np.logspace(2, 6, 9, dtype=np.int64):  # n=100 to 10^6
        random_state = check_random_state(seed)
        alpha_n = 0.0
        for _ in xrange(n_replicates):
            y_n = random_state.normal(loc=0.5, size=n) if np.isinf(df) \
                else (0.5 + random_state.standard_t(df=df, size=n))
            left_cap = np.percentile(y_n, 100.0 * delta)
right_cap = np.percentile(y_n, 100.0 * (1.0 - delta))
            truncated_y_n = y_n[np.logical_and(y_n > left_cap, y_n < right_cap)]
            alpha_n += kelly(truncated_y_n)
        alpha_n /= n_replicates
        n_vs_alpha.append([n*n_replicates, alpha_n])
    key2n_vs_alpha[key] = np.array(n_vs_alpha)

plt.rc('font', size=14)
with PdfPages(os.path.expanduser('~/student_kelly.pdf')) as pdf:
    plt.figure(figsize=(9, 5))
    plt.xscale('log')
    for key, n_vs_alpha in key2n_vs_alpha.iteritems():
        plt.plot(n_vs_alpha[:, 0], n_vs_alpha[:, 1], label=key)
    plt.title('Maximally-Allowed Investment by Kelly Criterion')
    plt.xlabel('Sample Size')
    plt.ylabel('Weight in Portfolio')
    ax = plt.subplot(111)
    ax.set_ylim([0, 0.65])
    box = ax.get_position()
    ax.set_position([box.x0, box.y0 + box.height * 0.1, box.width, box.height * 0.9])
    ax.legend(
        loc='upper center',
        bbox_to_anchor=(0.5, 0.975),
        fancybox=True,
shadow=True,
        ncol=2,
        fontsize=12
    )
    pdf.savefig()
    plt.close()

student_kelly

図1. PnLがスチューデントのt分布に従う場合の最大投資可能割合

図1の実験結果をみるかぎり、サンプルサイズが10^6以降の値はどの自由度でもほぼ収束値になっていると言えよう。しかしこれは\delta>0を設定したおかげである。\delta=0の場合の正確なKelly解はexactにゼロである。自由度が大きく裾野が浅くなるほど収束速度自体は遅くなるが、対数効用関数の性質上、ある特定のモーメントが発散しているだけで、どんなに\alphaを小さくしてもruin (たった一回のロスで破産して債務超過になること)を回避することができない。また分散が無限大の\nu=1.5のケースは他の場合に比べてとても低い金額しか賭けられないことが図1からよくわかる。

これら t分布のPnLに対する賭けは、一回あたり定額である限りは期待値に収束させられる。しかし定率での賭けは、十分に長い時間がたった場合はどんなに小さい金額を投資していても破産という結末しか待っていないわけだ。なんと不毛なペイオフだろうか。発散している高次モーメントと複利の組み合わせは、期待値がプラスなら賭けないのは不合理だとのたまう一部の有識者の意見を完全に葬り去ってしまう。モーメントが発散している場合の賭けは我々はruinでいずれ死ぬことをむなしくも受け入れた上で、そのruinの発生時刻を出来るだけ未来に設定した中での投資しかできないのである。唯一の救いは、我々の住む太陽系には元々決まっている死亡時刻がある点で、それより長い時間に該当する切断水準 \deltaは考えても無駄という点である。

さて、実際に高次モーメントが発散していると筆者が考えている投資の代表例は原子力発電と遺伝子工学である。期待値が本当にプラスなのかどうかも若干の懸念はあるのだが、ひとまず原子力発電も1次モーメントは発散せずプラスであると仮定しよう。時々起こる大損害や放射性廃棄物の処理を差し引いても、安定して供給される電力や二酸化炭素を排出せず、気候変動阻止に役立つ性質はトータルで見ればプラスと考えることが一応できる。同様に遺伝子工学も、農業生産性の劇的な改善を通して本来は飢えていたはずの人々に食料が行き渡るならば、生物多様性上のリスクに見合うだけのリターンがあると仮定しよう。

  • 原子力の方で一応と書いているのは、1次のモーメントが有限であることを示すにはleft-tailのべき指数がある範囲に収まる必要があり、これまでの観測を通じて真のleft-tailのべき係数が測定され、そのconfidence intervalが望ましい範囲に収まっていたのか筆者が疑問に思っているためだ
  • 遺伝子操作の方も、飢餓問題の本当の要因は農業生産力の不足ではなくて先進国の農家への補助金や独裁者による横領といった経済システムの欠陥の方だが、その本質的議論もここでは遺伝子工学研究者側に譲歩して不本意ながら目をつぶることとしよう


最底辺の10億人

しかしこれら二つの賭けは、それら単独ではまず間違いなく、left-tailが分厚いnegative skewedなものである。原子力による電力供給の増加は多くの場合に少しの便益を提供するが、莫大なアップサイドとは言い難い。遺伝子操作も食料生産性は上がるだろうが、嗜好品を求める富裕層はそもそも遺伝子組み換え食品は買いたがらない。人間の遺伝子を直接書き換えるというならパーフェクトベイビーを欲しがる人々(これらの近視眼的な人々がまた別の大災害の源となる)に魅力的なアップサイドを提供するかもしれないが、みなが殺到して似たような遺伝子を欲しがることで多様性欠如が発生し、人類全体自体は存亡の危機に瀕するだろう。

遺伝子操作に関する懸念は何も筆者個人のものでなく、投資リスクの評価に関心がある研究者の間では広く共有されているものだと思う。著書「ブラック・スワン」で同じみのNassim Nicholas Talebや、彼のビジネスパートナーであるヘッジファンド・マネジャーのMark SpitznagelはGMOの欠陥に関する極めて強い懸念を表明しているので、ぜひ読んでみてほしい。ジャガイモに過度に依存したことで起きたアイルランドの飢饉など、生物多様性の破壊は過去にも大惨事を起こしている。

Another ‘Too Big to Fail’ System in G.M.O.s

筆者もジーン・ターゲッティングなどの遺伝子操作プロセスが具体的にどうなっているかは知らないので、あくまで結果のペイオフから利便性と危険性を判断することしかできない。もしGMOにおいて遺伝子配列の特定部分を置き換える作業が、実質的にはコンピューター・プログラムのマシンコードを直接バイナリエディタで編集するかのような処理と等価であるなら、SpitznagelやTalebが懸念する見方は実際のところ正当だと思う。生物学的に離れた種の配列を一部直接組み込むことを可能にする編集プロセスは、自然交配や放射線をぶつけることで遺伝子に影響を与えてきた伝統農業とは最適化における動力学が大きく異なっている。

伝統農業における品種改良は、高次元の遺伝子表現状態空間において放射線や生物本来の突然変異による撹乱を導入することで近傍への移動をはかるものである。他の近傍への移動後、種が人類にとって都合のよい方向に変化したならば採択し、そうでなければ廃棄する。ここで重要なことは、状態空間上の任意の領域が生物として存続可能なわけではない点だ。近傍移動を繰り返していくが、生物として存続ができず死亡してしまう崖が存在する。最後に選択される種はときどきこの崖への墜落を経験しながら、あくまで初期状態から連続的に到達可能な範囲にとどまっている

しかし遺伝子を直接編集して、他の種から見つけた遺伝子を埋め込む方法を用いると、状態空間上でのleapが起きる恐ろしいのはこのleapのノルムが大きいときだ。本来、人類を滅ぼしかねないようなキメラの発生を防いでいたはずのinfeasible領域、最適空間上の崖を飛び越えた、種として存続可能だが既存の全ての生物全体にとって最強の敵となる未知生物の生産に加担してしまうかもしれない。このようなleapは、simulated annealingのように、多峰性のある目的関数を最適化する際には助けになり得るが、生物種の操作の場合はleapこそが悪夢のトリガーになる気がしている。そもそも人類は遺伝子表現とそれに対する効用関数値の全空間をカバーしたサンプルを持っていないからだ。遺伝子操作をしている研究者は特定の塩基対に特定の生物機能があり、二つの塩基を持って入ればそれぞれの機能が生物に備わる、というような線形の対応関係を直感的に描いているように思われる。その切り取った塩基と別の塩基の共起が特定機能の発言に関係しており、しかもその発現が潜伏するような性質を持っていたら?

機械学習のモデルを解釈するときの留意事項を思い出して欲しいのだが、線形モデルが非線形モデルより予測能力が良かったとしてもそれは真のデータ生成メカニズムが線形であることを全く意味しない。線形モデルが非線形モデルよりも推定時のvarianceが小さく、与えられたサンプルサイズのもとではbias-variance trade-offの関係上variance reductionのメリットがbias reductionのメリットに勝ったというだけである。もしデータ生成プロセスが寸分の狂いもなく線形であると主張するためには、線形モデルと非線形モデルとでbiasが同一であるという実験を膨大なモンテカルロサンプルを生成して確認しなければいけない。たとえば特徴選択の文献だが、[8]に記載されているようなバイアス同一確認プロセスが遺伝子工学の文脈で必要になる (論文には、ある関数近似器のbias^2+noiseとvarianceの具体値がどうなっているかcross-validationを用いて推定する方法が記載されている)。だが計算機の中の、モンテカルロ法による数百万bootstrapサンプルに頼れるピュアなデータドリブン世界と違い、遺伝子操作の実世界でこのような莫大なbootstrapサンプル生成ができるのかも筆者には疑問である。

GMOのモンサント社も、遺伝子を直接書き換えるのではなくて交配メカニズムに介入するタイプのアプローチを最近開発したようだ。こちらのアプローチの方がまだleft-tail riskが低いように筆者の目には移っている。近傍探索の一種だからである。

遺伝子組み換え作物の巨人、モンサントが取り組む「昔ながらの品種改良」

では原子力発電への投資も遺伝子工学への投資も極めて否定的結論しかないのだろうか? 筆者もいろいろ考えてみたが、いまのところの結論は「市民の生活の屋台骨を預けるような基幹システムへの採用には反対だが、原子力開発や遺伝子改良技術開発には賛同」としか言えない。まず上記のモーメント発散議論により(発散しないと主張する研究者がいるなら、彼はこれらの技術のleft-tailが完全にキャップされることを証明する必要があり、おそらくそれは不可能だ)、人口増大にあわせた複利投資にこれらの技術はいまのところ向いていない。

だがこれらのleft-heavy-tailedな技術を利用停止したとしても、人類は気候変動という別の存続脅威を抱えており、こちらを放置してもいずれ我々はruinで倒れるだろう。人類の工学的失敗によるruinと、不可逆な気候変動によるruinと、どちらのruinが先に来るかの有限時間勝負の中でしかポートフォリオを最適化できない。上記のシミュレーションでtruncationを導入しながら、「実は我々にはあまり時間は残されておらず、全てのtail riskをキャップすること自体が贅沢で達成不可能な目標なのだろう」という諦念感が筆者を襲ったのも事実である。

気候変動危機の回避には化石燃料の大幅な撲滅が必須になっており、発電所における化石燃料利用の削減と、自動車の電気自動車への置換・それに伴って増える電力需要に対処できる電力源は必須である。太陽光や風力などのrenewableは実効コストがすでに原子力より安くなっているものの、原子力も依然として一つの対処技術候補である。あるいは同じく原子力を利用するが、損失がどこかでキャップされるような新しい発電方式が開発され、今までDOTMのネイキッド・プット売りだったポジションをブル・プット・スプレッドに変える新技術が開発されるかもしれない。

  • なお近年のrenewable energyのコスト下落には筆者もうれしく驚かされた。安くなったrenewableのおかげで、インドでは石炭火力を、それより安いrenewableにいかに早く置き換えるか競争が行われている
    Disclosure: 筆者の個人ポートフォリオにはインドのある電力会社株が組まれている

遺伝子工学も、たとえば深海の熱水孔にいるような嫌気性細菌を改良するなどして、気候変動阻止装置の開発に大きく貢献できるかもしれない。比較的長く研究されてきたものとしては、たとえばExxonMobil社は藻に石油を吐き出させるカーボンニュートラルな algae biofuel を生産するため、強力な光を浴びても死なずにそれに比例して石油を吐き出すような遺伝子操作された特殊な藻を開発してきた。このプロジェクトはヒトゲノム計画で著名なクレイグ・ベンター博士の創業したSynthetic Genomics, Inc.がExxonMobilから投資されて始まったもので、2009年にニュースをはじめて聞いたときはこれこそが本当に意味ある遺伝子工学の利用だと思ったものである。たまたま最近のツイートで進捗を拝見したが、プロジェクトは継続しており2017年には彼らが言うところのブレイクスルーがあったようだ。Nature Biotechnologyにpublishされているそうなので筆者も読んでみようかと思う。

 

Craig’s twist (こちらは2009年に話題になったThe Economistの記事である)


チェンジング・ブルー-気候変動の謎に迫る (岩波現代文庫)

こればかりはどのツールが決定打になるか、まだ人類が観測していない側のpositiveなright tailに賭けてみるしかない。Left-tailも存在するがright tailもある「かもしれない」。Ruinが回避不能ならむしろその諦めをもとにleft tail-eventが発生する前にright tail-eventが発生する可能性に賭けることも非合理的ではない。

だがその場合においても二流ギャンブラーがご法度である一連の議論により、賭けることのできる資産は極めて限定されるべきである。そういったあたりを勘案し、研究開発としての将来性に賭けて小さいがレバレッジの効いたポジションを取りつつ、negative skewness, left-tail riskを無視した、最大投資可能金額を超えた賭けによって大勢の市民を危険にさらす運用には反対する。やるなら複利で再投資はせず定額で:つまり人口が増えてもそれに比例して規模を拡大しないこと、というあたりに筆者のいまの意見は落ち着きつつある。

  • ただこれでも実務上は困難がともなう。巨大な損失発生がありうるにも関わらず、定額で賭け続けると、例えばこんなことがおきる: 資産の1000%を失う大災害が発生したとしよう。その次も定額で賭けるということは、どこからかその失った資産1000%を丸々持ってきて補填し、巨大な借金を追いつつ運営することを意味する。単なるお金ではなく物理的インフラの場合にはそれが何を意味するか想像してほしい – たとえば荒廃した工場に巨額のお金を投下してそれらを全部復旧し災害前の元の規模と同レベルのオペレーションを動かすことになる
  • そのため定額で賭ける戦略は、損失を受けた時点で割合としてはむしろ投資額を増やしリスクテイクする性質を持っている。複利で賭ける場合は資産減額に応じて自然とリスクも減らすのとは対照的である。大損害のあとに大リスクを取るというのは実際上、また政治的にも困難な場合が多いのではないかと思う

正直なところ、筆者は原子力工学にも遺伝子工学にもメカニズム上・物理的な知識がないので具体的プロセスについては的外れなことしか言えていない。しかし同時にこれらの分野の専門家はtail riskへの本当の正しい対処法について金融の世界で培われてきた成果を真摯に吸収すべきだと考えている。筆者がしばしば驚くのは、統計学や物理学のPhDホルダーの中にモーメントが発散するという現象の本質が何なのかを全く理解していない人物がそれなりにいることだ。多くの物理現象・自然現象にはべき乗則・フラクタル性がともない、彼らにとっては解析経験が深い対象であるにも関わらず。一般市民に対して、科学的プロセスと自らの研究成果の正当性を啓蒙したいなら、彼らはこの自らの欠点を急いで補強する必要がある。期待値がプラスである限りは大きく投資しろなどという妄言は慎まなければならない。Positive skewedな賭けなら失敗してもまだ二流ギャンブラーとして笑い話で住むが、negative skewedな場合の帰結はfatalだ。人類は存続不可能な賭けは実行できないのであり、存続を前提とする限り複利の賭けの性質は必ず考慮しなければいけないのである。モーメントが有限でない賭けに人類はすでに巻き込まれてしまったためにこの存続も100%の存続と言えないのが残念ではあるが。

結論

今回はskewnessが複利前提の投資にもたらす影響に関する分析方法を紹介した。日本人労働者に蔓延するnegative skewedペイオフがもたらす無気力の問題と、その処方箋としてのコールオプション付与を説き、また従業員個人も金銭だけでものごとを考えず隠されたスキル・コールオプションの探索を自ずから行うべきだと説いた。国家がプットオプションを提供してくれることで一般市民がリスクテイクしすぎてしまう福祉国家の例と、プットセラーたちも弱い立場の人にきちんと保険を提供する大事な社会的役割を担っており、コール買いとプット売りそれ自体に何らかの優劣があるわけではないことを補足した。最後に、高次モーメントが発散する場合には複利投資が不可能(truncationなしの厳密解においては最大投資可能金額がexactにゼロ)であることを示し、期待値プラスであることのみを持ってleft-tail riskの大きな投資を過剰に行うことの危険性を警鐘しつつ、truncationを妥協・覚悟して受け入れることで一定の投資価値を見出した。またleft-tailed risk投資の要素技術の中には人類を将来救うright-tailの希望があるかもしれないことも論じた。筆者個人はpositive skewnessを好みnegative skewnessを嫌うバイアスを明確に持っているし、ブログ自体も中立性そのものを目的とはしていないが、なるべく双方の判断材料が提供された構成にはなったかと思う。サラリーマン、経営者、left-tail riskを伴う研究開発に携わる人々のいずれにも刺激になれば幸いである。

References

広告

大切なことは(実は)ギャンブルが教えてくれる: 集中と分散の両取りと「良い宗教」による演繹

新研究テーマで実験に試行錯誤するうちにもう1Q 2018が終わってしまった。本当はこちらの社会での人とのつながりをもっと増やして行きたい気持ちがあるが、実験結果が出るまではどうしても一つのタスクに集中せざるを得ない日々が続く。その緩衝材というわけではないのだが、年末から最近にかけては日本や米国・東南アジアから友人が訪ねてきてくれて初めてオックスフォードを外の人に紹介する機会にも恵まれた。居住から9ヶ月以上すぎたにも関わらず実は筆者はオックスフォード市内に日本人の友人がいないという課題を抱えているのだが、彼ら長年の友人のおかげであまり寂しさを感じることはない日々ではあった [1]

一方で勤務先内では欧州の友人が増えており、ありがたい限りである。弊社の中でもdiversity & inclusionに関するイベントが最近行われたが、男女間のペイギャップが問題になっており改善を進めている一方で、社員の国籍が50種類を超えている点は賞賛されるべきだと思った。社員1300人程度の規模で50国籍というバラエティはかなり多いと思う。また筆者の所属するファンドは150人程度にも関わらず25国籍を超えている。ロンドンはおそらく世界最大の人種多様性を内包した街だ。その底力を見せつけてくれた感じがする。

今日のトピックであるが、数理ファイナンスの世界では基礎的によく知られている知見が、金融市場における狭い文脈においてではなく、様々の業種に共通して存在するもっと大きな意思決定問題にどう役立つかの好例を紹介したいと思う。ヘッジファンド・ビジネスの構造上、筆者個人の研究トピックは外に開示できないことばかりである。しかしこれを言い訳としてクローズドな世界に引きこもると、長期的には社会から隔離されたまずい存在になってしまうことも実感している。人種多様性というアドバンテージを持つ地域にいながらそのようなクローズドな存在になることは人生最大のチャンスをドブに捨てることと同義であろう。

幸い(?)なことに最近、知的財産上のconflict of interestを生じることなく自分の知見をむしろ積極的に世の中に提言できる面白い機会に遭遇した。これは経営者の友人との会話、および最近話題になっていた次の記事から連想されたものである。

友人は経営者として、直近ではキャッシュフローを生まないが将来は莫大なリターンを生む可能性のある研究開発と、直近のインカムが確実に手に入る現在のビジネスとの間でどう資本配分すべきかを悩んでいた。地方と東京との間の再配分問題も本質は似ている。経済が伸び続けるであろう東京に集中投資すべきなのか、それとも東京と違った特性をもった地方にあえて資本を分配する方が長い目で見るとリターンが大きいのだろうか。

類似の問題構造は欧州にも存在するようだ。イギリスで金融の仕事をしていると、ドイツ人やスイス人と話す機会が非常に多い。仕事以外の雑談を含めて話を聞くと、イギリスやフランスでは経済力がロンドン・パリに一極集中しているが、ドイツやスイスは連邦制国家ゆえに各地方都市の経済力がそれなりにある点が違うという話をよくされる。これはドイツやスイスに格差がないという意味ではない。1都市に完全にwinner-take-allされるか、それとも複数の代表地方都市にクラスタリングされるかの違いである。

  • なおドイツでもっとも裕福な都市はおそらくミュンヘンだが、ドイツ人の友人に言わせると、ローマ帝国の時代にローマ人が侵略して文明を持ち込んだ南側のエリアと、それより北の取り残されたエリアとでは経済力や物の見方に大きな違いがあるそうだ
  • パリの巨大さはoutlierを生み出すべき乗分布の中でもさらにoutlierである。Self-organising critical systemの研究で著名なDidier SornetteはDragon Kingという名称でパリの特異性を表現する。
  • EUの官僚機構やBrexitの今後の影響を議論するとき、イギリスのEU離脱のせいでフランスの極端にcentralisedなシステムがEUを通して波及しないか心配だ、というのが連邦制に親しんできたドイツ人がしばしば口にすることである。[2][3]

「東京で稼いだ経済余剰を地方に再分配でもっていかれて公共工事その他で浪費される」というのは都会の中流家庭でよく言われる言説である。また新古典派の経済学者はこのタイプの言説に比較的よく賛同する印象がある一方で [4]、東京人の多くは地方の何が苦境なのか理解していないという批判もよくある。上記の現代ビジネスの記事もその一つであろう。どちらの主張のどのような正当性があるかもっと数理的に理解したい場合、本ブログを読み終えた後にZiembaによるKelly criterionに関するSamuelsonへのレター [1] を読むとよい。

東京から地方への再配分は田中角栄元総理がその実行者として有名だが、その良き相棒であった大平正芳元総理の辿った道筋は非常に興味深い参考情報になる。地方への再配分が始まった時期と成長率が鈍化した時期には重なりがあるようだが、とりあえずインフラを作って需要を満たせば経済成長するという安易な選択が可能だった時代が終了し、次にどう進むべきか大学の役割も含めていろいろ苦慮していた様子がよく見える。


大平正芳 「戦後保守」とは何か (中公新書)

基礎研究も再配分も、全てポートフォリオ最適化として捉えられる課題である。金融市場でのポートフォリオ最適化の実務は、過去のリターンから推定された確率分布を用いるケースが大半だが(要は計量経済学と機械学習の塊に過ぎない)、過去からの帰納ではなくて将来の社会変化を見越してどれだけ演繹的にポートフォリオ最適化できるかが将来の明暗をわける。演繹といっても実際には全て演繹的に考えるわけではない。都市を発展させるための基礎要素に関する理解は過去の世界中の膨大な経験から帰納する。しかしこれらの帰納的ミクロピースをパズルのようにつないでマクロピクチャーを得る過程では演繹的思考がものを言う。このような社会状態は過去に経験したことがないが、これらの要素が重なれば原理的には将来こういう社会に移行するはずだというunseenだがforeseeableなものを特定する能力がいま求められている、というのが筆者の見解だ。機械学習ツールがオープンソースなどを通じて多くの人々に使われるようになるに従い、帰納的発想ばかり強くなり演繹的思考力が弱まることを実は危惧している。

今日のSummary

  • Right heavy tailがある投資は「少額資本をひたすらかけ続ける」のが正しい
    • 期待値の大きさに惑わされて巨額投下するのは破綻するギャンブラーと同じである
    • 一方で、1%の成功可能性をアウトカムの大きさを無視して0%に近似し、予算を直近のインカムゲインに全て振ってしまうのは官僚的な間違いである
  • 投資対象をクラスタリングすると良い。どのクラスターに対しても投下資本をゼロにしてはならない。しかし同一クラスター内では相対的に最も強いものに集中投資すること
  • おそらく日本の政策は全般にモーメンタムを過剰信頼している。中期ではモーメンタムが効くが長期では平均回帰的に再分配をした方がよい
  • 将来のリターンが読めない不確実な世界で効くのは実は宗教 (=事前分布)である

合理的な宝くじ

先日は先ほどの友人に下記の簡単なクイズを出した。読者諸賢はどう答えるだろうか?

  • Q. 反復可能な、ある賭けに参加したい。1%の確率であなたが賭けたお金は200倍になって帰ってくる。一方残り99%のケースでは賭けた金額は全て失う。この賭けに対してあなたはどのように自分の資本を投下しますか?

これは基礎研究の典型的なアウトカムを抽象化したものだ。同じく「低確率で巨大リターン」の政府発行宝くじ(期待値はマイナスである)とは違い、この賭けは期待値としては掛け金の2倍 (+100%のリターン)が帰ってくるというとても魅力的な性質を持っている。

しかし全損シナリオの発生頻度が高いため、期待値を最大にする賭けは決して選んではならないのである。自分の資産の10%をかければ+10%だし、50%をかければ+50%だ。なぜ+100%ではなく+10%で我慢する必要がある? 脊髄反射的に回答する人はこのように考えてしまうようである。では実際に期待値最大にすべく100%のお金を賭けたとしよう。99%の確率で破産するあなたにはnext chanceはない。質問文の冒頭にあるように、あなたはこの賭けに何度でも挑戦することができるのである。しかし財産が一度ゼロになってしまったら、次に賭けることは決してできない。0を2倍にしようがゼロはゼロである。期待値を最大化しようとした人たちの末路は1回目で99%の人は破産して終わり。極めて運良く200倍リターンを受け取った人も、また同じことをやろうとしたら99%の確率で破産する。2回連続で生き残れる人は0.01%しかいない。賭けの回数が増えると全がけした人たちの中の生存者は誰もいなくなることが容易に想像つくだろう。

直近の期待値を妥協することは悪いことではない。この賭けが本当に美味しいのは、賭けのリターンが複利で増えていくところにある。$1の資本しか持たない人が期待値2倍を受け取っても+$1されるだけだが、$100の資本を持つ人は期待値2倍で+$100受け取る。つまり、直近の期待値を最大化することではなく長い目で見て資産が確実に増大し、挑戦の後半で劇的な資産増価額を享受することが重要なのである。

反復可能でmultiplicativeな賭けを最適化するには、ギャンブルと金融市場双方の世界で著名なKelly Criterionについて学ぶとよい。その本質は、期待値ではなくて対数の期待値を最大化することにある。たったこれだけの本質が、Summaryに述べたような広範な知見を生み出すことになる。このような性質を議論するのに別にビッグデータは必要ないのだ。対数期待値を最大化するという、トリッキーだがとてもシンプルな本質は、最後に述べるように筆者の人生を大きく変えた。それくらい学ぶ価値のある規範だと言っておこう。

ある賭けのリターンを確率変数Xとしよう。例えば1.3倍 (+30%)のリターンは X=0.3と表現する。上記の1%で200倍, 99%で0のケースでは確率質量関数 p(X=x)を形式的には以下のように書けるだろう。

p(X=x)=\begin{cases} 0.01 & \mbox{ if }x=199\\ 0.99 & \mbox{ if }x=-1\\ 0 & \mbox{ otherwise } \end{cases}

この確率変数Xに対して、自分の資本を\alpha\in [0,1]の割合だけ投下する賭けをn回行うことを考える。初期資産を1とすると、n期後の資産はX_n(\alpha)=(1+\alpha X)^nである。Xが確率変数なのでX_n(\alpha)も確率変数であり、結果はランダムネスを伴う。しかし確率分布p(X)が定常であるゆえにその性質を解析することができる。

注目すべきは 資産増加率の対数 \log X_n( \alpha )=n \log (1+ \alpha X)である。掛け算の反復は対数領域では足し算の反復である。nが大きいと対数の法則によって\log X_n(\alpha) \to n {\mathbb E}_{p(X)}\left[\log (1+\alpha X)\right]となり、一回あたりの平均対数リターンが{\mathbb E}_{p(X)}\left[\log (1+\alpha X)\right]に収束していくことがわかる。この指標を最大化する\alphaこそがあなたが賭けてよい最大額なのである。また、nが十分に大きくない場合にはn期対数収益率 \log X_n(\alpha)自体にも大きな分散や歪度が乗ることがわかるだろう。このブレ幅も考慮した上で\alphaを決めなければならない。

簡単な方程式を解くことで、先ほどの1%200倍シナリオでは\alpha=0.005025という最適解が得られる。つまり手持ち資金の0.5%だけ賭けて99.5%は現金としてreserveすることというのが答えなのだ。この結果、一回あたりの期待値そのものは+1%に過ぎない。

数式が直感に響かない人のために簡単なシミュレーションを図1に添付した。1%しか成功確率がないような賭けの場合は、違いがはっきりわかるためにはn=10,000回くらいの施行が必要である。基礎研究のような超長期の賭けはこれくらいのスパンで見るべきということである。

\alphaをある種の最適値0.5%に対して、その半分の0.25%だけ賭けた場合、逆に2倍で1%賭けた場合、そして賭け過ぎで5%賭けた場合を横軸施行回数、縦軸(対数軸)資産で表示してある。対数期待値最大の賭けの半分だけ賭ける戦略はhalf-Kellyと呼ばれ、これでも3/4の資産増加率を期待できる割にボラティリティを大きく減らせるので好まれる戦略である。full-Kellyの0.5%の場合、half-Kellyよりもさらにでかく儲けるシナリオもある一方でダウンサイドがかなりある点に気づくだろう。しかしKelly基準やその亜種にしたがって賭けている限り破産はせず長期では資産が増加していくのである。一方でKellyの2倍賭けてしまったケースでは増えるのか破産するのかハッキリしないし、賭けすぎの5%では長期では一切資産が残らないことが確認できる。

bet_alpha0.0025bet_alpha0.005bet_alpha0.01

bet_alpha0.05

図1. 超長期 (n=10,000)で見たときの賭け割合の違いによる資産シミュレーション

図1は仮想ギャンブルを用いて簡単な数値例を示しただけだが、一般に、低い確率で大成功するようなタイプの賭けはものすごく少額だけを賭け続ける必要がある。大リターンに目がくらんで賭け過ぎればあっさり破産する一方で、0.005と0は同じだからなどといって特殊な基礎研究部門をリストラすると、資産1は10,000回分の時間が経っても1のままである。前者の二流ギャンブラーになってはならないし、かといって後者のように可能性を捨てた人間になってもいけない。この意味で強い規律が必要なのだ。

筆者がはじめて民間企業に就職したころは就職氷河期で、短期利益のためにどれだけ他人を解雇したかによって人事評価が上がり、それを武勇伝にするような輩がたくさんいた。この人たちの発想は、直近でキャッシュを生まなければゼロにしてしまえというnaiveなものであった。一方で、研究開発には夢があるのだからと過剰正当化を行ってKelly基準を超えた研究予算を求めるのも頂けないと筆者は個人的に思う。この少額だがゼロではない投資の世界における意思決定の専門家が、日本社会にも求められているように思われる。

クラスタリング的なポートフォリオ

最初の例は賭けの対象が一種類しか無かった。しかし基礎研究といってもほとんどお金のかからない数理科学的な分野から、材料科学や生命科学などハードウェア・実験環境に多くの予算がかかる分野までいろいろある。複数の投資対象が存在する場合に、長期的に見て我々の社会が発展していくためにはどのようにしたら良いのだろうか?

研究対象 i \in \lbrace 1,\ldots,m\rbrace のリターンを確率変数X_iで書いたときに、我々が気にするべきはポートフォリオの資産増加倍率である。研究対象 i に対する賭け金額を\beta_iとしたとき、我々は次の最適化問題 (1)を解く必要がある。

\max_{\beta_1,\ldots,\beta_m} {\mathbb E}_{p(X_1,\ldots,X_m)}\left[\log (1+\sum_{i=1}^m \beta_i X_i)\right]  (1)

\mbox{subject to} \sum_{i=1}^m \beta_i \leq 1,  \forall i~\beta_i\geq 0

最適化問題 (1)はいくつか面白い性質を持っている。その重要なものは

  • 凸最適化問題であり、山登り法で大域最適解が求まる
  • 解は一般にsparseになる。つまり、いくつかの研究対象 i については最適割合はゼロとなる。ゼロになりやすい対象の性質は以下のとおりである
    • 期待値そのもののオーダーが低くて絶対的な魅力が乏しいもの
    • i と相関の高い(似ている)他の研究対象の方が期待値が高い
  • しかし期待値が最大の研究対象に割合1を振るという結論にはならないのも面白い点である。相関が高いもの研究分野同士ではもっとも強いところに予算を集中させるが、離れた研究分野間では、たとえば生物学と地質学との比較で期待リターンが後者の方が低かったとしても後者にそれなりのウェイトを与えるようになる

といったことである。強いものに集中するという性質と、分野が違っている限り必ず分散するという一見相反する性質を兼ね備えているのである。いわば、投資対象の絶対的な魅力を考慮しつつ、分野をクラスタリングしているということができる。

クラスタリングという単語はアルゴリズム上も実はそのまま対応する。最適化問題 (1) は、2007年に著名機械学習国際会議NIPSで発表された convex clustering [2]と呼ばれるアルゴリズムの定式化とidenticalである。確率変数X_iが資産リターンではなく、カーネル関数 iからの確率密度関数または確率質量関数に変わっただけのものがKelly criterion最適化の代わりにconvex clusteringと呼ばれている。

何の奇遇であろうか、当時は金融知識については赤子同然だった筆者も、このconvex clusteringに関わっていた。将来の布石に結果論としてはなっていたのだ。アルゴリズム自体の高速化やカーネル関数を変えた場合の最適化結果に関しては2年ほど研究しデータマイニングの応用論文にまとめていた [3, 4]。先行文献から知ったこととして、convex clusteringはoptimal compressionなどとも呼ばれて、機械学習とポートフォリオ最適化の双方でよく研究されてきたようである。k-means法と違って単に大域最適解が求まるというのが興味のきっかけに過ぎなかったのだが、当時はわざと人工データをいろいろ生成してどういうカーネル関数がどういう結果をもたらすのか相当に調べたものである。地味なアルゴリズムでも、深く性質を考えるとときどき面白いことがあるものだ。

  • 今考えると明後日の方向の実験をかなりたくさん行ってしまったのだが
  • もし許可されるなら今の知識でより洗練された投資論文を出版したい気持ちもある

ここまでの議論では、背後の確率分布は定常であり、かつパラメータが既知であるという仮定をおいていた。実際の意思決定においては、確率分布は時間変化するしそのパラメータは推定されなければならない。確率分布の時間変化は金融市場においてはモーメンタムファクターやバリューファクターを用いて抽象化できるが、昨今の基礎科学予算配分の誤りはどうやらモーメンタムへの過剰信頼から来ているようなので、後段ではモーメンタム効果について特に述べる。また推定行為のほうであるが、過去のデータから取得するという機械学習的帰納発想に凝り固まってしまうと判断を間違えるであろう。

  • なおそれでも帰納的アプローチを取る場合、得られた分布にはestimation errorが乗るのでそれをベイズ法などでmitigateするのが良い
  • たとえばfractional-KellyポートフォリオをJames Steinの縮小推定の観点から正当化した[5]あたりが良い参考文献である

話を研究予算配分政策や地方への再配分の話に戻そう。基礎研究の世界では「選択と集中」政策こそが日本の科学技術力が衰退した原因だという主張がある。

 

これは日本の役所が行う「選択」行為がモーメンタム投資に似ているから起きてしまうことであるが、モーメンタム効果については次章で議論することとして、まずは時間定常な確率分布が背後にあった場合のケースだけを参考に議論しよう。直近のリターンに過剰に集中する行為は期待値がもっとも高いところに割合1を割り当てて、それとは異なる分野をアンダーウェイトしてしまうことに対応する。このアンダーウェイトは長期的に見ればコストが高くつく。なぜなら分散投資効果によるボートフォリオのボラティリティ削減メリットが得られないからだ。違う研究分野の双方にウェイトを割り当てることで、一つの分野がうまく行かない期間のドローダウンを抑えることができ、複利効果ではこのリスク削減が効いてくる。

分散投資の背後にある根本思想は、金融工学で著名なMarkowitzと筆者が紹介しているKellyとでは大きく異なる。Markowitz的な思想に基づくと、分散投資はリスク削減手段に過ぎない。もしリスクを気にしないリスク中立投資家がいた場合、期待値最大のところに全額つっこむべきであるという発想が出てくる。一方でKelly的なポートフォリオでは、分散投資はあくまでリターン最大化の追求で貪欲さの産物として生まれるものである。分散投資は複利によるリターンを最大化するために導入されるのであり、過剰集中したポートフォリオはむしろ資産増加率が足りない。Kelly criterionでも短期のリスクを減らしてはいるのだが、長期的に見た場合にはあくまでリスク削減ではなくてリターン最大化のために分散投資が必要であるという思想がMarkowitzの信者とはずれている

  • なお、実は面白い裏話として、当のMarkowitzはむしろKellyの方法を賞賛していたのだがSamuelsonは批判にいたったという違いが存在する

加えて、相関の高いアセット同士ではもっとも強いものに集中するという点にも大きなインプリケーションがある。研究室AがConvolutional Neural Net (CNN)の何らかのアーキテクチャを研究していて、研究室BがやっぱりCNNのちょっとしたバリエーションを研究していて、などという事態が発生した場合、研究室A&Bの双方にお金をさいてはならない。AかBのより強い方、またはAもBもできるようなもっと優れた研究室Cに集中投資すべきである。研究室BがAよりも研究成果が弱く見えたとき、研究室Bへの予算割り当てを正当化できるのはBがAと大きく違う分野に舵をきったときでしかない

要は、世の中のトレンドと似たり寄ったりの分野に力を注いでいるかぎり、そのような研究者には消えてもらわなければならないのである。この意味でKelly criterionは厳しい競争淘汰を要求する。しかし同時に、多様性の確保に腐心する研究者に対しては、たとえ彼らの既存研究実績が悪くてもとても寛容なのだ。とてつもなく大きなpositive skewnessを持っているような確率分布では、empirical meanは真のmeanを過少推定するためであり、既存実績が悪いから研究予算を削減するというのは長期で見たときのリターンを削減してしまう。

ともかくこれらの、競争と福祉、アメとムチのバランスを対数期待値最大化というシンプルな原理で解決するわけである。

東京と地方の資本配分にも同様のことが言える。もし、地方で東京とは大きく違った産業が育つなら、たとえその絶対的なGDPが東京より劣ってみえても再配分は大きく正当化される。個性の高い産業は、東京が特定のショックにやられて慢性失業状態のような状況になったときに日本全体の存続に役立ってくれる可能性が高いからだ。たとえば筆者も多少の縁があるポーランドは2008年のリーマンショックによるダメージがもっとも小さかった国の一つである。それまでの彼らは、建設業など「古い産業」に集中していたことが幸いした。一方で金融危機後のワルシャワはここぞとばかりに産業シフトを図り、むしろ中欧・東欧の金融セクターの中心地として劇的な発展を遂げてきた。今年2018年秋にポーランドはRussellによる分類で途上国から先進国に分類され直される。大きなファンドin-flowが見込まれる。

地方の意思決定者が金融バブルに浮かれる昔の欧米と東京を類似の存在とみなし、ポーランドのように合理的にチャンスを待つ姿勢をもっている限り再配分は正当化される。一方で彼らがメディアによる洗脳から来る東京への羨望を捨てられず、東京コピーを地元に作ろうなどと考えはじめたら、予算配分担当者はこのようなcopycat思想をとる地域に容赦してはならない。

筆者は日本の産業セクターの地域間分布に詳しくないが、少なくとも水産業や林業、あるいは未来のエネルギー産業などは東京より地方の方が産業ポテンシャルがあるだろう。金融機関やITソフトウェア会社は都市への過剰集中状態である東京の方に分がある。より理想的には、東京の金融・ITセクターのエンジニア・数学者たちが物理資源を利用した地方ビジネスにチャンスを見出してくれると良い協業ができる。彼らの多くはデジタルをデジタルのままで完結させてしまっていて、本当のprofitableなビジネスモデルがなかなか作れずにいるためだ。そのような理想的な誘致のためには、東京のような経済的ベネフィットが地元にないと嘆くよりは、東京人の目が節穴なうちに違う分野で一山あててやる、と山師のように意気込む方が健全である。

  • テキサスの人々がサンフランシスコのカルチャーに呑まれたりしないのと同じことだ
  • 地方から優秀な学力をもって東京に出て来た人たちが関東圏の私立校出身者の不甲斐なさに驚くことがあるようだが、その直感は決して間違っていない。ただ都会の問題点を熟知している関東圏の人もたくさんいるので都会人も決して侮らないように。いつだって未来に良い仲間ができるチャンスはある
  • 関東圏出身の筆者のまわりを見れば、キャリア上で大変お世話になった方々には地方出身者が多くいるし、彼らは独自性の追求を実際に日本国内・海外の双方で今も実践している

非定常化での動的配分

さて定常環境下での最適配分と比較すると東京への過剰集中や研究分野の『「選択」と集中』は合理的最適解からかけ離れていることを指摘した。だが、これらの過剰集中を一時的に正当化しうるファクターが存在し、金融市場ではそれはモーメンタム効果と呼ばれている。モーメンタムを考慮すると、どの程度現在の政策が正当化されうるか議論しよう。

Naiveな政策担当者が、「東京が今の所最も優れた都市だからもっと東京に資本投下しろ」と発言する場合、彼はモーメンタムの存在を仮定している。モーメンタム効果を都市開発にあてはめると、最近経済成長率の高かった都市は今後も経済成長率が高いという意味であるが、この効果の実態は、金融市場の性質と実態経済や基礎研究のあるべき姿とで適用されるべき時間スケールが違っていることに注意すべきである。

まず金融市場では、過去にあがった株価が今後もあがりやすいというのは、過去半年から最大で2年くらいのリターンに対する現象である。5-10年では平均回帰し、過去5-10年間にリターンが高かった銘柄は今後の5-10年はむしろリターンが低いという現象が多くの市場で観測される。モーメンタムに着目する場合は1-2年くらいで機動的にポートフォリオを入れ替えなければならない。過去5-10年の成功を当てにして投資するとむしろ惨めな目にあう可能性が高い。


ウォール街のモメンタムウォーカー

個人的考えでは、この時間スケールは企業活動に対する投資家のunder-reaction / over-reactionの速度に起因するもので、東京という街の強さを評価するにあたってはもう少し長い時間スケールが適用されるべきだろう。風水害に対して非常にrobustであるという特性を徳川家康が高く評価した時点で、東京には金融市場の心理的熱狂に起因するモーメンタムではなくmoatとなるべきファンダメンタルズが存在する。東京の強さはこの5-10年で出てきたような短い一過性のものではない。しかし一方で、どんな経済現象もいずれは平均回帰の波に飲み込まれるということは覚えておいた方が良い。5-10年という時間スケールでは、金融市場では平均回帰がおきるが、地域間の再配分に関してはむしろモーメンタムによる東京への一時的重点配分が正当化されるかもしれない。しかしそれでも、もっと長期の20-100年スパンでは東京もドローダウンに苦しむ日々がやってくる。そのような状況で日本全体のポートフォリオを存続させるには、東京とは異なる産業基盤が地方に育っている必要があって、20-100年単位の再配分は忘れてはならないように思われる。無論、top-downの政府からの再配分よりも情熱ある起業家が地域を変えてくれるbottom-upアプローチの方がより良いのではあるが。

事前分布としての文化資本・宗教

さて再配分しようにも単に金をばらまくことが投資ではない。再配分自体はしなければならないが、何を配分すればいいのか多くの人には分からないのである。数理的な表現で言い換えると、おそらくは地方にも複数の面白い投資候補はあるのだが、地方の中のどのアセットに資本を投下すべきかがわからない・リターンの確率分布がわからないのである。見かけ上の帰納的アプローチだけで意思決定することの限界が顕著なように思われる。

たとえば、冒頭のブログ著者の指摘にあるように、文化資本の欠落は地方の大きな問題であろうが、ではその文化資本を対象地域にどうやってinstallできるだろう? あるいはそれはtop-downの政策で介入主義的にinstallするべきものなのだろうか? 文化資本をtop-downに”installする”ことのリターンは、自律的にbottom-upに市民の学習関心・自助努力に任せることに比べてどれだけupsideがあるのだろうか? top-down政策に由来するupsideの限定・downsideの拡大になったりはしないだろうか?

筆者は地方出身ではないが、「文化資本の欠落」はフラクタル構造であることを幼少期より身にしみて感じている。筆者の最近の身の回りでいうと、東京と地方の格差と同様に、日本のエリートとイギリスやヨーロッパのエリートとの格差を顕著に感じる。それはオックスフォードに来たから感じるわけではなくて中学生の頃からずっとおかしいと感じていたことをオックスフォードの地で再確認しただけなのだ。

たとえば、日本社会は移民を単なる労働力としてしか認識せず、コミュニティとして受け入れることを頑なに拒絶しているように見受けられる。これはたとえBrexitが決まっても多様な人々が共生するロンドンとは極めて大きな違いである。イギリスも島国ゆえに日本と同様にシャイな人は多いし、xenophobiaに取り憑かれた人々もそれなりにいる。しかしそれでも大多数の人は相手の幸福を考える心 (これは日本人も多く持っているはずだ) を他人種との共生にうまく適用できているように感じるし、シャイな人こそ大体の場合親切である。

(余談だがこちらの望月さんは筆者の前職時代の同僚で大変に尊敬できる人格の持ち主である)

東京とロンドンの差は、エリートの卵である東京大学の学生とオックスフォード大学の学生との差からも読み取れる。筆者の実感では、数学的能力・アナリティカルな能力に関しては東京大学とオックスフォード大学の若者とで大きな差はない。計算能力だけ見れば東大の方がはるかに上手かもしれない。しかしこちらの学生は、未知の分野を学ぶこと・自分たちと違う社会の人たちについて学び交流することには、おそらくは大きな喜び・リターンがあるだろうという、未知への可能性に賭ける信念・ベイズ統計学でいうところの事前分布を持っているように思われるのである。

ここでのポイントは、個々の学生は、過去に外国の歴史や異なる宗教について学んだら嬉しいという体験があったからまた学ぶことにしたという、経験 (= 観測値)に基づいて意思決定しているわけではないという点である。未経験の状態で学習をはじめられることが本質的に優れているのだ。個人にとって詳細は非観測であるが、自分の知らない世界でもっと長い間ワークしてきた信念にはそれなりの意味があるであろうという演繹的思考によって事前分布を設定することが彼らの知的好奇心・学習意欲につながっているのである。

そしてなぜこのような事前分布を持つことができるのかと問うとき、筆者は宗教の偉大な力に感服せざるを得ない。観測が足りない不確実な世界ではデータよりも事前分布がものをいうことは機械学習研究者には容易に想像つくことである。

たとえば、大学にいっても対して人生変わらないかもしれないし、自分にとっても面白いかどうかわからないけど、何も理由がなければ行かないより取り敢えず行ったほうがよいという信念も一つの優れた事前分布である。とりあえず事前分布として大学に行くことを前提する。大学にいってみて、たとえばBill GatesやLarry Ellisonのように、大学の講義や議論よりも信じられないくらい没頭できるものを見つけてしまったなら別に中退してもよい。それは観測によって事前分布が事後分布にupdateされたからである。この事後分布は個人とキャリアの相性といったより詳細な情報を取り込んでいて事前分布よりも優れた予測能力を持つ。しかし重要なのは、観測が手に入ってから判断するのではなく、観測がない段階で良い事前分布をもとに一定のギャンブルをする能力なのである。

地方産業育成で何が良い将来リターンにつながるかは筆者にもわからない(というと正確にはちょっと嘘で、水産業その他で日本の地方の投資で面白そうなものはいくつもあるのだが、あまりここで書くと金融機関上の規制に引っかかってしまうのでここはご容赦ください。一見デジタルでないものに旨味がある)。しかしこのような良い事前分布を人々にもってもらうことは長期的には有益だろう。もし、大学に行くことは無意味で時間の無駄であるという、誤った信念 – より正確には、一部の例外(e.g., Gates, Ellison)にとってはtrueになりえるがたくさんの事例をかき集めてきて汎化したときには悪い事前分布とみなせるもの -がどういう過程で広まったか、どうすれば覆せるかわかるならそれは良い投資になるだろう。この場合、top-downで無理やり信念をinstallすることはあまり答えではないように思われる。地域社会から世界に羽ばたいた先輩といった身近な接点の方が、ある日東京からやってきた計画主義の人々よりもずっと適切な答えを提供してくれるはずだ。

  • これらのコメントは過疎地域に住んでいた人には奇妙にうつるかもしれない。もちろん筆者は基本的には都会地域出身の人物でありこれは外野の意見に過ぎない
  • しかし文化資本の欠落という現象だけに関しては筆者も個人的体験に起因する意見をそれなりに持っている。筆者が中学2年まで住んでいたのは千葉県流山市という地域であったが、東京からさほど離れていないはずのこの地域では、校内暴力やそれを抑えるための異常な管理教育が常態化していた
  • たとえば、すぐ近所の鉄道高架下のトンネルでは通り魔が金属バットで子供に殴りつけるなどという事件について聞かされたし、ゲームセンターにはあまりに恐喝魔が多いのでとにかく娯楽施設に行くなという生活指導ばかりされた。加えて、校内暴力と管理教育のせいで近所の高校で校長が自殺したなどというニュースを聞かされたことを覚えているのだが、Wikipediaが読める現代にいたってそれが事実であったことを再確認させられてしまった! これらの環境から、中学や高校というのはどれだけ怖いところなのだろうと子供のときは怯えていたものである
  • しかし私立中学に進み、その後神奈川のもっと裕福な市民が住んでいる地域に引っ越すことでこれらの殺伐とした環境とは無縁になった。神奈川で最初に発見したのは、本屋さんのラインナップが千葉よりも面白いというものであった。筆者にとって最初の読書体験の楽しさは中学1年のときに親から東京八重洲ブックセンターを教えてもらって訪れたときであるが、八重洲ほどではないものの神奈川・東京多摩の地元で結構いろいろなものが見つかるなと、流山との格差を実感したことは覚えている
  • つまり東京近郊でも見えない格差があり、そういった再帰的構造にどうアプローチするかが問われているのだろう

地方により良い信念を持ってもらうための方法論と、アナリティカルな能力は少なくとも優れている東京大学の学生たちに広い意味で世界を知ったリーダーになってもらうためにはどうすべきなのかといった方法論は共通だろう。ただ筆者の本音としてはやはり、壁はかなり厚い。ある程度年齢を重ねた読者諸賢なら気づいていると思うが、キリスト教やユダヤ教・イスラム教の力は本当に偉大だし、アジアでもジャイナ教徒がなぜ優れたダイヤモンドディーラーになったかの経緯などを知ると、優れた宗教とは優れたビジネスそのものなのだと痛感する。日本でも仏教に由来する優れた実践的思想があるが、宗教的実践を一見非合理なものとして棄却してしまう発想(それ自体が一種の宗教だが)が人生の幅拡大を妨げるケースが多いように見受けられる。オウム真理教の事件などを通じて、宗教に関して社会がtraumatiseされることで、人々が自分の内側にもっていた宗教の合理性・非合理性を自覚できていないようである。

今すぐ役に立たないものの長期リターン

最後になるが、Kelly Criterion由来の意思決定は筆者の人生を大きく変えたという個人的経験をお伝えして終わりとする。7年も前に2年程度の時間をかけたに過ぎなかったconex clusteringまわりの応用とアルゴリズムの挙動分析は、当時は単に筆者個人の興味からスタートしたに過ぎなかった。筆者よりも確率論に詳しい一流研究者から見たら、ある意味でどうでもいい問題を扱っていただけに過ぎないかもしれない。あるいは筆者ではなく彼らが同じ研究分野に従事したら遥かに優れた研究成果を短時間で出したかもしれない。実験内容を思い出しても、人工データとカーネル関数の差し替えによる実験はビジネスに直結するものとは言い難かった。人工データではなく実データを見ろという批判は機械学習では昔から常につきまとうものであったので、まさに筆者は他の有識者から批判されやすいことをやったと言える。

しかし数年後、convex clusteringとKelly criterionが本質的に同一の最適化問題を解いていることに気づいた時期と、そして演繹的な意思決定と帰納的な機械学習アプローチのintersectionがおもしろい境界領域であることに気づいた時期とが幸運にも重なったのである。そこにヘッドハントまでやってきたことで、金融ビジネスとは無縁であったはずの筆者に突然イギリスでの仕事機会が舞い降りることとなった。このような複合的組み合わせによるチャンスは、数学力のような単一のスキルで勝負するのではなくいくつもの見えない個人的投資が重なってはじめて結実するものである。

今、とてもノイズが多く帰納的アプローチによって容易に間違った結論を出しかねない環境の中で、当時の実験経験はrobustnessを確保するための様々なプロセスに役立っている。また保守的なincome投資のビジネスと革新的な基礎研究開発によるcapital gainとの間に横たわる溝にどうアプローチするか考える上で、より広いレベルでのポートフォリオ構築にも役立っている。このような今のリターンはそれまでの筆者の「業績」とか「伸びそうな分野」に基づいた帰納的判断だけによる意思決定では得られなかったであろう。未知のものには果敢に学び、飛び込んでみるべきであるという宗教だけが将来を変えてくれるのだ。

今回久しぶりに簡単な数式をブログに載せる機会を設けた。本当はもっと紹介したい気持ちもあるが、そこから先は筆者のproprietaryな研究内容につながってしまうためこれ以上書くことはできない。このように限定された情報公開であっても、Kelly Criterionとconvex clusteringの示唆することから自分たちの社会のあり方を見つめ直す人々が多く出てきたら望外の喜びである。とくに、普段incomeがすぐに入るタイプのビジネスかまたはpublic sectorでの仕事に忙殺されており、基礎研究のようなpositive skewedな確率分布からのリターンに馴染みが薄い人にとっては、自分と研究者との間のコミュニケーションになぜ大きなギャップがあるのかを理解する手助けになると思う。

少額でいいがゼロではいけないという規範の合理性を、確率論に詳しくない市井の人々が理解しはじめたら世の中は大きく変わると思う。願わくば、基礎研究における予算配分政策に携わる人たちにこのような規律が浸透していくことが、twitter等で同業者の嘆きを日々観測している筆者の望みである。

References

Footnotes

  • [1]なお、これ読んでる地元の方で研究トピックの雑談交換に興味持たれた方いましたらぜひご連絡ください。一応、St Antony’s CollegeのNissan Institute of Japanese StudiesのKeijiban mailing listには登録してもらったのですが積極的に活用していない状態です。
  • [2]フランスの極度にcentraliseされたシステムを批判するドイツ人たちは一方で、EUという共通通貨のせいで南欧諸国の自動車産業が苦境に立たされた経緯をよく理解していないようである。南欧諸国は怠慢だから経済成長力が低いという誤認は比較的典型的なようだ。ある意味で、誤った長時間労働信仰から抜けられない日本と似ているかもしれない。共通通貨が南欧諸国の経済を傷つけるメカニズムを実際に説明してみると、ある程度の学がある人であれば彼らも気づくようなので、わかってて悪意ある通貨統合をしているというよりは、純粋に無知から来ている様子である。ドイツは過去のワイマール共和国時代のハイパーインフレーションが今もトラウマとして残っていると彼らはよく言う。この状況で緊縮財政のドグマを捨てることは彼らには難しいだろう。トラウマから来るインフレパラノイアが、時には財政出動を必要とする南欧諸国との考え方の違い・緊張状態の根本要因になっているように思われる。この価値観の違いを見る上で、どうやら、EUの成立理念のである、二度と戦争をしないというコミットメントの維持には通貨統合が大事だとの思い込みが相互理解を妨げているように思われる。よく考えてみれば、言語の違う欧州各国をアメリカのように単一国家とするのは無理があるし、通貨統合などなくても貿易関税をなくすだけでも十分な相互恩恵・戦争抑止効果がある。ドイツが過剰にEU大国幻想にとらわれることが、例えばBrexitを主導したボリス・ジョンソン(著者はこの政治家を尊敬できないのだが)の言説に一定の説得力を与えてしまった面は否定できない。
  • [3]南欧諸国がドイツの追求を振り切った例として、左派と右派の合意のもとにトロイカ3国への返済を遅らせて自国投資を優先したポルトガルがある。ポルトガルはこの7年で劇的な経済成長を遂げた
  • [4]経済学者の言説は、SamuelsonやMarkowitzの研究成果をもとに期待値が高いアセットに極力betするのが合理的だと考えるところから来ているせいではないかと思う。これはレバレッジを無限にかけることができてどれだけダウンサイドがきても破産しない状況では正当化できるが、資本が有限のときは本質をついていない。著者はKellyの方が本質をついていると考える側であり、Kelly的にポートフォリオを組む場合は再配分は正当化される。SamuelsonはKellyを批判したのだが、Ziembaも指摘するように時が経てばたつほどやはりKelly criterionは本質を突いているように思われる

遅い社会と早い個人のLearning to Learn

人工知能による失業増大はよく議論されるが、その実態と個人レベルでできる対策について掘り下げてみたい。書き下してみたら非常に長くなってしまったので分けようかとも思ったのだが、これらのトピックが一連でつながっていることを強調したかったため、あえて一投稿とすることにした。後日分割して同内容を再投稿するかもしれない。

AIにより失業する可能性の高い職業と、逆に需要の増える職業について議論した論文が2013年に発表されて話題になった [1]。その著者の一人であるMichael A. Osborne教授は、オックスフォード大学において著者と同じ建物に勤務している。紅茶を常にloose leafで丁寧に入れる穏やかな方だ。どこまで論文の予想を信じるべきかについて、Gaussian Process (GP)を使ったこの論文のメソドロジーを聞いたりもしたのだが、最近正式なジャーナル論文になっていたので最新版をReferenceに載せておいた。

  • 著者が個人的に思う彼の論文の良いところは、予測だけでなくその予測がまちがっている可能性のある不確実性についても評価しているところである: GPの強みだ

論文の中身には立ち入らないが、内輪のワークショップで彼が楽観的にコメントしていたことを強調しておく。AIにより失業する職種はたくさんあるが、人の心や日常生活に寄り添う仕事といったカテゴリーの中に増える仕事もたくさんある。若い世代にとっては、単に親の職業と類似した職業を選ぶという愚を犯さなければ良いだけのことで、自分の興味を持ったことがらを突き詰めて楽しんで学んで行ってほしいとのことだ。我々の世代が職業選択/キャリア構築の際に採択していた規範は、メタレベルでは未来でも有効なのである。

  • もし著者があえて批判的に見るなら、論文内の予測が外れる可能性が高いのは芸術家に関する楽観部分だろうか。ただ具体的予測の一部が期待値がずれるのは確率的予測の宿命なので、これは批判ですらない。そしてこれはOsborne教授の意見ではなくて、学習データとなったアンケートに答えた人たちがそのような考えを持っているというだけである
  • 芸術的才能をもった人たちの需要は増えると答えた人が多かったが、たとえばAlgorithmic Compositionの今日の発展 (実はこれは不連続な変化ではなくてXenakisなりDavid Copeらから脈々と続いてきた活動であるし、12音技法の開拓以降はある種必然であった)を見るに、AIがある程度の創造性を提供していることを忘れてはいけない
  • この「ある程度の」創造性は、他の過去の芸術家の様式模倣という、Recurrent Neural Network / Convolutional Neural Network等が得意なものもあれば、
  • 過去の様式上今まで聴いたことがないが、生成されたものが芸術的に高い価値を認めうるという様式レベルの汎化能力を獲得するものまで幅がある
  • どちらの場合も作曲家にとっては職業上の脅威になりえる。一方で、作曲家もAIに教えてもらいながら独自の作品を創ることで、人間の創造性が拡大される可能性も高い
  • 囲碁AIの生んだ新しい戦略によって人間棋士が学びやすくなっている現象と似ている


Algorithmic Composition

さて、著者が今日議論したいことは、本当の脅威はAIそのものなのだろうか? AIが脅威とリンクしやすい今日の社会構造の方ではないか? という問いである。どちらが真実なのかという答えは著者個人は持っていない。しかし最近、後者の考えをいくつか発展させてみたので、読者諸賢のキャリア上の参考として、書き下したいと思う。

今日の要旨

  • すべては新環境に適応する速度の問題である
  • 速度をゆるめる政治的圧力をかけるか、個人が学習速度を速めるか、選ぶ必要がある
  • 一般的には、社会変化速度を出来るだけ抑えつつ、個人の学習速度を最大化するのが良い
  • ただしAIに関しては社会が低速に進むことを期待できない
  • 個人にとっての学習速度を最大化するために、「学び方について学ぼう」
  • 安心せよ。次第に学習速度が加速し、経験ある人は初学者より早く学べるようになる

予測できる人 / 早く学習する人

優れた起業家は自分の作り上げたビジネスを、他社にdisruptされる前に自分自身でdisruptできる。Amazon.comが紙の本で確固たるビジネスを作り上げた後にKindleで書籍部門の利益を少なくとも最初は容赦なく食べていったのは良い例である。真実かどうかはしらないが、Jeff Bezos氏は電子書籍の担当者にお前たちの使命は紙の書籍部署の連中を首にすることだ、とハッパをかけるという噂もある。このような自己否定的傾向は、Christensen教授による有名な「イノベーションのジレンマ」を避けるために不可欠である。

起業家レベルまでいかなくても、柔軟な思考回路を持った労働者はうまく担当事業を変えて行く。例えAIによって自らの現在のビジネスがdisruptされる日が来るとしても、その審判の日が訪れるまでにはタイムラグがある。彼らはこのラグ期間に新しい分野を学び、Nextビジネスを見つけ出す。専門領域の滑らかなシフト・拡大を測っている人たちは、時間とともに変わるビジネスフィールドのどこにおいても充実した人生を送っている。

  • 著者が、撤退オプションを残しつつも、マーケティング・広告領域からファイナンス・投資領域に移ってきたのもこれと関係がある

さらに話は起業家・労働者にすら限らない。政府レベルでこの思考が徹底している国もあるのだ。代表的なのはスウェーデンである。衰退産業と新産業との間における労働力配分最適化という課題において、スウェーデン政府は衰退産業を切り捨てることに躊躇がない。有名な例はVOLVOとSAABからの救済申請却下である。スウェーデン政府は過去に船舶事業会社を救済した結果、長期間低成長率に苦しむという痛い目にあった。過去の失敗から学んだ彼らは、ゾンビ企業を容赦なく切り捨てる方針を採用した。しかし同時に、福祉国家が長年提供してきた社会安定の維持に腐心した彼らは、代わりに包括的な職業訓練プログラムを提供し、労働者に新しい産業への適応時間を与えた。著者が見る限り、この方法論は福祉の源泉となる経済利潤の確保と社会不安の回避という二つのバランスをとる上で、現実解の中での理想に近い。

  • ムチ (厳しい市場競争) とアメ(福祉予算による訓練プログラム)のうまい組み合わせである
  • もちろん、ターゲット先の産業を間違えたらどうするんだ、職業訓練プログラムで本当に現在ではなく未来役立つスキルがつくのかという詳細点は議論がある
  • しかし自動車工が3年訓練でバイオマス発電技術者として転職したケースなどを見るに、
  • 単にレッセフェールで失業者放置 or パターナリズムでゾンビを延命するよりは実践的にworkしているとは言えるだろう

スウェーデン・パラドックス

さて、このような機動的なシフトができる起業家・労働者・国家とそうでないところとの間にはどのような差があるのだろうか。確実に忘れてはならないことは、タイムラグを利用したシフトには当然のことながら期限があるということである。この期限内のシフトを成功させるようなメソドロジーが、社会のどの意思決定階層においても必要である。ゆえにどうやったら早くシフトできるんだ? というのが真の問いであるべきだ。加えて、シフト先を間違える(起業家の場合は参入市場の選定、職業訓練の場合はターゲット産業)と巨大な損失につながるので、少なくともランダムよりはましな確度で次に伸びる場所を創る or 特定する必要があるように思える。しかしながらもう少し考えると、後者は実は優先順位としては2番目で、早いシフトさえ達成すれば細かいことは忘れてよいことに気づく。

  • 最優先である早く学習する能力が身についていれば、選定を間違えて失敗してもまたquickに別のことにtryすれば良いだけだからだ
  • また社会的な未来予測というものは、過去にてんで間違って予言ばかり提供してきた。そういった不確実性の高すぎる予測を信頼して行動するのは理にかなっていない

本当の脅威はAIではなくてhyper-connectivityかもしれない

なぜAIによる失業が、過去の技術革新による失業よりも深刻に捉えられているのか、読者諸賢はどう受け止められているだろうか。ITはあらゆる事務職員を危機に陥れた。インターネットは小売業や証券会社を危機に陥れた。こういった過去の創造的破壊と、AIによる創造的破壊は何が違うのだろうか。

一つの答えは、機械学習および強化学習 / 一般的な最適化アルゴリズムを学んでいるとはっきりわかるが、AIの適用範囲・役立つ範囲が広すぎるためである。Amazon.comが出てきたとき既存書店は彼らの存在をある程度認識していただろうが、家電量販店は書店ほどには当初脅威とは思っていなかったのではないだろうか。しかし書店で橋頭堡を作ったAmazon.comは全てのRetailerの脅威に変わった。想像していなかったところからやってきたダークホースが自らのビジネスを脅かす、というのが広範囲に使える技術がもたらす社会現象である。そして弱いAIにせよ、AGIにせよ、AIはこのような性質を広く持っている。ロンドンの変わったスタートアップ (注: Googleに買収される前のDeepMind社のことだ) がATARIのビデオゲームを自動で解くおもちゃを作っていたと思ったら、その背後にある技術がいつのまにか銀行家にとっての脅威になっていた、というようなことだ。脅威が 迫ってくるまでの時間が以前より短くなっているため、人間側の準備が間に合わなくなっているのである。

通常はローカルコミュニティに閉じているはずのクラスター化された社会ネットワーク構造において、その汎用性の高さゆえにクラスター境界を想定外の高速度で超える技術がいくつかある。機械学習に基づいたAIはその波及速度が人類の歴史において最速にあたるだろう。古いエキスパートシステムには人間が予測器を設計することに由来する顕著なボトルネックがあったが、機械学習はこのボトルネックをはるかに減らしてきた。

そしてネットワーク化された経済ではwinner-take-all効果が高まる。世界最低の調達コストを実現した一部の企業が全ての利潤を独占したりする。以前紹介したバリュー投資の分析で、グローバル企業によるwinner-take-all現象を逃れて生き残る数少ないローカル優良企業は、砂利運搬業のように物理的に重いモノを仲介していたことを思い出そう。物理的な制限のないアイデア: 例えばアルゴリズム上のイノベーションは物理的なものよりも早く普及し、その利得分布におけるheavy-tail性を強める。一部の強い人だけに富が集中してしまうのである。


千年投資の公理 ──売られ過ぎの優良企業を買う

一つの技術変化が急速に全てのノードに影響するような社会システムは、hyper-connectedネットワークであると言えるだろう。グローバリゼーション・IT化で準備されていたhyper-connectivityに対してAIという燃料が投下されたわけである。

さて、hyper-connectivityによるダークホースの脅威にいつも晒される社会では、守る側の立場は何が自分の脅威になるのかを絶えず監視していないといけない。そのためには、自分にとって馴染みのなかった新技術が自分のビジネス領域をどう変えてしまうのか、優れた仮説立案能力が必要である。AIに限らず、自分のビジネスと新技術の組み合わせによる正/負の影響を客観的に考えるだけの頭脳が必須となるが、技術的詳細に立ち入らずにこれを行うのはほとんどの人にとっては困難であろう。確実な方法は技術的詳細も含めて学ぶことである。その結果、端的にいって複数の新しい技術を早く学べない人は仕事がなくなるのである。

新技術の恩恵を広く行き渡らせつつも、hyper-connectivityに由来する脅威を緩和するにはどうすべきか。一部の人が解だと思っているが実際にはworkしないアプローチが1つあり、現実解は2種類あると著者は考えている。変化を拒絶するという態度はWorkしない。何故なら自社が新技術の採択に臆病になっていても、外国の競合他社は非常に積極的であることが大半だからである。変化を拒絶するのはその経営者の勝手だが、遠からぬうちにその企業が倒れるだけだ。では現実解の2つは何かというと、1つ目は普及速度を社会的にゆるめることで、2つ目は個人が普及速度に追いつけるよう早く学習することだ。それぞれの方法の利点や可能性については歴史が教えてくれるので、分けて議論しよう。

1. 普及速度を緩める: 過渡状態の重要性

実はhyper-connectivityはインターネットに限ったものではない。グローバリゼーションと金融自由化という過去の波はいくつもの教訓を提供しているのでそちらを紹介しよう。

社会が状態Aから状態Bに移行するとき、たとえ状態Bの方が長い目でみれば望ましいものであったとしても、AからBへの移行速度が早すぎると多くの問題が生じる。これを顕著に見せたのが1997年のアジア通貨危機やソビエト崩壊後のロシアにおける急速な民営化であった。保護主義や統制経済から自由主義市場経済への移行が最終的に望ましいとしても、急激な自由化は急にやってきてバブルを引き起こし急速に引き上げるたぐいの国際金融資本を惹きつけてしまう。マレーシアで当時のマハティール首相が採用した一見不合理な資本統制が、過渡期を上手に乗り切るという観点ではタイやインドネシアよりも賢かったことは今ならわかるだろう。だからといってマレーシアは別に外資の参入をずっと拒絶し続けているわけではないし、資本主義国としての道をきちんと歩んでいる。理想状態だけではなくそこに至るための過渡的なパスを熟考すのが大事なのだ。Amazon.comが最終的にはなんでも売るつもりであっても、最初は書籍からスタートしたのと同様である。


世界を不幸にしたグローバリズムの正体

この過渡期の設計を間違えると、長期間たった後でさえ目標未達の貧しい状況になりかねない。たとえばチリのピノチェト政権時に行われたような、南米で行われた急速な右派的自由化は大資本の支配を通じて反米的反発の拡大をもたらしてしまった。今でも南米では共産主義がworkすると信じる層が残っているようである。資本主義が、急速な格差拡大でなく多くの広くの層への恩恵につながるという実感を、少なくとも西ヨーロッパや東アジアと同レベルで南米市民が享受していたならば、ポピュリズム由来の誤った信仰は今日の南米のようには強くなかったはずである。ボリビアやベネズエラは誤った信念によって悲劇的な失敗の道を辿った。

  • 著者の個人的考えでは、亡くなったウゴ・チャベス元大統領は、少なくとも経団連のクーデターから救い出されて大統領に戻ったころはそれなりの高い理想を持っていたと思う
  • 彼は別に資本主義のシステムに詳しい経済畑の人間ではなく軍人であって、石油利権の恩恵に預かれない貧困層を救済する方法だったら何でもよかったのではないか
  • しかし制限のない自由化と隣り合わせの外国オイルメジャーとの利権闘争においては、社会主義に走る以外の選択肢は、少なくとも彼の頭脳では無理だったのであろう
  • そして絶対的な権力は絶対的に腐敗する。憲法を改正して禁止されていた3選を可能にした時点でベネズエラの暗黒未来は決まっていたようなものだ
  • そして彼の死後、同様に経済に疎いことに加えて、チャベスよりもさらに強権的で人望に劣る今のマドゥロ大統領になってはお察しの通りである


The Open Society and Its Enemies : the spell of Plato (Routledge Classics)

逆に速度やタイミングに慎重であったことで大きな恩恵がもたらされた例もある。政治の世界で著者が思い当たるのは、南アフリカ共和国のフレデリック・デクラーク元大統領である。アパルトヘイト推進側からキャリアをスタートした彼は、ある時期からアパルトヘイトの廃止に関心があったようであるが、ネルソン・マンデラへの歩み寄りというアクションを起こすためにソ連の弱体化を待った。これはマンデラ率いるANCがソ連との協力関係があることで、ANCとの和解が共産化を引き起こす恐れがあったためである。マンデラは当時はアメリカ合衆国からテロリスト認定されていた。

  • このあたりの経緯は著者も思春期に目の当たりにしたことを思い出しつつ、後日の解説をあやふやに理解しているだけである
  • もっと興味のある方は自分で調べてみていただきたい。著者にとっては、たとえばこちらの解説は包括的で学びになった。

マルタ会談からたった10日後にマンデラに接触を図ったデクラーク大統領に、著者はただひたすら感銘を受けざるを得ない。明らかにこれは周到に機が熟するのをまった結果であり、かつ条件が満たされたならば電光石火で動くべきであるという、手本の中の手本を示している。

デクラーク大統領がソ連の弱体化を待ったように、マクロな経済政策レベルでは最終状態までの遷移をわざと遅くすることで社会的な恩恵が増えることが多々ある。議論は次回とするが、待つ戦略は中国の老子の「無為」などにも見られて孫子につながっているほか、数理モデルのレベルでも過渡状態の分析は多くのインプリケーションを生む。ピノチェト大統領の背後にいたフリードマンやルーカスたちが、均衡への着目だけでなく過渡状態のダイナミクスにもっと気を使っていたならば、ピノチェトの評価も違っていたかもしれない。

一部の読者諸賢は、ここで議論した遅い行動の利点は、政治家レベルの社会的意思決定において発生していることに気づいているだろう。そしてAIの普及におけるインプリケーションを取り出そうとしたときには、過去の成功例の背後にあった前提条件を理解しなければいけない。マハティール首相やデクラーク大統領の英断は、自国だけが遅い変化を選択し他国がもっと高速な変化を選択したという短期的不利状況が、長期間の損失にはつながらなかったために成功した。デクラーク氏の場合、そもそも南アの白人社会が国際社会からの制裁を受け続ける覚悟をもっていたということで、経済ダメージはあっても政治資本が残ったという背景もある。

AIの急速な普及はグローバルな法人税値下げ競争と似ている。自分たちだけ抜け駆けして値下げするタックスヘイブン国家がいる限り、妥協してどの国家も下げて税収を圧迫せざるを得ない構造が原理的に存在する。同様に、失業による社会不安を危惧した政府が規制によってAIのより緩やかな浸透を考えたとしても、他国のもっと優れた企業がそれぞれの産業領域でAIの急速な活用により独占状態にいたるリスクを排除できない。政府がよほど愚か者でない限りは、AIの活用はビジネスパーソンのみなさん他社に負けず頑張ってくださいとしか言えないのだ。

  • それでも強引に規制をかけると、おそらくは過去に強い金融規制と不透明なコーポレート・ガバナンスを嫌って東京から香港やシンガポールに金融機関のアジア拠点が流出したのと同様の問題が、AIをフル活用した企業の間に発生するだろう
  • 政府が規制政策としてできるのは、せいぜい兵器開発や遺伝子操作にAIを用いる際の倫理上の問題について歯止めをかけることだけだ。そのような問題が大きくないもっと一般的な商取引においては、規制を入れた国の企業は単に衰退するだけであろう

そのようなわけで、遅い行動の利点を散々に紹介しつつ、AIに関してはこの利点があまり享受できそうにないという結論が得られる。それでも漸進的な変化を選択した先人たちから現代の私たちも大いに学ぶべきである。本題である個人レベルの意思決定の前にやたら前置きを置いたのは、例えばデクラーク大統領の英断から著者個人が受けた感銘を共有したかったためだ。

  • 政治レベルでの漸進性という観点では、近年の政治ではこれが顕著にまずくなっていると著者は感じている
  • サダム・フセインやムアンマル・カダフィが「独裁者だから」という理由で排除してしまった結果がどうだろうか
    • そもそもカダフィ大佐はインターポールにオサマ・ビン・ラディンの逮捕状を請求した最初の人物であった
  • ワッハーブ派の影響を受けたテロリスト達を世俗的な独裁者が押さえつけていた構図について、西側諸国の指導者たちはどの程度の事前理解があったのだろうか
  • もちろんサダム・フセインもムアンマル・カダフィも冷酷で恐ろしい独裁者だった。ただしそれが単に悪だから除去しようというのは、First-order effectしか考慮していない極めてnaïveな判断である
  • 彼らがいなくなった場合のワッハーブ派の活動というSecond-order effectを考慮していない限り、拙速な判断は大体の場合、災害につながるのである。

 


ぬりつぶされた真実

2. 「学び方を学んで」学習速度を早める

社会レベルでは遅い行動には利点があるがAIの文脈だとあまり利点を享受できそうにないという結論を一旦得た。もちろんこの結論はさらなる論考や実証で将来覆るかもしれないが、とりあえず是として進もう。個人レベルの行動、政府は一旦放っておいて私たち個人ができる行動についてはどうだろうか。こちらの結論は極めて明確で、出来るだけ早いことが望まれる。ロジックはこういうことだ: 社会ができるだけゆっくり動く一方で、個人がその変化に先回り or 十分に余裕を持って追いついていれば、過渡期につきものの混乱を最小化した上で良い移行が達成できる。個人が社会よりも早いことが大事なのである。

前回のブログではゆっくりと漸進的に研究を進めてシグナルを取り出せと書いて、これは相反するメッセージのように移るので先に明確にしておく。インプットを高速に、アウトプットを低速・品質重視で個人は動こう、というのが鍵である。他者や先行技術の理解には広範な範囲をできるだけ早くカバーする必要がある。自分の独創性を加えたオリジナルワークは、自己否定的・懐疑的な検証によって品質を最大化すること。

他者から学ぶとはどういうことだろうか。具体例を想像してもらうために、最近著者のもとに届いたヘッドハンターからのスキル要件をあげてみよう。著者はこの要件に関するスキルセットが不足している上に現職に満足していて行く気もないのだが、データサイエンスや機械学習などの今の著者のスキルに加えて、Fixed income securities (債券や優先株などの一定収益を期待する証券)に詳しい人物を探しているそうである。著者の所属するファンドでもFixed income securitiesは取引対象であるが未熟者ゆえ著者個人はこれにはまだ習熟していない。それを習得している者にはさらなる上のステージがあり得るということである。FinTechや決済ビジネスにおけるイノベーションでは、どうやって一般ユーザーの負担するコストを安くしつつ沢山の人にそれを使ってもらうかが大事であるから、確率的なアービトラージ等を通じて決済用のフロントエンドと、コスト or リスク分散のバックエンドとを出来るだけ統合した形で実現するのは大事であろう。少し拡大すれば、Machine Learning + Blockchain + Fixed Income Businessという3分野統合スキルセットの持ち主には飛躍的な将来がありそうである。

  • Fixed income securities に詳しい人は銀行やヘッジファンドにいくらでもいる
  • Blockchainの基礎技術とそれがもたらす社会変化を熱心に追っている人も最近は多い
  • 機械学習については大学か産業界で2-3年の経験がある人には一定スキルがあるだろう
  • しかし3つ全部のスキルを要求される仕事では、急に競争相手がいなくなるのである。そして3つを習熟するにあたって、あなたがフェルマーの最終定理を証明できるような天才である必要は全くない

これら3つを学ぶといっても、昭和の日本企業で推奨されていたようなゼネラリスト、全部が70-75点程度の理解である人材には声はかからないであろう。理想的には、3つの分野全てにおいて、サクセスフルなビジネスを一つ手がけたことがあるか、またはトップ国際会議 or ジャーナルに論文を通している、といったどれも90-95点という状況が望ましい。そのような人材はGeneralistではなくてVersatilistと呼ばれる。Versatilistになるのが不可能ならSpecialist+リテラシーで対処するしかなく、一つだけ120点で他が80点という状況を狙うことになる。

このような複数スキルセットを包括的に学ぼうとしたときに、長時間労働・勉強にも限界がある。一見異なる3分野間の共通性をどうやって見出し、早く学習できるかどうかが、長期的に効いてくるだろう。そのような効率的な学習法で自分個人にあった方法論を見出した人にはすごいボーナスが来るが、それ以外の人は仕事を失う創造的破壊が起きているのだろう。

効率的な学習法とは、予備校の教師が教えるような効率的勉強法よりも一段階メタレベルのアプローチを指している。あなたが三角関数という新しい概念を高校で習ったとき、あなたは三角関数について学んでいたのだろうか。それとも何か未知の概念を習得するときにどうすべきかという規範を学んでいたのだろうか。あなたは前者を学んでいたつもりだったのに、当時は冴えなかったクラスメートの一人が実は前者と後者を学んでいた可能性を考えたことはないだろうか。そしてそのクラスメートは大人になってから突然大化けした。実は、前者と後者をともに学ぶことについては、機械学習の先端に大きなヒントがある。

機械学習の最近のトレンドの一つに learning to learn アルゴリズムというものがある。Learning to learnタスクでは、どのような学習アルゴリズムが同じサンプルサイズでもより予測精度の高いモデルを生み出すかのメタルールを自動学習する。予備校教師の例で言えば、学習法Aを勧めた教師と、その学習法とは違うBを勧めた教師と、どちらのアドバイスに従うべきかを、学習サンプルを収集して判別するのである。

人間が新スキルを得るための学習法というものは、その学習法自体の良し悪しを統計的に比較検討できるはずである。例えば、Blockchianのど素人である著者がこの分野を勉強しようと思ったとき、次の複数のアプローチのどれが有効だろうか。

  1. 新分野の中で興味をもった論文からはじめてその参考文献を追って行く
  2. 新分野の代表テキストを最初から最後まで読む and/or 課題をやる
  3. 新分野において信頼できる専門家の書いた一般書を読み、その中の参考文献を追う

この3つのどれがより著者にとって有効であるか調べるためには、理想的には、Randomised Controlled Trial (RCT)を行う必要がある。RCTする場合は、著者と似たようなアカデミックバックグラウンド and 実務経験を持った人をたくさん集めてきて、方法1, 2, 3をランダムに割り当て、例えば1年間勉強を続けてもらう。1年後にスキルテストや実在課題を解かせてみて、1-3のどの集団が優れていたか比較するのである。古典的A/B/Cテストだ。

しかしこのようなRCTは実際には実行不可能である。厳密に同じバックグラウンドを持った人をたくさん集めるのは不可能だし、各人に貴重な時間を消費させて選択を強制することもできない。まぁ因果推論関係の統計学を使えば自然選択状況からある程度の推定は可能であるが。

なので読者諸賢には、このような選択的トライアルを自分個人で一人でも実践していくことを勧める。著者の体験例を出してみよう。著者がゲーム理論やマルチエージェント・システムについて学んだ際には1の論文スタート・アプローチを取った。著者が作曲における和声法・対位法・管弦楽法を学んだ際は2のテキスト網羅アプローチを取った。そして著者が行動経済学を学んだ際は3の一般書スタートアプローチをとった。

  • 一応白状しておこう。和声と管弦楽法は定めたテキストをきちんと全てこなしたが、対位法は未完であり、こちらは今後きちんと補間していかないといけない。

Tonal Harmony

Materials and Techniques of 20th Century Music

Counterpoint: The Polyphonic Vocal Style of the Sixteenth Century (Dover Books on Music)

The Study of Orchestration

Agent-Based and Individual-Based Modeling: A Practical Introduction
Generative Social Science: Studies in Agent-Based Computational Modeling (Princeton Studies in Complexity)

その結果、著者にとって新分野学習において有効だと結論されたのは以下のシーケンスを重視した方法論である。1-3のどれかを選べ、ではなかったのだ。このシーケンスが採用された理由は、それぞれの学習法の利点と欠点を身をもって味わったからである。

  • まずはその分野の一般書を読みReferenceをたどる
  • 続いて興味をもった論文をいくつか読み漁り、すでに自分が知っている数学的知識とのアナロジーから学習をはかる
  • 最後に、当該分野のテキストを最初から最後までやって網羅的に全体像を把握する

1-3のどの方法にも利点と欠点がある。論文drivenのアプローチは興味を追っているので効率が良い一方で、カバレージにかけ教養の欠落を招く。Exploration-exploitation trade-offのある状況においてexploitationしすぎるのだ。一方でテキストdrivenのアプローチは、特に和声課題のときに感じたことであるが、いつになったら一人前になれそうかゴールまでの感覚がつかみにくく、動機付けが弱くなる。その結果、平均的な学習速度が遅くなる。とはいえ、このカバレージはいずれは必須である。なので、効率的に取れる60%の範囲をまずは論文drivenで学び、その後にテキストで網羅することが良いと結論した。とはいえ最初のとっかかりが何もない状態で論文をあさるのもまた非効率なので、好きな読書の延長としてまずは一般書からスタートする、という組み合わせに落ち着いたわけである。

  • 著者の友人の複数のPhDホルダーを見ても、カバレージをきちんとしているかが学位保持者とそうでない人の一番の差で、それが長期的に効くということはお伝えしておく

著者の採択したアプローチが合致する方はデータサイエンティスト以外にもたくさんいると思われる。しかしながら、これはあくまで著者個人にとっての準最適解だ。読者諸賢個人に対してあうかどうかの精査は大事である。新分野を開拓するときに学習法を意図的に変えてみて、自分の中で学習法を比較できるようなサンプルを創り出すことはお勧めである。

自己サンプルだけではおそらく比較には不十分であろう。そこでサンプルサイズの増大 or 信頼できる事前分布の設定のために、身の回りの人の学習結果もこっそり利用すると良いかもしれない。他人の成功と失敗から学ぶのである (優れたバリュー投資家がよく口にすることだ)。あなたの身の回りでは、環境変化への適応が早い人と遅い人がいてそれぞれ異なった戦略を採用しているはずだ。彼らを観察して良い戦略の事前分布を作ろう。事前分布といっているのは、これは人間一般にとって良いと仮説されているだけで、あなた個人は他人と大きく違っているかもしれないためである。多くの他人による事前分布と、自分自身の経験によるサンプルのmixtureで推定するのは、ベイズ推定である。ベイズ推定のアナロジーで汎化されたリアルlearning to learnは、あなたのキャリアを大きく広げて行くだろう。

機械学習に限らず、数理的な最適化アルゴリズムというのは何も仕事のデータだけに使う道理はないのである。そこから学べる規範を自分の人生そのものに役立ててみてはどうだろうか。リアルな日常生活においてベイズ推定 and/or 強化学習しよう。

長時間労働は勤勉革命のせいだけではなく、不確実性回避のせいかもしれない

さて、個人が時間を浪費せず新しいスキルを学ぶことの重要性について説いているわけであるが、多くの人はなかなかこれが出来ない。その理由として著者が想像しているのは、新しい分野を学ぶのに想定外に長い時間がかかってしまったらどうしよう or いつまでたっても理解できなかったらどうしようという恐れではないかと思っている。(新たに得たスキルの利得) マイナス (所用時間による機会損失) という打算において、後者の不確実性に対するリスク回避を重視した意思決定をしてしまっているのである。

このリスク回避現象は、なぜ長時間労働が減らないかの理由の一つになり得る。もちろん長時間労働の主たる要因は江戸時代の勤勉革命 (Industrious Revolution)から、顧客による無償労働の脅し(株主によるコーポレート・ガバナンス不足の結果としてのpricing powerの弱い事業から経営者が撤退しないことが本質的要因)まで種々ある。しかし副次要因としてはこのリスク回避性も作用していると思う。現場レベルで、例えば次のようなことがおきるのだ。

  • 財務担当者がExcelで作業をしているが、いくつかの数値入力部分は毎回同じステップであるので自動化して他の仕事に集中するか早く退社したい
  • しかし彼はプログラミングに馴染みがないので、過去の.xls or .xlsxファイルをコピー&Editする以上の作業時間短縮が現在のスキルではできない
  • 今回の作業を完遂するにあたり彼は二つの選択肢から選ぶ必要がある
    • 1. 今までと同様のやり方をする。所用時間は3週間で確実にこの時間で終わる
    • 2. pythonまたはVBAを追加で学び、プログラムの自動出力を利用する。他に財務で新たにプログラミングを学んだ人の経験から推定するに、学ぶのに期待値では10日かかり、その後最後に残る手作業は4日で終わるためトータルで2週間である
    • 2.は期待値としては1.よりも早く終わるが、学ぶのに想定外の苦労があって、10日かかる学習時間が20日か30日になってしまうかもしれない
  • このような状況において、彼はハードデッドラインを過ぎてしまうリスクが怖いので選択肢2を選ぶことができない。もし2を成功裏に今回終えれば、今回の短縮に加えて来期の同一作業における所用時間は劇的に減るにも関わらず

同じ財務担当の中でも所用学習時間にはバラツキがあることが観測できるだろう。加えて、そのようにプログラミングを習得した他の同僚がいない場合には、サンプルサイズの不足による不確実性(統計学ではestimation errorとかconfidence interval or credible intervalのことをさす)が増大する。このリスク+不確実性を短期的に回避し続ける結果、彼は長期的にいつまでたっても長時間労働から逃れられないのである。


退屈なことはPythonにやらせよう ―ノンプログラマーにもできる自動化処理プログラミング

このようなトラップは、締切ドリブンのカルチャーが緩和されれば回避できる。経営者の方は社員のコントロールにおいて参考にしてみて欲しい。一度のチャレンジでは想定外に多くの時間がかかって一時的な生産性低下を被るかもしれないが、明らかに最初の段階で学習に取り掛かる方が累積コストは低い / 累積リターンは高い。実は企業がR&Dに投資する際の基本を、ここでは単にExcel処理という小さな例に当てはめて議論しているだけである。

結局のところ、キャリア構築・スキル習得においても、短期のリスクは不可避であると腹をくくって長期リターンを最大化するだけなのだ。世界的に見て、社会人が会社を辞めて大学院で学びなおしたりする際の正当性も、そのような短期損失を覚悟したリスクテイクから来る。

学習速度は逓増する

不確実性に惑わされて二の足を踏んできた人たちに最後にメッセージしておきたい。安心して欲しい。本当にゼロから学習を始めて恐ろしく時間を無駄にするケースはまれである。そして著者が今までの体験から自信を持って言えることとして、今までの蓄積が多い人ほど、新しい概念の習得も早まる。学習の複利効果とでも言おう。直感的には、n 種類の見かけ上異なる学問分野があったとしても、それら全てを学ぶのにかかる時間は log n くらいで済むだろう。見かけのサンプルサイズや次元に反して、実効次元やクラスター数はもっと小さいのだ。その根拠は、先人のたちの知恵のおかげで異なる専門領域も元をたどればシンプルで強力なファンダメンタルズから成り立っていることが多いためである。

  • 著者の場合、有名な「藝大和声」の課題をやっている間は、このよくできてはいるが疲れる禁則を体に無理やり叩き込むのが非効率に感じられて仕方なかった
  • しかし本業の機械学習研究においてbias-variance trade-offの扱いに関して理解が進み、五度圏による分析法の習得など他の知識が混じってきた段階にいたると、よりメタレベルでの法則理解が得られたため、課題の遂行が容易になったのである
    • それでも初学者には先に挙げたStefan Kostka氏のテキストの方を勧めるが

和声―理論と実習 (1)

和声―理論と実習 (2)

和声―理論と実習 (3)

見かけ上の学問領域の広さに圧倒されて、自分の既存知識範囲に固執し過ぎてしまう傾向は、若い人が資産運用において複利効果を軽視してしまうことと似ている。一回一回はリスクある意思決定であっても、長期的には本来あるべきcapital growth rateに近づいて行くのだ。複利効果を理解しない人は、期待値 ➗ ボラティリティのS/N比を上げる代わりに単にボラティリティの高い一か八かのギャンブルをやってしまう傾向がある。しかし若い人は残された時間がもっとも長く、長期資産運用が本当は向いた立場にいる。彼らは期待値としてのcapital growth rateを上げるような、複利効果のあるキャリア開発に全力を注ぐのが最適である。

若い人だけでなく、40歳や50歳の人にとってもこれからの社会ではimplicationが似てくる。平均余命が伸びていることと、年金の支給開始年齢が上がることでシニアも先々のキャリアは想像以上に長いからだ。

残り期間が長い前提においては、今更新しいことを学ぶなんて難しい、という嘆きこそが最大の敵なのである。今回の投稿は俗に言う「文系的」知識を総動員しつつ、著者の専門から言えることを定性的に結びつけて論じてみた。読者諸賢のキャリア上の触媒になれば幸いである。

Reference

特権ではなくハイリスク投資としての名門学校

イギリスに移って三ヶ月が過ぎようとしている。移民としての生活に感じるところについてはまた後日書くこととして、今日は移住後に見かけた日本のニュースについてコメントしたい。国立大学附属学校の入試をやめて抽選による選抜に変えることで平等性を担保すべきという議論を見かけた。国立附属学校のOBとしてこれは大きな愚行であると考える。加えて、教育政策を立案する人々が何か勘違いしているのではないかと感じる点があるので持論を書きたい。勘違いという表現は、国立大学附属学校への進学は100%の成功を保証する切符であるという誤認を彼らが持っているのではないか、という著者の疑念から来ている。今回、移民後の依然として慌ただしい中で拙論を書いてみてエビデンスとなるデータを揃える時間がなかったため、今後機会のあるときに本稿をupdateしようと思う。

Disclosure: 著者は国立大学附属学校の一つである筑波大学附属駒場高校の出身である。

他の国立大学附属学校OBは日本の国力を維持するために、国立大学附属学校をむしろエリート養成機関として積極活用すべきである、という論陣を張っているようだ。ある程度バックグラウンドの知識がある人にはこれが正論であることがわかる。しかしエリートに搾取されているという被害妄想を持った人々にエリート教育のリターンを解くことはおそらくムダであろう。そこで本稿では他のOBとは違う視点から議論を展開しようと思う。

  • 他のOBの論陣は2つの意見が混合していることが多い。1つ目は日本の国力没落をエリート教育の不足に求めるものであり、2つ目の主張は国立附属学校は別に受験エリートの養成などしていないというものである。
  • 1つ目について。顕著に没落した日本の基礎研究成果や、スタートアップの成功度合いでもイスラエルや米国になかなか追いつけない日本の現状を彼らは危惧している。
    • 基礎研究の没落については、投資に対するアウトプットの比率で見ると日本は意外と悪くない(それでもイギリスやフランスの方が優れているが)
    • 後段の拙論と関係するが、ビル・ゲイツのような偉大な起業家は別に教育されたから出来上がった訳ではないことを考慮すると、エリート教育なるものが本当に必要かも実は怪しい。しかしエリートの卵を単に集めて濃縮するだけの介入には意味がある。これも後述する。
  • 2つ目については、それがTrueであることを著者自身の体験によって知っているので後述する。しかし自らがそれを体験しておらずしかも自分の人生に満足していない人というのは、被害妄想による疑念をやめようとはしないものだ。そこで以下では、教えないにことにこそ真髄があるというその実態を体験談として書いてみた。外野の人にももう少しリアリティが伝われば幸いだ。

存在しないリスク回避手段を求める人々

抽選推進を持ち出している人々は教育委員会のポスト保持者と一部の大学教授のようである。彼らの考えを総括すると、以下のように考えているように見受けられる 著者の誤認も含まれているだろうが、まずは本稿を一通り読んでから評価を下してくだされば幸いである。

  • 国立大学附属学校では、私立学校とは違って、安価な授業料で良質な教育が受けられる
  • この良質な教育が、本来授業料の安さを必要としていない富裕層に独占提供されている
  • その理由は、難しい入試問題を突破できるのが受験塾に授業料をつぎ込める富裕層の子弟だけだからである
  • ついては、諸悪の根源である入試を抽選による選抜に変えることで、このチャンスを富裕層の特権から庶民の資産へと転換することができる

著者の人生を振り返って感じることであるが、このような考え方は公立学校の教員や公務員に特徴的である。彼らには二つの顕著な特性がある。

  1. 彼らはリスクをとにかく嫌う。自分がリスク回避的なだけならまぁ仕方ないが、社会は誰かが他人のためにリスクを取っていかないと成り立たないのだ。私たちの今の落ち着いた生活を実現するために、過去にリスクを取って犠牲になった先人に対するリスペクトだけは忘れないでいたいものだ
  2. 彼らの頭は線形なメカニズムの仮定に支配されているため、常にinterventionismにとらわれる。彼らはsecond-order effectというものを理解していない

まず指摘したいことだが、別に国立大学附属学校に入っても安泰への切符は手に入らない。むしろ自分の今後の人生に対する危機感が発生し、そして実際彼らの多くはその後の人生で否応なしにかなりの危険に晒されるようになる。

内心はとても不安定な名門学校生活と多様性

実態はこういうことである。まず難しい受験問題をくぐり抜けて選抜されて来た子供達は、ほとんどの他の子供達よりも数学や社会的教養の点で優れている。その結果、別に学校の勉強ができてもちっとも尊敬の対象にならないという強烈なピアプレッシャーが発生するのである。もしある子供がアイデンティティを学力テストのスコアの高さに求めていた場合、彼の自我はとても危険な状態に落ちる。そこで子供達は、自分と他者との違いを大きくするものは何か、どのようにして自らのユニークネスを確保することができるのか自問自答し、その試行錯誤に6年もしくは3年の時間を費やしていくことになる。著者の母校の場合は、スポーツで良い成績を納めることはかなりの賞賛対象であったし、音楽活動に勤しむものも同様である。スポーツが賞賛されるのは特待選抜されるようなスポーツエリートが著者の母校にいなかったからで、そのような不利な環境で全国大会まで行くような努力家は尊敬の対象になる。

このユニークネスの追求と独自の価値観構築は、その後の職業人生に大きな影響を与える。それはユニークな研究テーマの選択であるとか、競合他社のことなど意識せず顧客の問題に集中するビジネス上の姿勢といったものだ。彼らは、逆風が多かろうと、他社の真似ばかりしている人々の対極に座ろうとする。他人と違っていることはとても良いことだという、多様性への賞賛を国立学校や多くの私立学校は育んでいる訳である。著者は市立の公立学校にも通ったからはっきりわかるのだが、多くの学校教員や教育委員会の監督者は、poorで独善的な教条を子供達に押し付けている日々について猛省して欲しい。なぜこのような共産主義シンパのまがい物みたいな人々が日本の教育機関にたくさん生まれたのかは著者にはよくわからない。歴史をさらに調べる必要があるだろう。ただ言えることは、英国や米国・カナダのような移民社会では当たり前のように是とされておりかつそれが経済的にペイしている価値観が、残念ながら公立学校でそれを伝えられていない日本においては、国立学校と私立学校が多様性確保に一役買っている訳である。

生徒には実はハイリスク・ハイリターン

さて、思春期に培われた独自人生への探求心だが、これは大人になってもずっとついて回る。自分の人生が平凡であることが恐ろしくなってくるのだ。そして彼らの多くがハイリスクな意思決定を行うようになる。最近10年ぶりに再会した親友を例にとると、彼はNGOの仕事でアフガニスタンにも行っているし、ワシントンD.C.滞在中には後頭部に銃を突きつけられてその時の貴重品を全て盗られた。その際に彼が強盗から英語で言われた言葉は次の通りだ。「顔を見たら殺す」これを正確に聞き取れずに、「えっなに?」などと言って振り返ったらあなたはもうこの世にいない。

要は名門学校に入ることは、ハイリスク・ハイリターンの投資をすることなのだ。もちろん名門学校に入ったあとでも、大学進学くらいの時点で諦めれば、極めて平凡な人生を送ることも不可能ではない。しかし思春期に培われたその価値観を捨て去ることは、自分をどこかで信じている子供達には難しい。結局のところ、名門学校への入学はハイリスク・ハイリターンの株式にほぼ全財産突っ込むようなものなのだ。一応はput optionもあるとは言えるものの。

先ほどの強盗にあった彼は今では欧州で息子を育てている。実はさらに驚きのstruggleがもう一つあるのだが彼のプライバシーを考慮しここでは書かない。彼のハイリスクな人生は、名門校通学をリスクフリーのフリーランチとして考え、抽選制でばらまいてポピュリスト的人気を取ろうとするような人々の人生観とはどう考えても対極にある。

役所の人々の人生はリスクレス・ミドルリターンと言えるだろう。著者が所属するヘッジファンドの世界では、リスクを取らずに追加で期待値が高められるような戦略にはalphaが存在する、という言い方をする。Alphaが存在すること自体は悪いことではないが、それは個人の並々ならぬ努力と忍耐の対価によって手に入れるものであって、努力をしない一部の人にただで配ってはならないのである(選択的にただでばらまくと市民社会の相互信頼を傷つける)。実際、Alphaの取得の難しさは経済学で言う所の効率市場仮説と関係しており、それは市場の公平性を一定量担保している。

もしAlphaが何の追加の痛みも伴わずに容易に、しかも一部の人にだけ与えられている場合、それは特権と呼ばれる。リスクレスでハイタリーンが手に入る特権が放置されている状況は社会的不公正である。雇用を公的に保護されている人たちは、純粋な親切心から、その特権を他の人にもちょっと分け与えてあげようと思ったのかもしれないが、そういう特権の存在が放置されること自体が、公正の観点から問題があるのだ。

名門校に入ることは少しくらいは期待値を高めるかもしれないが、大きなボラティリティを伴うため、これはAlphaを取っている訳ではなくてBetaを高めているだけだ。ハイリスク株式が万人に進めるべき資産クラスではないように、名門学校への通学も別に万人に勧めるべきものではないわけである。多くの名門学校は入学試験を課しているが、その後の人生の波乱に比べたら入学試験などというものはとても小さな試練である。その程度の小さな試練突破に対するcommitmentができない子供達を無理に名門学校に入学させるとむしろ人生に暗い影を落とすであろう。

今となってはオックスフォードにゆかりのできた著者としては、ここでノブレス・オブリージュについても言及しておきたい。第二次世界対戦時、オックスフォード大学やケンブリッジ大学に通っていた貴族の師弟は真っ先に戦死した。戦死したからといって貴族の特権が正当化されてはならないのだが、少なくともこちらのエリートはハイリスク・ハイリターンの人生を送っていたということだ。そのハイリスクには株式投資ロスのような金銭損失だけではなく、命の損失も場合によっては含まれているのである。

社会全体へは: 低コストでハイリターンのバフェット流投資

さて、ハイリスク株式を若くして取得した子供達が将来社会に何を残してくれるか考えてみよう。ここで重要になるのは国立大学附属学校が何をしているかである。著者の記憶を披露させていただくと以下のような感じだ。

  • ともかく異様にポテンシャルの高い同級生だけは集まった。なまじ頭がいいので、誰も他人の命令なんか聞かない。公立学校で行われているような、道徳的正当化からの説得は彼らには無意味である。どうやって何か新しいことを協業しようか?
  • 机はボロい。ファシリティは老朽化して汚い。校舎の保全は県立高校の方がマシなのではないか? 箱物公共工事建設業者泣かせであろう。国からの我が校に対する投資金額の低さだけは他校の生徒に自慢できそうだな
  • 母が保護者向けのガイダンスに出席してきたが、たった一本の鉛筆を持ち帰らないように教官から強くお願いされたそうである。数が極めて限定されているため、それがないと業務が滞ってしまうらしい 鉛筆一本だって?
  • 教官たちは、教養は確かにあるのだが、生徒の意向も意に介することなく勝手な雑学講義をdeepに進めているように見える
  • 生徒たちは、他の生徒の奇抜な行動には気が気でないようだが、教官に対する関心はてんで薄いようである。この人たちが何を「教えて」くれるというのか?

最近は文科省のスーパーサイエンスハイスクール(SSH)といったシステムも導入されているので以前より少し介入的な投資もしているだろう。しかし、国の「エリート養成機関」とやらの実態は、優秀な子供を集めて単に一箇所に放り込んだだけだった。しかしこの生徒たちが将来、社会的には大きなリターンを生んでいることは日銀の黒田総裁 (著者の高校の先輩である)がもたらした日本経済の変化や、後輩たちの起業成果を見ての通りである。生徒個人個人にはハイリスク・ハイリターンの人生でも、生徒を集めた集合体で見ると低コストでハイリターンの理想的ポートフォリオになっていたのだ。Warren Buffettに言わせれば、資本がかからず無限に利益を生み出すような企業の所有が理想の投資である。コストをかけなくてもハイリターンが出ているのに、なんでお役所の人たちはわざわざコストを増やしてROIを低くしようとしていたのだろう?

人材濃度の希釈化に対する脆弱性

この理想的な社会投資はしかし常にワークする訳ではない。この投資機会のeconomic moatはとても小さく、役人の変な介入によって容易に消滅してしまう危機に瀕しているのだ。

子供達をハイリスクな冒険へと駆り立てるものが、「座学勉強ができても賞賛されない」ことだった点を思い出して欲しい。もしここに抽選で、相対的に学力の不足している子供が放り込まれると以下のような事態が起きるであろう。

  • 元来の学力の高かった生徒たちは、座学勉強ができるだけで抽選組に対する優位性を確保してしまう。その結果、今まで保持されていたリスクテイクへのインセンティブが失われる
  • 高いcommitmentを示す前に大人の都合で抽選で入れられた子供たちの将来は全く不確実である。極端に言えば、このハイリスク・ピアプレッシャーで自我崩壊したりしないか?

このように双方の集団にとって、そして子供達への投資からリターンを得ようとしている我々市民全体にとってもおそらくはリターンを低める結果にしかならないであろう。そもそも日本では義務教育が保証されているのであって、他の子供達も普通に都立/県立高校へ進学できるのだ。それを差し置いてわざわざ国立学校を設ける正当化には、この国立学校が他の公立学校と違っていることという条件が必須である。

単に違ってさえいれば良いという視点からは、今の国立学校のバラエティが不十分である、という主張ならば一定の説得力があるだろう。学力の高さだけでかき集めた国立学校があるなら、芸術センスの高さだけでかき集めた国立学校があっても良い。これなら主張として成り立つ。その場合、芸術センスの高さで集めた生徒たちに対して芸術の講義はしない、という政策が要求される。この観点からすると、私立学校の一部で行われているスポーツ特待生にスポーツエリート教育をするというシステムは介入主義の幻想から抜けていない、と言えるだろう。スポーツエリートを集めるなら、スポーツができるということが何の自慢にもならない、という危機感を生徒に抱かせることが社会的投資の秘訣なのである。

介入/設計主義の不毛

最後に、なぜこのような議論が出てくるのか、日本のみならず世界中の公的機関に意識的 or 無意識的に内在する介入主義へのバイアス傾向について論じたい。中学時代、著者を耐えず不快にさせていた教員たちは、子供をスイッチのついたパネルか何かと勘違いしているようだった。例えるとこういうことだ。

  • 生徒には英語、数学、国語といったボタンがついている
  • 教師がそのボタンを押す(授業を通してやり方を教える)。子供は対応するボタンの機能を習得する

こんな現象は現実には存在しない。教師が英語指導をXポイント追加すると、子供は英語能力が0.3Xポイント向上する、というような線形システムが頭の中に埋め込まれている人々は、常に介入を正当化する。子供の英語力が足りない? じゃあ英語の授業をもっと増やそう。子供が非行に走る? じゃあもっと道徳の授業を増やそう。日本の大学しか卒業していない著者はオックスフォード大学のそばに置かせていただいているだけだが、著者がオックスフォードの入試問題を見た限り、こんな単純な線形社会システムを頭に描くような人物はオックスフォードの入学試験には絶対に合格しないと言える。

線形システムが頭にある人の特徴は物事を足し算していって複雑化させる点だ。本日、いったい教師の独善のためにどれだけの無駄な授業と説教が行われているのであろうか? 過去には、才能ある子供たちのポテンシャルをどれだけ潰してきたのであろうか?

一方、国立大学附属学校の低予算システムは、意図されたものだったかはわからないが、少なくとも引き算が有効に働いている。これらの学校では介入をせずただ放置しただけだった。才能ある人たちを集めて、その才能を自己否定させるような場所を提供するという、逆説的アプローチによって人材輩出に成功してきた。数学を教えたら数学ができるようになった、というような介入主義的発想はfirst-order effectばかり見ているが、否定によってリターンを得るこのアプローチはsecond-order effectを利用しているのである。

Second-order effectについて補足して本稿を終えることとしよう。ホメオパシー(代替医療)の効用について考えたことがあるだろうか? これはレメディと呼ばれる謎の物質を、その物質が1原子も含まれない濃度に水で希釈して投与するというものである。

まず伝えることとして、過去の膨大な実験によって、ホメオパシーには医学的な効能が全くないことがほぼ確実である。ここでnaiveな介入主義者は、「非科学的なホメオパシーをやめさせるべきだ」などという。もちろん、正当な治療方法が判明している病気に対してホメオパシーを施すのはよくない。しかし、その治療方法が不明かもしくは既存の方法が有害だったら?

ここで覚えて欲しいのが、ホメオパシーが有害であるという仮説も十分に棄却されているという事実である。つまりホメオパシーは人体にプラスもマイナスも何も及ぼさないのだ。

この結果、有害な過剰医療の代わりにホメオパシーを施された患者は長期的には自らの自己治癒能力で回復していく。ホメオパシーは、有害な医療行為から患者を遠ざけさせることで結果的に患者を回復させるのである。first-order effectの医療しか考えられない医師は肯定的材料だけを探して過剰医療をするが、ゼロがマイナスよりはマシであるというホメオパシーの結果に着目した医療行為はsecond-order effectを利用していると言える。

Second-order effectの効用は他にも色々ある。医療技術が未熟だった過去にはお祈りばかりしている宗教の多くがその役割を果たしたし、今でもある種の呪術行為はアフリカでインチキ医療行為やあるいはもっと過激派の宗教から患者や信者を遠ざけるのに役立っている。

介入行為の不毛に関する指摘はハイエクやポパー以来のオーストリアの伝統である。少なくとも民主主義国家をまだ自認している日本においても、彼ら偉大な哲学者に習ってみたらどうだろうか。国立大学附属校ではsecond-order effectを利用した「何もしない」「否定の」教育をもう少し続けてみるということだ。最安の設備投資で最良のリターンが待っているのだから。

合理化途中の過渡状態と不合理を受け入れた定常状態

母校の集中講義で機械学習とゲーム理論の数理的類似性に関して話してきた。大学からの依頼で行ったものであるが、その要請はかつての自分と同様に社会人博士課程に通う学生への助言である。在学中の研究とその後の展開や、研究成果をどう実ビジネスや仕事に生かしていくかを体験談として話して欲しいというものだった。博士取得後に深めた知見の方が在学中の成果よりも大きいと著者は考えているので、学生時代の話は触り程度にして、その後の研究トピックの広がり方・掘り下げ方について、転職後に加わった視点も交えて紹介した。以下はその説明資料である。OpenOffice.org ImpressとLaTeX beamerが混在しているのは全てをbeamerで準備する時間がなかったことによる、デザイン上の妥協である。

提供した視点の中で、その拡張に将来性があると2016年時点で著者が考えているのは以下に列挙した両者の対応である。特に、機械学習側の関数近似テクニックや緻密な確率的モデリングを行動ゲーム理論に持ち込むことで、人間同士が相互作用する社会環境 (人間系) における意思決定を、もっと数値的根拠が確かな状況で行えるものと期待している。

  • 正則化のない最尤推定はナッシュ均衡の計算に類似しており、
  • 事前分布を用いるベイズ推定やJames-Steinの縮小推定は限定合理性を扱う行動ゲーム理論における、Quantal Response Equilibrium (QRE)の計算に似ている
  • 明示的な正則化項を追加する代わりに最尤推定の最適化ステップを途中で中断するアプローチであるearly stoppingはCognitive Hierarchy Theoryと似ており、これも行動ゲーム理論で使われるテクニックである

Google DeepMindはAlphaGoでDeep Reinforcement Learning (深層強化学習)を用いたが、Deep Belief Learning (深層信念学習)という社会科学技術がイノベーションを起こす、というのが著者の大胆な予想である。しかしこれは当たるも八卦当たらぬも八卦の話なので、もう少しsolidな上記メッセージに戻ると、用いた資料で最も重要な一枚は次のスライドだろう。

ml-vs-gt

 

与えられた特定のゲームにおける実現シナリオの候補として、ナッシュ均衡はその定義は厳密ではあるが、実社会でのゲームにおいて実際に発生するシナリオからはしばしば乖離した予測を示す。最尤推定が学習データという狭いデータセットに対しては最大の予測能力を示しても、テストデータを持ってくるとそうはならない点と似てるとは感じないだろうか。

一方、ベイズ推定は事前分布という固定点を導入し、そちらにshrink(縮小)させることで、学習データに対する説明能力を少し妥協する。しかしこの小さな妥協はテストデータに対する予測能力を大きく向上させる。QREも同様で、他のプレイヤーの合理性に確信が持てない状況で、不確実性を撹乱項として明示的に確率モデル化することで、より実社会の集団的意思決定結果に近い予測結果を返してくれる。ベイズ推定もQREも、データやゲームに依存しない固有の確率モデルを入れることで汎化能力を上げる、という思想が共通している。

加えて、実用上は、固定点への縮小戦略ないしアルゴリズムは厳密なベイズ推定解でなくても良い。要は、事前分布の中心に相当する固定点があって、そこに少し近づける方法論であれば何でもよく、その一つがDeep Learningでよく使われるEarly Stoppingである。Early Stoppingは、複雑なゲームの均衡を数値的に計算する場合に使われる Belief Learning (信念学習) を途中で打ち止めにする方法と類似しており、Cognitive Hierarchy Theoryはこの打ち止め自体を確率モデル化したものである。

機械学習研究者コミュニティの中には、統計学だけでなく認知科学の研究も行っており、行動経済学的な現象の発生メカニズムを数理モデル化している人たちがいる。著者もその端くれであると自負している。昨年、著名な国際会議のNeural Information Processing Systems (NIPS)に出席した際には、パネルディスカッションにおいてBayesian Nonparametricsの大家の教授が同様の見方を他の認知科学研究者から聞いたと言っていた。この教授が誰であるか業界人にはバレバレであるが、著者の記憶が間違っている可能性もある。後で「私はそんなことは言ってない」というクレームが発生しても責任は持てないので名前は伏せることにしておく。

講義は機械学習と行動ゲーム理論の接続に限らず、与太話も含めていろいろ話してみた。科学的根拠の薄い仮説であることを断った上で、スライドの最後のセクションには私見をいろいろ載せている。一方で全ての意見が無根拠というわけでもない。例えば、リスクは避けろ、不確実性はテイクしろというメッセージは i) 偉大なバリュー投資家たちのコアとなる考え方で、ii) 多腕バンディット問題におけるexplorationのgainがどういうときに最大になるか考えた上で 持っている意見である。すぐれた起業家や研究者がリスクテイカーだというのはおそらく嘘だ。彼らは不確実性をテイクしているのであって、避けられるリスクは極力全て避けている。製鉄ビジネスを始めるときにいきなり自力で始めるのではなく破綻した製鉄所を安く買い取って始める、とかね。

これから博士課程に通おうと思っている人や、社会人博士における研究テーマの選定で迷いがある人は参考にしていただければ幸いであるし、個人的な質問があれば twitter account @rikija に連絡くだされば話せる範囲でお答えします。