オックスフォードに移ってファンドで働きます

突然の告知であるが、いわゆるヘッジファンドからオファーを頂いて機械学習クォンツ研究者 (投資アルゴリズム開発者) として働くことになった。勤務地はイギリスのオックスフォードである。民間企業のポストではあるが、オックスフォード大学の一流教授陣 (統計学, 金融経済学, 機械学習の著名教授と同じオフィスビルに入る) やPhD students, postdocsと日頃からコミュニケート可能な、特殊な研究環境で働くため非常にエキサイティングである。

読者諸賢には想像していただけると思うのだが、金融業は種々の規制の下に存在する。まずはイギリスの Financial Conduct Authority (FCA) の規則にのっとり、そして多くの内部統制に従う必要がある。著者も渡されたCompliance上のガイドライン数百ページを今日も読み進めているところである。本ブログは数理科学を用いた社会課題解決全般について記述することを意図しているが、最近は投資のための分析が多かった。今後も数理的な民主主義の発展アプローチについては議論していくが、金融市場に関する発言は抑制された注意深いものに留める可能性が高いことをご留意いただきたい。今日以降の発言はCompliance上の制約下にある。

パフォーマンスのランダムネス

多くのヘッジファンドではローパフォーマーは大きな解雇リスクに晒される。著者の雇用契約書にも会社側がdiscretionaryに解雇できる条項が入っている。単にローパフォーマーを解雇するのは英米系の会社では勤務地問わず当たり前のことだが、問題はヘッジファンドの場合は本人の能力とは無関係に誰もがローパフォーマーになりえてしまう点である。極端な言い方をすれば、あなたの首が切られるかつながるかは、あなたの努力や才能ではなく、単なるコイントスの結果で決まってしまうのだ。

単にお金に惹かれて何の勝算もなしにヘッジファンドに入社することが何を意味するか、最近はカルチャーも変わってきてはいるものの、たとえば10年以上前のこちらの記事を参考にしてみて欲しい。この記事は、金融業界の人よりも、いささかAIバブル気味のIT業界の人にこそ、自分たちの向かう方向を考える上で参考になると思う。市場の効率性は100%ではないが現代の金融市場では極めて高く、かつ大きな予測不可能性によって一流のポートフォリオ・マネジャーが特定年にアンダーパフォームしてしまうことが容易に起こる。自分は過去の実績があるから首にはならないだろうと思う労働者は、おそらくsignal to noise ratioの高いビジネスで働いてきただけである。数年単位の長い目で見れば一流ポートフォリオ・マネジャーとそれ以外との差、つまりAlphaを稼ぎ出す能力ははっきりしてくるものの、雇用継続を決定づけるもっと短い期間でのパフォーマンス変動に関しては神仏にすがるしかないのである。

著者の場合も入社後のプレッシャーは強烈なものになることが容易に想像できる。しかし大きなリスクを負ってでも、知的に吸収できるものが間違いなくたくさんある職場なので、雇用が続く限り多くのことを吸収し、また世の中にも還元していきたい。著者の場合、投資を本業にすることに対して昔から関心はあったが、業界の過酷さを考慮して踏みとどまり独学を続けていた。マーケティングや広告の機械学習アルゴリズムで一通りの実績を作ったから今回チャレンジを決意した次第である。したがって効率市場仮説に敗北して夢破れた場合には、またマーケティングの世界に戻ってくることになるだろう。不恰好ではあるが、よくも悪くも保険を作ってからの、中年としての挑戦である。

  • まぁこれは実際にはちょっと大げさに書いていて、著者の場合、データサイエンスという言葉から想像つく範囲の仕事もそうでない仕事もプランBやCを用意してあり、そういったプランが描ける理由は、結局のところ多くの人とのゆるいつながりのおかげだ
  • 基本としてコミットすべきプランAの実行に入る前に、プランB, C, Dを作っておけるかどうか、それぞれのシナリオの将来への進み方に関して動的計画法的な異時点間最適化をある程度できるかどうかが、成功するキャリアの鍵だろうと思う

解雇の話ばかり書くと後ろ向きに見えるだろうから、前向きのアッパーサイドの目標も書いておく。マーケティング、広告、金融市場すべてに対する機械学習モデリングを通じて、実際の資本の流れに関する統計的アプローチを確立し、経済学・経営学の教科書を部分的に書き換えること、それも経済学者の視点ではなく統計学者・コンピューターサイエンティストの視点から書き換えることが著者の長期目標である。

さて今回の記事では、著者の体験を元に転職に関する所感を書く。転職を意識している方への参考情報も記載した。昨今とくにシリコンバレーへソフトウェア・エンジニアとして移住する日本人が増えている。なのでそちらの情報は多くブログが散見されるのであって、日々参考にされている方も多いだろう。著者の場合は米国ではなく英国を選択したし、業種もバイサイド金融でいわゆるITとは少し異なる。金融業ならばスイスのチューリヒも非常に良い環境で魅力的だったのだが、著者の専門とつながる仕事がイギリスにあったという経緯である。

  • なお著者の選択はヘッジファンド転職にしては特殊で、他の労働者とはずれている
  • オックスフォードで働きたい・研究に近い場所に留まり続けたいという意思を優先させたためにサラリーはかなり妥協した
  • 友人からの参考値を見るに、単にサラリーだけを見ればウォール街の方が著者の2-3倍の値をオファーするだろう。これは誇張ではない
  • この業界に興味がある方でキャッシュがメインの目的である人(それは全く悪いことではない)はNew YorkやChicagoでオポチュニティを探すことをお勧めする
  • 著者の場合は価値観がサラリーに留まらなかった(もちろんお金も欲しいのだが)。1,000年近くの歴史に裏付けられた地政学的バックグラウンドのある場で学ぶ経験は、お金には代えがたい。マンハッタンの無機質な高層ビルの間で働くのか (著者は直方体外見の、センスなき建物が嫌いである)、それとも歴史ある建築群の中で働くのかの違いも大きい

外国の雇用情報に機敏な方はすでに十分情報収集をしているから著者の助言など無用である。したがって本稿は、エキスパートではなく転職を意識しはじめたビギナーの人を補助する前提で書かれた。ソフトウェア・エンジニアに関する情報も巷に大量にあって著者が言う必要などないので、ソフトウェア・エンジニアのカルチャーから離れた部分について書いてみた。

CVは整備しておこう & 英語をきちんと書こう

日本企業の人・外資企業だが新卒以降ずっと一社で働いてきた人の一部と話して驚くのが、自身の履歴書を整備していない and/or LinkedInにprofileを公開していない点である。履歴書とここで言っているのは、米国でResume, 英国でCurriculum Vitae (CV)と言われる英文書類のことだ。著者の考えでは、全ての労働者はこれを整備すべきだ。転職する気があるかどうかは関係ないし、転職先が日本企業であっても同様である。一部の読者は、LinkedInを整備することで現在の雇用主から罰せられることを恐れているかもしれない。参考情報として伝えると、英国でもLinkedInで積極的に転職活動していると思われるアピール文が見つかるとその社員を罰する企業が確かに存在するようだ。しかし文面は一定の倫理基準を守れば良いのであって、LinkedInのアカウントを取得して基礎情報を載せること自体を罰する話は聞いたことがない。加えて、LinkedInに仕事内容を書かなくてもCVに書いて個人として管理しておくことには何の問題もない。そもそも外向けのCVはconfidential情報を書くものではない。

CVを書くことで、自分が今までの仕事で何を計画し、何を達成してきたのか整理される。また定期的に履歴を振り返ることで、自分が次にどのようなキャリアを進むことで労働市場での競争力が強化されるかも、明示的に考えやすくなるであろう。頭の中でなんとなくイメージしていることと、文章に書き出したことの違いは大きいのである。CVを書く主目的は、転職とは独立したものであって、自分の仕事の品質と目的意識を高めることにある。著者の最初の職場では、履歴を入力するとCVのpdfファイルをビルドする専用システムが社内にあった。もっとも著者はそのシステムには頼らず自分でレイアウトを設計したCVを管理していた。社内システムは他の社員が参照するためのものだから、プロジェクト内容をconfidential情報も含めて比較的長文で正確に書くことになる。そのため外に公開可能なCVはやはり自分で作る必要がある。

CVで用いる英語には一定のルールがある。外国の企業に転職しない限り関係ないと思う方もいるだろうが、後述するように転職先が日本企業であっても英語CVの整備はとても役立つ。Writingルールに乗っ取って簡潔かつ強力に書くことで、アピールすべき自分の強みが何なのかはっきりしてくるだろう。CVの書き方に関する参考書はいくらでもあるが、たとえば著者の本棚には6年以上前から次書が入っている(著者がもっているのはこの本のVer 2.0である)。


英文履歴書の書き方Ver.3.0

LinkedInのprofileはCVのsubset or supersetにすると良いだろう。LinkedInのアカウントである程度まともに記述されたprofileであれば、ヘッドハンティングの誘いは頻繁にくる。外国の仕事、日本国内の外資、日本企業のいずれも来るため、日本企業に移るつもりの人もアカウントを取得すべきだ。日本企業であれば他の転職サイトでも移れるかもしれないが、日本語サイトでしか活動できない候補者と、日本語でも英語でも活動可能な候補者と、日本企業採用担当者から見てどちらが魅力的に映るか考えてみてほしい。

希望の職種とは無関係に、何に関しても重要なのは英語のWriting skill である。アカウントを持っているがあまり誘いが来ないと言っている人を見かけたことがあるのだが、著者と近いエリアで仕事をする彼の仕事は本質的には需要がある。しかし彼の場合は英語の書き方に問題があるのと、そもそも英語をきちんと書けという指導を前職以前にされてこなかったように見える。日本にヘッドクォーターがある彼の前職企業では、おそらくproject proposalやresearch proposalを提出して国際的にfund獲得のための競争をする機会がなかったのだろう。多くの日本人はListeningとSpeakingの能力に問題があると自分で思っているようだが、著者に言わせるとWritingがどの外国語習得でも一番難しいのであって、Writing skillを上げることにもっと労力を費やすべきである。Writing skillを持っている点で、まともなdefenceを通過したPhDホルダーは極めて有利な状況にいる。一流論文誌 or 国際学会誌に何度も通している研究者は、最小分量で最大メッセージを伝える英文の書き方を理解している。また作曲経験のある著者の観察では、多くの作曲家もWriting skillが高い。彼らは西欧の著作におけるpyramid principleに従ったwritingスタイルが論文・楽譜問わず一貫していることを知っているため、一流の作曲家に英文を書かせると洗練されているのだ。作曲家の友人の言葉を借りるなら、Writingができる人は、英語のスキーマと思考法が頭に整理されている結果ListeningやSpeakingの能力も自然に身についている。この意見に著者も100% agreeする。

LinkedInを通じてコンタクトしてくるハントの多くは読書諸賢の眼鏡にかなうほど面白い仕事ではないと思われるが、打率100%を狙ってはダメだ。そもそも返事しなければ打率の分母にすら入らないから気を落とすこともない。変な誘いが来ても無視するだけだ。忘れないで欲しい事は、多くのしょうもない誘いに加えて一部は確かに面白い仕事の依頼がくる点である。100種類の無意味なハントがきたとしても、あなたの望む仕事が1つ追加で勝手に飛び込んでくるなら、こんなにありがたいシステムもそうそうないだろう。LinkedInのアカウント取得は基本的に無料だし、著者は有料のサービスは特に何も使っていない。

著者の場合は、今回の雇用主からの誘いは一年以上前にあった。いきなりそれに飛びつくのではなく、自分がどうしたいのかをよくよく考えて昨年末から面接を開始し、今回の転職に至った次第である。なお面接に時間がかかっているのは、この会社の慎重な審査と著者自身が現職で残りの仕事のために期間調整した部分との相互作用結果であって、一般の転職はもっと短いスパン (1.5-2ヶ月くらい)で決まることが多い。

晴れて面接に通って転職を決める場合でも油断大敵である。CVの書き方とは別に、新しい職場での仕事の心構えについては、例えばこんな本でも参考になる。次書は少し労働者を脅しすぎに書いていて最高品質とは言い難いと個人的に思うが、何もないよりは読んでおいて損はないだろう。これより良い参考書を読者が持っているならそちらを参照して欲しい。


外資系キャリアの転職術―採用担当者があなたに教えない44の秘密

電話に慣れろ & Video chatに甘えないこと

これも昭和の親父の小言みたいなコメントだが、知らない人のために補足しておく。シリコンバレー界隈の仕事はSkypeやGoogle Hangoutなどの相手の顔が見えて高品質なオーディオで最初の面接を受けられることが多い。これはとても有難いことなのだが、この面接環境を与えてくれるのは世界的には一部の企業だけだ。加えて多くのベイエリア在住者は、外国人に優しくしようと努めているのか、かなりゆっくり喋るように見受けられる。これは英語に苦手意識をもつ外国人にとっては朗報であり、特に日本人ソフトウェア・エンジニアが率先して西海岸に渡る傾向と無相関ではないように思う。

他業種の企業だと面接は単なる固定電話 or 携帯電話からはじまり相手の顔は見えない。米国でも著者の知るNY / Boston界隈では電話だけで全てを済ます人がかなりいる。著者は今回の転職活動で複数の企業から経験したのだが、今回オファーを頂いた企業も含めて電話の音質がかなり悪かったりする。しかも面接官はそんなことを気にせず、少なくともベイエリアより早口で喋る。著者の場合は、電話がローパスフィルター気味で高周波がカットされてしまう点が、基本周波数がアメリカ英語よりも高いイギリス英語と相性が悪く、ヒアリングはそれなりにハードだった。技術的に知らないことがあるのをhumilityとして認めることは面接結果にそこまで悪く寄与しないと著者は思うが、そもそも英語が聴き取れませんだと問答無用で落とされる可能性が高い。ヒアリング問題については相当ハラハラした。

著者個人に関していえば自分の身の程を再確認したということでもある。もともと高校生や大学学部生のときは全然英語ができなかったのだが、外資での業務を通じて米国英語にはそれなりの自信をつけてきた。イギリス英語もデービット・キャメロン前首相やトニー・ブレア元首相の演説などで慣らしてきたつもりだが、しばしばBBC Englishと揶揄される彼らの英語は誰にでも聴き取りやすいように計算されたものであって、一般イギリス人の会話にそこまで期待してはいけない。コックニーまでいかずとも多くのイギリス英語に対処するにはまだ著者のヒアリングスキルは足りないということである。入社までの猶予期間である今現在もイギリスのテレビを使って耳を慣らしているところだ。

さて、対応策としてここで伝えたいのは、普段から業務で顔の見えない音質の悪い英語に慣れておくことである。聞き取りの面倒なテレコンになぜ参加する必要があると思うかもしれないが、むしろそれをさせてもらえる業務はスキルアップのチャンスだと思って今の雇用機会を積極的に利用しておいた方が良い。あなたがお金に少し余裕があるなら、(外国側の通信はどうしようもないのだが) 高性能で音質の良い電話機を買えば少しはマシになるかもしれない。著者はケチだったので8年も使い込んだ安物電話機で第一面接に挑んだ次第である。オファーで手に入れるサラリーのことを考えると、ここでケチった著者がとても非合理的であることが明白だからマネしないように。そして電話面接を何回か通過すれば後段の面接ではSkypeや専用のビデオ面接機器も使われるし、それらを通過すればon-site interviewだ。しかし電話面接通過以降であっても、事務連絡事項などは全て電話で飛んで来るし、現地のヘッドハンターとのやり取りも電話のみである(彼らは街中からふらっと日本まで電話をかけるのだ)。コミュニケーション手段の基礎が世界的には依然として電話にあることは忘れないでほしい。

独創性や非典型的である強みを活かそう

さて面接の心構えについて最後にコメントしよう。多くの企業では口頭による会話で面接が進むが、著者のような研究職の場合はそれに加えて1時間程度の自身の研究プレゼンテーションを課される。このプレゼンテーションでは、なぜ自分がその課題を解こうと思ったのか、prior workは何があってどのような欠陥があるのか、本質的なあなたのcontributionは何か、といった内容を事前に資料にまとめる必要があり、その内容は当日に全方位から審査される。要は国際学会発表や講演と同様である。著者の職務は投資アルゴリズムのソフトウェア実装も含まれるため、ソフトウェア・エンジニアには馴染みのあるcoding interviewもさらに課された。

  • ただ正直に申告しておこう。著者のcoding interviewにおける回答は他のソフトウェア・エンジニアほどは優れていないと思う
  • 著者の場合、そもそも決定的アルゴリズムの完璧性を競う世界にあまり興味がないのでcoding interviewテキストなどは演習したことがない。しかしソフトウェア・エンジニア職を狙う場合は時間をかけてこれを行った方がよい
  • 著者の実際のcoding interviewでは、面接時間に制限があるため、これだとerror処理がされていないなと思う状況でも課題提出しなければならなかった
  • ただ研究職では他人が思いつかないアプローチの発見とそれにより提供されたプロトタイプの有用性が重要なので、悪いcoding成績は大目に見られたということである
    • Topcoder的な短時間解決能力は二流であったが、Apache Sparkを使った分散機械学習アルゴリズムの実装や複数のプログラム言語の使用など、これまでの経験からカバーされる部分も評価の対象に入った
    • 一方で前職の経験を一切考慮しないポリシーの企業もあるから、応募先をよく調べた方が良いだろう
    • 基本的にソフトウェア・エンジニア職では、完璧に動くコードの提出を要求される

イギリスから日本の著者に直接ハントが来た背景はランダムではない。著者よりも前に半年から1年ほど該当職務に従事できる人材を欧州で探したものの、見つからなかったらしい。事前募集告知はイギリスでTier 2 (General) Visaで外国人を雇う場合の必須条件である。金融市場において、機械学習がAlphaを生み出すと主張する仕事のほとんどはi) over-fittingを理解していないか、ii) over-fittingを避けるよう設計したつもりだったが実は最初の仮説がテストデータから来てしまっていた眉唾物である。問題の難しさを正しく理解し、かつそれでもチャレンジしてみようと考えるデータサイエンティストがいなかったということなのだと思う。

  • i) をやるのは本当の二流だが、ii)は一流の人でも犯すミスである。ノイズが少ないデータならこれでもだいたいうまく行くが、資本市場ではうまく行かない

何がオファーの鍵になったか、無論のこと著者には正確にはわからない。しかし著者が独自で開発していた投資アルゴリズムが大きくプラスに寄与したことは確かである。この中身についてはそのPrior Workやすでに認識している欠陥など広範な質問を受けた。もちろん質問はこれだけではなく、機械学習PhDホルダーが持っているべきアルゴリズムの全般理解についても質問が飛んでくる。日本国内で著者と交流のある機械学習研究者はほぼ全員これらの質問は通過できると思う。一方で単にRやpythonの機械学習パッケージを使っています、だと面接突破は難しいだろう。日頃からきちんと基礎を学ぶことには報酬があるのである。

逆に面接をする側から物事を見つめてみよう。著者は伝統的な日本企業のやり方を積極的に高く評価している。むしろシリコンバレーのソフトウェア・エンジニア職におけるそれを無批判に真似することの方が問題がある。通常はCoding interviewと課題への熱意や相性の重ねがけで採用判断すると思うが、たまに前者を極端に重視する会社がある。著者の考えでは前者は単なるフィルターであって、やはり後者が重要だ。前者だけで雇われる人材というのは、極端な言い方をすれば単なる「お勉強ができる人」だし、会社側も昔の工場労働者を雇うときのように部品として画一的な人材を雇っている側面がある。原理的に解けることがわかっている問題で完璧さを争うスキルよりも、解けないかもしれない不確実性の高い課題にある程度の解決法を与えるスキルの方が実社会では重要だ。たとえ一流大企業の開発したメソドロジーであっても、現在のソフトウェア・エンジニア採用トレンドには疑問符がつくことがある。悲しいのは、これらの大企業の名声ゆえにその採用ポリシーを真似するフォロワー企業が後を絶たないことだが。

英米では多様な人材がものすごい数応募してくるので、全ての候補者に対して人間的に対応することができない。よって学歴などCVに書かれた内容で機械的にフィルターする傾向が強い。その点、面接を最初から重視する日本企業は柔軟だと思う。面白いのは、Amazon.comのすごく高位の職位の人から聞いた話で、Amazon.comではCVの重要性が意図的に低くされており面接を重視するそうだ。ある意味で日本企業のスタイルに似ている。真に合理性を重視する企業はこのような柔軟性を大事にしているのだ。私に話をしてくれたその研究者はもともと米国の有名大学のtenure professorである。彼は他企業および大学の採用ポリシーと比較した上でAmazon.comのユニークネスを伝えてくれた。日本企業のこれからの採用戦略における鍵は、いかにこの柔軟性を保ったまま移民も含めたより多くの候補者に網をかけるか、という点にある気がする。人事にデータサイエンスが適用されつつある最近では、人間的な採用には統計的再現性がないことにも注意する必要があるだろう。

面接をスキルセットの確認プロセスだとみなすのは大きな間違いだ。それは相性の確認であり、熱意と倫理の相互理解プロセスである。現在どの企業で働いている人であっても、その人の職務のnon-triviality に由来する独自性が将来強みに変わりうる。世の中の流れに逆らうかのように、シリコンバレー採用ポリシーに著者が批判的になるのは、彼らのサラリーがとても大きいためだ。この2年くらいで「とりあえずTopcoderの問題集を頭に叩き込んでおけば無理に世界初を研究しなくてもたんまり金が入るんだろう」といった受験勉強突破テクで人生なんとかなるといった昭和の嘆かわしい思想に類似した風潮をtwitter等で散見するようになった。リスクテイクしなくても金が入る、と考える人がたくさん出てきたら大災害の予兆である。現在のtech industryへのtailwindはもちろんAI技術のおかげでもあるが、FRBの金融緩和の影響が相当ある。今の浮世が今後も続くと考えるような軽薄な態度はいずれ罰につながるだろう。レミングス的な行動に対する報酬には負の歪度が付随するのである。

逆にいえば、なかなか研究成果が出ず研究室で悩んでいる貴方や、無理難題をふっかけてくる顧客に対してどのように交渉を挑むか悩んでいる貴方の報酬分布には正の歪度がある。確率的にではあるが将来大きなリターンがあるということであり。あなたこそが良い方のblackswanになるのだ。Madness of Crowdsに乗せられてcopycatを続け、大災害たる悪い方の blackswanを引き起こす衆愚性の集団とは逆の存在である。外国からわざわざ声をかけてくるのは、自国で良い社員を調達できなかったときであって、あなたが依頼国の他の従業員と大きく違っていることはとても強みになる。非典型的であることが大事なのであり、それは民族由来のものだったり、非自明な(習得層に負の相関があるような)スキルの組み合わせだったりする。i) 西欧と違う視点をもち、かつ ii) その視点の背後にある合理性を欧米人にわかるように噛み砕いて説明できる人には、とても大きなチャンスが存在することになる。i) を持つ多くの日本人労働者にとって課題は ii)であるが、ここをクリアできれば彼らの可能性はとても大きい。

ゆえに今苦しい立場を感じている読者諸賢にこそ、むしろ自分に強く自信をもってほしい。著者の転職体験談など所詮1サンプルに過ぎないのであって一番伝えたかったことはこのような人知れず zero to one を目指している人へのエールである。今回はここまで読んでいただき、ありがとうございます。

Integrityと資本配分と高ROCからの再投資

先日のBerkshire Hathaway Inc. Annual Shareholder Meeting出席に関してもう少し話を続ける。著者はOmahaへの渡航時には Value Investor Conference (VIC) 及び併催されるSummitに出席している。昨年はPhilanthropy Summit, 今年はCorporate Values Summitが開催された。VIC本会議が投資手法や経済環境そのものについて議論することが多いのに対して、Summitは投資における価値観 (values) を議論する。技術者の人たちには価値観を議論するカンファレンスというのは馴染みが薄いかもしれない。しかし実は技術よりも価値観と哲学こそが不確実性の高い時代を生きていくにあたって最も大事なものだと、著者は自信を持って伝えたい。本稿では価値観が投資基準にどう影響し、そしてビジネス上の意思決定にどうつながるのかについて議題を提供したい。

Robert P. Milesへの感謝

VICに加えて、2017年の著者はGenius of Warren Buffett  (GOB)というバリュー投資家のためのExecutive MBAのクラスに出席した。VIC, GOB共にインストラクターの Bob Miles (Robert P. Miles) が作り上げてきたプログラムである。

彼と話していると、そしてプログラムに出席していると、Bobのintegrityの高さが伝わってくる。WarrenやCharlieのvaluesがそのまま彼にも共有されていることがよくわかる。VICやGOBの講師はBobによって本当に注意深く選定されており、講演者と受講者のいずれからも信頼されている。米国では彼は著名人なので宣伝目的で近づいてくるファンドマネジャーが大量にいるのだが、彼はそういった人々を避け、正しい価値観の元で投資が続けられるように受講生や出席者を助けてくれる。

Bobは作家として認知されていて、彼の著者の一部は日本語にも翻訳されている。The Warren Buffett CEOの邦訳を紹介しておくが、Warren Buffet Wealthもお勧めである。

最高経営責任者バフェット~あなたも「世界最高のボス」になれる (ウィザードブックシリーズ)

Warren Buffett Wealth: Principles and Practical Methods Used by the World’s Greatest Investor

著者はGOBコースの日本人修了生第1号だそうであるが、第2号以降が読者の中から現れることを願っている。たった3日間の受講で、日本の国立大学授業料の半年分くらいの費用がかかってしまうのだが、この講座で身につけた倫理観と規律はこの後の人生においてずっとあなたを助けてくれると思う。リターンを追求する投資だけではなく、投資による資本配分がリアルのビジネスにどう影響するのか、なぜintegrityがmatterするのかがよく分かるのだ。

ここではGOBおよびVICに来てくれた講演者の中で特に印象的だった2人をピックアップしたい。1人目はNebraska Furniture Mart (NFM)の前CEOであるBob Battである。2人目はInvesting Between the Linesを出版したL.J. Rittenhouseである。彼ら以外にもWarrenの長女であるSusie BuffettやNational Indemnity Company (Berkshire傘下で大変な利益をあげている保険会社である)のCEOであるDonald F. Wursterといった豪華スピーカーと身近に話すことができて大変貴重な時間であった。

Integrityと再投資との関係

Bob Battは慎重さとリテール・ビジネスにおけるあらゆる知見、そして何より次世代に対する思いやりを持った、尊敬できる老人の代表みたいな人である。バフェットの専門をCapital AllocationからRetail Businessに変えると全てそのまま彼になるかのようだった。彼はcandorのある人物で、オンラインのe-コマースや消費にお金を使わないミレニアル世代など、自分たちのビジネスに現在吹いている逆風についても率直に語った。NFMはMrs. Bとして知られるRose Blumkinが創業した。Bobは彼の家系がMinsk (今はベラルーシ、当時はロシア)からどうアメリカに渡って来たのか話してくれた。

NFMは巨大な一店舗にあらゆる家具とアプライアンスが置いてあるblock and mortal storeである。実際のところAshley (たまたまであるが著者の自宅の近所に日本支店があって知っている) など質の高い家具がかなり安く買えるので、インテリア好きの人はアメリカ中西部に行くチャンスがあったらぜひ訪問してみることをお勧めする。Bob自身はNFMからは引退して今は子供たちを助ける慈善事業に全力を注いでいる。リテール・ビジネスにおけるインサイトは慈善事業の経営や政府の運営など公益の追及にもとても役立つそうだ。

NFMや同じくBerkshire傘下で宝飾品の販売を手がけているBorsheimsなどは、他のリテールビジネスとは異なった性質を持っている。店舗数がものすごく少なくて基本的にはsingle-storeで全てを提供するのだ(注: NFMは全米で4つしか店舗がなく、そのいずれも巨大である)。多くのbrick & mortal retail businessでは、小さな店舗をたくさん建設するfranchiseの形式を取る。NFMやBorsheimsは逆である。しかし、たった1店舗にものすごい在庫があってなかなか買い物が楽しく、しかも価格も競合より安い。日本で言うと、東急ハンズが定価販売ではなく量販店と同じ値段で売っているようなイメージだろうか。

このsingle-store policyはWarren Buffettの注意深いcapital allocation能力によってもたらされたものである。彼は合計売上高を増やすのではなく利益率を増やすことを傘下企業に強く求めるそうだ。もし店舗数の増大がコストの増大か顧客の低価格志向によるマージン低下につながるようであれば、Warrenは傘下CEOたちにむしろビジネスの拡大を避けさせるのである。

NFMでは比較的安いNebraska州での流通コストや人件費を武器に低コスト優位性を維持している。販売価格も安いがコストがそれよりさらに安く高い利益率が維持される。他者がこれを真似ようとしても同レベルの低コストが実現できないので、高価格販売して顧客からそっぽを向かれるか無理して値下げして破綻するかのいずれかになる(日本の量販店は後者の道に向かっている印象がある)。Bobは”We are conservative.”と率直に語っていた。政治の世界でのconservativeは色々議論があるが、このビジネスに関するconservativeは著者には心地よく聞こえた。低コストを武器にするのはAmazonのe-Commerce部門も同様だろう。自称高付加価値ビジネスは競合が参入するとあっさりと値下げの妥協を強いられるが、流通網の強さによる低コスト優位性は競合が真似できないのである。Amazonの場合は直近の利益率を犠牲にして世界中で低コスト状態を実現するべく拡大を続けているが、NFMは高利益率を維持する代わりにNebraskaから外に出ないのである。そして全米中から消費者をOmahaに連れてくる

Growthとかbig businessといった言葉に踊らされている人にはNFMのpolicyは奇妙に映るかもしれない。しかし資本の効率性を最大化する観点からはこのアプローチが正しいのであり、しかもこのやり方だと雇用を最大限守ることができる。どういうことだろうか。

Buffettは複数のビジネス領域に極めて通じた投資家である。彼は同じ1ドルを追加投資するならどこに投じたら良いのかが的確にわかる。NFMやBorsheimsの店舗をどこかの州にもう一つ作るのと、それとも傘下の保険会社の拡大に当てるのと、リターンがどちらが大きいのか判断できるのである。彼はdiminishing returnによって利益率がさちってしまったビジネス領域にお金を放り込む愚を犯さない。そしてNFMは店舗を増やさずとも、Omahaにとどまっている限り儲けた利益を翌年の運営のために再投資して、高い利益率を保ったまま安定的に売上も拡大することができる

テストステロンに心を支配された愚かな経営者は店舗を増やせばビジネスが短期間で飛躍的に増大して利益もうなぎ登りかもしれないと楽観サイドだけを考え、短期間で急激な拡大を狙うが失敗して多額の負債を背負う。従業員も急拡大して大量に雇ったと思ったら急に大量に解雇する(人の人生をなんだと思っているのだ)。NFMのやり方だと、circle of competenceを守ることで持続的雇用を提供できる。もちろん絶対的な雇用人数が大きく増えるわけではないが、やっと仕事が見つかったと思って働き始めたら急に解雇されて今までの時間はなんだったのだと、せっかく働きに来てくれる従業員を途方にくれさせるような事態を賢明にも避けているわけだ。実際、Berkshireではlay-offをしないことを大事にしているそうだ。昔のDempsterの件ではBuffettは誤りを犯したと考えているらしい。

そしてこのアプローチは投資としても非常に成功する。高い利益率を維持して再投資を続けることで、長い目で見ると複利によって資本が膨れ上がっていくのである。ある時+50%で増えたと思ったら翌年から+3%しか増えなくなってしまったなどというビジネスよりも、毎年+15%がコンスタントに続き際限なく増えていくようなビジネスの方が望ましい。グロース株などと呼ばれている銘柄の一部は前者のような一発あたり市場しか取れなかったりするし、一発狙いの短期思考の人は、利益の再投資によって膨れ上がる複利を過少評価する傾向がある。アインシュタインも人間が複利の効果に気づかないことについて言及しているようだ。ぜひ後者のビジネスを探してみて欲しい。

Integrityとデータ解析

実はバリュー投資家のコミュニティでは最近、quality of investmentsが成功の鍵だと言う意見が強くなっている。財務書評から読める定量的ファンダメンタルズも大事だが(これが分かるだけでロクでもない会社をお金を放り込む愚は避けることができる)、それ以上にCEOや会社の人格・価値観こそがリターンを決めるのだという見方だ。

L.J. Rittenhouseはcandorをshareholder letterやannual reportsのテキストから分析する方法を見出してきた。良いニュースだけでなく悪いニュースも率直に伝える正直さ・自分の誤り認める態度があるとか、株主への手紙で英作文に時間をかけて丁寧に最適な単語を選ぶような経営者のいる会社は成功確率が高いのである。経済と倫理との関係を大切にしている人にとっては朗報ではないか。この世界は技術者の人にとっても面白いかもしれない。彼女らのアプローチを参考に、自然言語処理を用いて株式のリターンを予測しても良いわけだ。著者も以下の書にサインをもらった。

Investing Between the Lines: How to Make Smarter Decisions By Decoding CEO Communications

Quality of investmentsの世界には心理学者も研究フィールドを広げている。昨年のVICにはFred Kielが以下の書の紹介も含めて来ていた。Rittenhouseに興味を持たれた方はFred Kielも合わせて追いかけると良いことがあるかもしれない。

Return on Character: The Real Reason Leaders and Their Companies Win

人力ピックとアルゴヘッジのハイブリッド

Berkshire Hathaway Inc.のAnnual Shareholder Meeting及び関連イベントに参加するためNebraska州のOmahaに来ている。今回が2回目の渡航である。関連イベントではバリュー投資に関する講座に出席している。このプログラムでは著名バリュー投資家もしくは彼らを追いかけている金融ジャーナリストによるフリートークと、財務諸表を眺めてvaluationをすぐ出すクイズとが交互に続く。

本題の前にこのプログラムで学ぶことになった面白いアプローチを一つ。難しい数式や計算機を必要とする関数を用いる代わりに、いくつかの近似式を半ば暗記的に頭に入れるのは役立つようだ。感覚としてある程度の見積もりがパッと出せるようになるのは面白い。例えば72をリターン[単位%]の値でわると資産が2倍になるのに要するおおよその年数が出てくる。このヒューリスティックはかなり強力で、複数年次の財務諸表を眺めたときに複利としてのearnings growthがどの程度の会社なのかといったことが計算機なしで分かってしまう。厳密な計算はExcelやRを使うものだし、著者も含む多くの人はそういった手順に慣れている。しかしパッと見た時に考慮する価値のある会社かそうでないか判断できるフィルター能力は、stock pickingの能力を鍛える上で貴重なものである。

  • なぜ72に対して割り算すればいいかは一次近似を理解すれば簡単にわかる
  • 百分率でのリターンをr [%], 2倍になるのに必要な期間をT [年] とする
  • T\log (1+r/100) = \log 2 を解けばいいのだが、通常リターンは100%よりずっと小さいことを用いると左辺は  T \times r/100 でほぼ置き換えられる
  • するとTr = 100\log 2 \simeq 69.3 という単純な関係が出てくる
  • 通常の複利を用いるか連続複利を用いるかといった所で違いがあるだろうが、i) 2次以降の項も考えると少し上乗せする必要がある点、 ii) 72が色々な数字の公倍数になっていて暗算しやすい点も考えると72というチョイスは悪くない

他の受講生には数理科学の専門家はあまり見かけなかったためか、著者が機械学習専門であることを知ると他分野への興味からそれをネタに話しかけて来る人もいた。Berkshireとブラジルの3G Capitalが共同買付をしているからなのか、参加者にはブラジルのヘッジファンドでEquity Research Analystをしている方が多かった。

機械学習研究でPh.D.を取得した著者であっても財務分析の世界にやってくれば完全な赤子である。しばしば感じることは、単純なテクニックすら演習ではうまく使いこなせない自分は他の受講者より愚かなのではないかという不安である。著者の場合は特に、自身の研究分野でなら英語での議論にも何も不便を感じて来なかったため、財務分析になると的確な質問が思い浮かばないのは二重に歯がゆいのである。相手にする世界が変わると、日本人にありがちな「留学したら無口になってしまった」症候群と同類になってしまうわけだ。

しかし目的は別に他の受講者よりも多く正解することではなく、自分の投資スタイルにプラスになるように学びをすることだ。何より、自分が外の世界では無力であることを知るのは非常に健全であり、それこそが知的にストレッチされる瞬間である。今回の講座の教授陣も皆lifelong learningという言葉を使っている。Lifelong learningは悪い人口動態のせいで何かと悲観主義に陥りがちな日本社会にこそ、もっとも求められているアプローチだと思う。

バリュー投資に関しては今まで何回かコメントしてきたので省略するが、機械学習的時系列予測の当たらなさ度合いに疲れ果てた著者がガイ・スピアの著書を読んだ時の福音がとても大きかったことは伝えておきたい。本書でいきなり信者になった訳ではなくて、本書に出てきたキーパーソンたちの軌跡を追い、かつバリュー投資の世界における多くの統計的検証結果をきちんとサーベイしてからバリュー投資を始めた次第である。

勘違いエリートが真のバリュー投資家になるまでの物語

正の期待値を探す

多くの個人投資家が無理なく、しかし現金を現金のまま溜め込むよりも長い目で見たらはるかに優れたリターンを生み出す投資戦略とは何だろうか。この問に対する答えを知るには、リターンに関する期待値がプラスである戦略がどれだけあるのか知らなければいけない。

日本に住んでいると、期待値が顕著なプラスであることを確信できる資産クラスが何なのかわからなくなってしまう。失われた20年の間に蓄積されたデフレマインドと、多くの日本企業で見受けられる慢性的に低いReturn on Capital (ROC)を見ると無理からぬ話である。低いROCが続く原因についてはいくつか仮説があるので、さらっと書いてみた。読まれた方は気づくかもしれないが、契約条項に書かれていない顧客の過剰な要求に付き合わされる長時間労働などの問題は、本質的には株主の力が弱いのが原因だと著者は考えているのである。

  • まず根本原因は日本企業のpricing powerがとても弱いことである。似たり寄ったりのプロダクトばかり作っているせいだが、製造業への依存性が高い日本の産業構造の問題も大きいと著者は考えている。不幸なことに、日本が得意な技術分野が相対的にEconomic moatを形成しにくい産業に偏っているわけである
    • Moatがない企業の簡単な特徴は2つある。1つ目は値上げする前に顧客が怒らないことをお祈りする。2つ目はInternetが直接的な脅威になっている
  • Pricing powerを考慮した投資エリアのシフトにはCEOの合理的な決断が必要であり、そのために最適な人材が雇われるべきだ。しかし株の持ち合いが続く日本企業では、業績を悪いまま放置するCEOがなかなかreplaceされない
  • 持ち合いではない企業であっても、政府や経営者がactivistを敵対視しているせいもあって、株主の力は構造的に弱いままである。経営者が入れ替わることをなかなか期待できない状況では、ROCの改善は期待できない
  • この構造的な弱さが持続することを仮定すると、ごく一部の例外をのぞいて、日本企業に長期投資しようと投資家は考えなくなるだろう。そういう状況で、残念なことに旧日本軍以来染みついている短期決戦思考が資産配分でも現れてしまうのである。長く待っても勝てる見込みがないなら、一回だけ多賭けして勝ったら勝ち逃げしてしまおう、といったところか。無責任なレバレッジをかけたFXトレードなどはその典型である。しかし単純な質問である: i) 負けたら(そしてそれは大負けだ)どうやって再起するのだ? ii) 長期では勝てないのになぜ短期でなら勝てると考える? 勝つ確率だけ考えてる?

失敗の本質

  • このトレード体質は別に日本固有のものではない。オンライン・ブローカーが普及した世界中で見受けられる。しかし例えば、日本の強みであるビデオゲーム産業で培われたマインドは、こと投資に関しては悪い方向に作用する。
    • 殆どのビデオゲームにおけるランダムネスはマイルドなものであり、人は何回か試行錯誤してプレイするだけでゴールまで比較的早くたどり着くことができる
    • しかし資産価格の時系列は極めて野蛮なランダムネスを伴っており、人間の本能的感覚 (カーネマン達の言う所のSystem 1, 早い思考)でプレイすることを繰り返しても最適解にたどり着くことはほとんどない
    • そして自分の直感は優れていると勘違いしている多くの人は、System 1から離れてSystem 2による遅い思考に切り替えることをいつまでたってもしないのである

ファスト&スロー (上)

しかし、期待値がプラスの戦略が見つからないという状況は世界的に見れば心配しなくて良い。2008年の金融危機以降成長率が鈍化したとは言っても、人口動態も大きく違うし世界的には成長している企業がまだまだたくさんある。この点ではなんだかんだで米国は王者である。

優れた米国企業を見つけて、その企業の株価が安い時に買い、buy & holdするという単純なアプローチは、長い目で見ればほとんどの個人投資家を満足させるリターンを提供してくれる。長いと言った時にだいたいこれは10年以上を指す。10年は企業のビジネスが始まって終わりを迎える一つのサイクルに近い期間だ。10年たって顕著なリターンがなければ、それは市場が愚かなのではなく、あなたの銘柄選定が間違っていたというべきだ。優れた企業を割安価格でbuy & holdするアプローチ全般がバリュー投資と呼ばれているが、その具体的方法論はまずは著名バリュー投資家の進めるテキストからスタートした方が良いだろう。伝説的な二冊として、いずれもJoel Greenblattの著書をお勧めしておく。怪しい邦題に反して本書に書かれた数式にはその後アカデミックな検証が広範になされている。


グリーンブラット投資法 ──M&A、企業分割、倒産、リストラは宝の山

株デビューする前に知っておくべき「魔法の公式」

なおバリュー投資の他にも期待値プラスの戦略はある。例えばボラティリティ・ショート戦略である。リスクを抑えた上でputオプションを売るか、またはVIX指数先物のコンタンゴから利益を得るETF (XIVまたはSVXY) にポジションをはる。この戦略は金融危機の時にとても大きな損失を生み出すが、積算するとその損失を全てカバーするだけのリターンを生み出す。なぜそうなるのかは、低い確率で大きなリターンが得られる宝くじに対するプロスペクト理論のバイアスを思い出すと良い。

負の歪度がもたらすリスクと不合理性

ある程度のメンタルの強さを維持できるのならバリュー投資ほど優れた戦略はない。バリュー投資で大事なのは、なぜこの戦略が長期で大きなキャッシュフローを産むのかに関する的確な理解であって、複雑な数学は全く必要ない。ボラティリティ・ショートを行うには少しは数学を理解している必要がある。

問題となるのは、多くの個人投資家は、一度に大きな損失が来ると、今後この損失がまた来るかもと思ってポジションを閉じてしまう点だ。このメンタリティはバリュー投資を続ける上では障害になる。だがポジションを閉じるのは誤りである。負の歪度をもつ確率分布が引き起こす誤認に騙されているのだ。例えば +1%が10日続いた後に -7%の下落になったとしても合計はまだプラスである。小さなプラス回数がたくさんあり、大きなマイナスが少数回数ある確率分布は負の歪度 (skewness)をもつ。世の中はコイントスや正規分布のように勝ち負けが半々ではない確率分布がたくさんあるのである。歪度が負であって期待値も負であるような散々な銘柄もあるし、歪度が負だが期待値自体は正である資産もある。バリュー投資や、合理的思考を維持できるならボラティリティ・ショートは後者に属する。ただリスクをあるレベル以上とってしまうボラティリティ・ショートは全て期待値もマイナスになる。ケリー基準を思い出して欲しい。

例えばBerkshire Hathaway Inc.は保険料のプレミアムによるfloatを用いたレバレッジ投資を行なっていることもあり、そのリターンは負の歪度を持っている。実際、911のテロ時にはBerkshire参加の再保険会社が莫大な支払いを要求されたが、このテロによるテールリスク or 免責事項はそれまで保険料に入っていなかったそうである。株主総会でもBuffett自ら、テロや地政学リスクに関しては今も心配し続けている点を率直に語っている。

  • 多くの経営者は自分たちが如何に優れた企業であるか吹聴してネガティブ・ニュースを隠そうとする
  • しかしBerkshireではWarren Buffet, Charlie Munger, そして傘下企業のCEO達がみなこれと反対の性格を持っており、率直に悪い情報を伝えてくれる
  • このcandorこそがOracle of Omahaに莫大な成功をもたらしたことを覚えていて欲しい

負の歪度と正の期待値に関しては幅広いアセットクラスに対して調査を行なった論文がある。詳しくは [1] を参照して欲しい。よく「ハイリスク・ハイリターン」という言葉があるが、このハイリスクは高ボラティリティ(標準偏差 or 絶対偏差)と紐づけて論じられることが多い。しかし注意深く統計分析を行うと、ここでいうリスクとは負の歪度であり、歪度が低ければ低いほど(ダウンサイドのテールリスクが高いほど)、期待値が上がるのである。誰しも一発で破産などしたくないから、そのような資産は買われにくい傾向があるため市場価格が過小評価されやすいわけである。

[1] のFigure 7を見ると、どの戦略の期待値が高いのか、また歪度が低いのか参照できる。バリュー投資に一番近い性格を持つのはFama-French High Minus Low (HML)だろう(ただしこれはgrowth stockをショートしているのでオーソドックスなlong-onlyバリュー投資とはskewnessが異なる)。HML戦略はskewnessがやや正であって、他の戦略に比べてコツコツ稼いだものを一気に吹っ飛ばすケースが少ない。その分期待値は暴落リスクを追っている他の戦略よりも低い値に甘んじることになる。

負の歪度を低コストで緩和する

バリュー投資やボラティリティ・ショートから得られる(負の歪度に対するリスクプレミアムとしての)正の期待値を取りに行く上で、認知バイアスから逃れるために、期待値を保ったまま歪度をなるべくゼロに近づけたい。何ができるだろうか。

1つ目の方法は直接的なもので、バリュー投資で保有する銘柄そのもの、もしくは株式指数のputオプションを買うことだ。いわゆるごく普通のプロテクティブ・プット戦略である。金融危機においては損失をかなりカバーしてくれる。

株式と一緒にいつもputオプションを買うナイーブなプロテクティブ・プット戦略の問題点は、長い目で見ると保険料を払いすぎて期待リターンの大半を吹き飛ばしてしまう点である。そこで、いつもオプションをロングするのではなく、オプションが割安か割高か、そして今後implied or realizedボラティリティが上がるのか下がるのか予測しながらオプションをダイナミックにトレーディングする。どういう時に、どのような行使価格・満期のオプションを買えばいいのか、合理的に決める上では機械学習や計量経済学的アプローチがとても役に立つ。株式銘柄は単なるbuy & holdしつつ、ヘッジポジションのみ数学と統計の力に頼るわけだ。

同じく株式をロングしつつヘッジの仕方を変える戦略もある。2つ目の戦略はやはり [1] のFigure 7が示唆してくれる。Momentum戦略のリターン・プロファイルを見て欲しい。この戦略は成長株であるか割安株であるかに関わらず、とにかく中期的に上昇傾向にある銘柄に対してトレンドフォローする(下降傾向にある時は空売りする)という経済学的・合理的思考もへったくれもないアプローチである。しかし実は期待値が正でしかもその値が高いという優れた性質を持っている。Momentumアノマリーはこの論文に限らず種々の研究で確かめられており、効率市場仮説を提唱したFama自身がpremium anomalyと呼んでいるくらいである。

Momentum戦略に関して着目したいこととして、期待値が正でありかつ正のskewnessを持っている点が挙げられる。日本語でいう所の提灯買いにすぎないmomentum戦略もまた、バリュー投資やボラティリティ・ショートと併用してポートフォリオを組むと全体のリスクや歪度を抑える良い性質を持っている。

バリュー投資をベースとしつつ、その負の歪度を機械学習アルゴリズムやmomentumで緩和するハイブリッド戦略は多くの投資家が精神的に耐えうる良いポートフォリオを提供すると著者は考えている。ここではmomentumや機械学習はメインの収益源ではなくヘッジ手段として補助的に用いられているわけで期待値が必ずしも正でなくても良いのだが、工夫次第で期待値を正にすることも可能である。

  • なお機械学習はバリュー投資と時系列予測による投資と双方に適用可能である。機械学習バリュー投資のファンドは多くはないが、例えばEuclidean Technologiesというヘッジファンドはバフェットスタイルの長期投資のためのdeep learning algorithmを開発していることで著名である
  • しかし十分なサンプルサイズを提供するファンダメンタルズ・データベース (学術研究と実務ではcompustatが使われる) は個人投資家にとっては利用料が高すぎるため、個人投資家が機械学習バリュー投資を実践することは現実的ではない
  • そもそもdeep learningやgradient boostingを全く知らなくても長期的にworkするバリュー投資は可能である。シンプルな方法で十分なリターンが出るのに何故複雑な方法を行う必要があるだろうか

バリュー投資ではなく、ヘッジ手段としての機械学習アルゴリズムを用いる場合、その学習データは単なる価格時系列になる。これについて著者の意見は以下の通りである。

  • ファンダメンタルズを用いずに時系列特徴量のみを用いた短期株価予測だけだと、期待値がプラスの投資アルゴリズムを作るのはものすごく難しい。多くの荒くれ者がこの世界に挑戦してきたが、あまりに大きなノイズによって大量のPh.D.ホルダーやデータサイエンティストが見事に討ち死にしている。
    • 未熟者はover-fittingに殺され、経験豊かなものは難しさのせいでこの世界から逃げ出してしまうようだ。広告ターゲティングビジネスなら簡単に予測できて儲けられるのに、なんで難しい株式市場で戦わなければいけない?
    • (しかし広告ターゲティングに自己資金を投下しているデータサイエンティストもまた見かけたことがないが; サラリーマンとして会社の金を利用しているだけである)
  • しかし期待値がゼロ or 負で バリュー投資との相関が低い戦略を機械学習させることはそこまで難しくない。いつもputオプションでカバーするよりも実効的なコストが安い戦略を見つけられるわけであり、統計学的・人工知能テクノロジーがコスト削減に貢献していると言うことができよう

昨今、怪しいAIファンドが次々に出てきているが、上がる株式を予測できる旨のメッセージを見かける。そう主張すること自体反対はしない。実際、注意深く特徴量と学習アルゴリズムを設計するとそれが可能であることは著者も確認している。しかし機械学習がヘッジを助けてくれる旨を主張しているファンドは少ないように感じている。2008年の再来を想定した、暴落時の緩和がつきつつも長期リターンがバリュー投資に近いファンドがあれば、それは多くの個人投資家のメンタリティでもホールドが可能なのではないだろうか。

Reference

[1] Y. Lempérière, C. Deremble, T. T. Nguyen, P. Seager, M. Potters & J. P. Bouchaud, “Risk premia: asymmetric tail risks and excess returns,” Quantitative Finance, 17(1), 1-14, 2017.

問題と事業は選べる(そして選びなさい)

半年ぶりの投稿である。ブログは滞っていたが仕事や私生活では多くの学びがあって、それなりに充実した半年間であった。毎回数式やグラフを書いていると執筆が滞りすぎること(つまりこのブログは去年ダッシュしすぎたということだ)を考慮し、文章だけで良いからもう少し頻度を増やそうかと考えている。そう考える理由は、ここ最近良い研究トピックに出会って趣味レベルの数式をブログに書くよりもpublish or monetizeに集中しようと考えるからだ。本日書くのは、3年くらい前からずっと感じていることで、研究テーマの選択と事業領域の選択に関する共通性である。

問題を解くのではなく発見する

研究者の世界では、新しい問題を発見してかつ自力で解いた人が大きく評価される。既存の問題の新しい解法を発見した場合でも背後の数学や実験がきちんとしていれば論文にはなるが、どうしても後追い・インクリメンタルな改良として次点の評価になりやすい。改良型の論文が評価されにくいことを嫌がる人もいるようだが、第一人者を最大限賞賛するこの文化を著者個人は正当だと考えているし、これこそが研究にギャンブル性を持ち込む面白い点だということで気に入ってもいる。

他人の定義した問題を改善する研究は数式を不必要にこねくり回すことが多い。著者のように、数理的・統計学的アプローチの研究では特にそうだ。たとえば既存の研究に調節が難しいハイパーパラメータ (この単語の意味がわからない読者には、アルゴリズムのふるまいを調節するバルブだと思っていただければよい) があったとしよう。そのハイパーパラメータを合理的に決める方法 or 最適値の解析解もしくは近似解は、その導出が厳密なら一流論文誌や国際会議でpublishできる。大概、その厳密な導出の背後は複雑な積分値と、その上界 or 下界を与えるための不等式 (それどこから持ってきたの? と言いたくなることが多い) の山になる。

導出までシンプルな研究成果ならいいけど、難しい数式の山を見ると (かつては著者もそういうものにのめり込む傾向があった)、こう思ってしまうのだ。

  • その難しい数式に納得できない人は、その研究成果を利用しようと思えないのでは?
  • その数式をさらに展開させられるような一部の数学エリートでないと、この研究の先が発展しないのでは?

もしあなたが研究成果に関する全てを支配したいなら、複雑数式論文もありだ。けれど、あなたの研究目的が小さな世界での独占ではなく、社会全体の発展に寄与すること、そして第一人者としての名声 or 金銭をいくばくか得ることなら、研究成果はむしろ単純な方がいい。単純な事実と結果との対応であれば、それを応用したい人が実務家・研究者の双方で増えるだろう。そこであなたのフォロワー (Citationの増加を含む)が増えることで、あなたの目的が最大限に達成される。

そういう背景事情があるからこそ、すでに大枠が決まってしまった問題で数式をこねくり回す人より、社会的意義があるが皆が気づかなかった新しい問題を発見・わかりやすい解法を見つけた人が評価されるのである。解法の難度としては、あらゆる人間が理解できなくてもよいが、ある程度素養がある人が十分理解できると素晴らしい。更には、トリッキーなアイデアに支えられていて、盲点で気づかなかったが言われて見れば当たり前な方法は良い評判が得られる。コロンブスの卵である。

で、今日コメントしたいこと。研究の世界では多くの研究者仲間で広く合意があるこのカルチャーは、ビジネスの世界に全く共通のものがあっておかしくないはず。しかしビジネスの世界では、これと逆をわざわざやって不必要な茨の道を歩む人が沢山いるように思えるのだ。Amazon社のように最初にわざと困難(e.g., 赤字続き)な道を歩くことで圧倒的シェアを確保し、あとから独占を謳歌する戦略ならまだわかる。でもこの2年間くらいで著者が見かけた人々は、このような長期戦略があるわけじゃなくて、「ただ痛みしかない茨の道」を選んでるように見えた。


ジェフ・ベゾス 果てなき野望-アマゾンを創った無敵の奇才経営者

投資家は事業を選べる

もしあなたがプロの雇われ経営者で、ヘッドハントされてある会社のCEOになるよう説得された場合。そのオファーを受諾すれば、あなたが個人的にどんな事業に興味があるのかに関わらず、その会社のコア事業をまずは何とかしなくてはならない。それが株主や顧客・従業員に対する責任であって、それが嫌ならCEOになってはいけないのである。そしてこの選んだ事業が、どんなに優秀な経営者であっても構造的に復活させようがないということは実際にある。Warren BuffettがBerkshire Hathawayを買収したとき、最初は繊維産業を復活させようと悪戦苦闘したが結局断念したことを思い出して欲しい。

しかしBerkshireは投資会社としてその後劇的に成功しており、Buffettの経営者としての能力は高いものであった。問題は当時の繊維事業のほうである。投資は経営者ではなくて事業に賭けなければならない。Buffettは「馬鹿でも経営できる会社を選びなさい。いずれそういう人が経営につくのだから」と言っているし、投資の世界では「競馬と逆で騎手ではなく馬に賭けろ」と言われる。なお競馬では騎手に掛けるべきなのかどうかも著者は知らないので、もしかしたら「競馬と同じで騎手ではなく馬に賭けろ」かもしれない。著者の友人には尊敬できる経営者もいるし彼らの成功を願っているが、彼らのビジネスに対する率直な評価は経営者個人の資質よりも彼らがどのような事業を行うのかの方に常に向けられる。

世の中には構造的に参入障壁 (堀) が気付きやすく安定したキャッシュフローが得やすい事業形態と、参入障壁がなくて過当競争で延々と苦しむ事業形態との区別が厳然としてある。この点に関しては世の中は全く公平に出来ていない。あなたが人生全体を自虐に捧げる気がない限り、投資は前者のタイプの企業を選ぶべきである。キャッシュフローが予測しやすい会社は株価の妥当値が計算しやすいため、株価が下がったときにそれが本当に割安かどうかも判定しやすいのである。

ではどのような事業が深い堀を持っているのか。この点について述べた参考書はいくつもあり統計的分析と絡めた良書が著者のお気に入りである。しかし統計分析まで行かなくても、たとえば下記のパット・ドーシーの著書は良い知見のオンパレードである。あまりにオンパレードで覚えきれないので、ときどき読み返している。単なるおすすめコメントだけだと納得しないであろうから、一例だけ抜き出そう。アメリカの場合、プロパンガスを集合住宅に供給する会社は安定して利益率が高いのだ。なぜでしょう?


千年投資の公理 ──売られ過ぎの優良企業を買う

その一つの理由は、建物の大家がガス会社をいちいちスイッチするのが面倒くさいからである。そしてこの面倒くささは、プロパンガスのタンクが買取ではなくリースによって運営されていることで強化される。業者を変える場合、自分の保有するタンクをそのままに単に補給源だけスイッチするというわけにはいかず、ガスタンクの設置・撤去などで高い手数料を取られるかもしれない。スイッチコストの高さからガス会社を変えないという大家は多いようで、プロパンガス会社は大したイノベーションがないにも関わらず高い利益率を延々と享受している。無論のこと、この高いガス代は大家および居住者が結局余計に支払わされることになるのだが。

一方で、おなじエネルギー関連産業でも石油精製企業は利益率が低い。なぜだろうか。その答えは、石油精製物はプロパンガスと違って軽く、パイプラインで容易に他の地域から運ぶことができるからである。その結果、顧客は絶えず遠方の石油精製会社からより安い精製物を運んできてコスト削減しようとするそうだ。この場合、規模の経済によって独占状態のグローバル大企業が勝つか、または価格競争で全社共倒れになる。プロパンガスは石油精製物と違って輸送コストが高く、ローカル企業が生き残りやすい。これだけ書くと読者にも想像がついてくると思うが、物理的に重いものを扱うビジネスではローカル企業がグローバル企業に勝てるケースが散見される。砂利会社などもそうだ。

他の儲け方としては、銀行が引き落とし口座を変えたがらない顧客が多いのを悪用してATMの手数料を毎年値上げしている構造などが紹介される。顧客満足度が高い企業は将来大きな利益をあげられるという考え方が盲目的に信奉されているが、おそらく「価格をインフレ率以上にあげても顧客の満足が変わらないこと or 顧客が逃げないこと」というのが本質的なビジネスの強さだろう。Berkshire傘下のSee’s Candyというチョコレート会社があるが、この会社は驚異的でインフレ率+数%のオーダーで20年以上コンスタントに値上げをしてきたにもかかわらず顧客が離反しなかった。著者はSee’sは甘ったるくて全く好きでないのだが (スイスのLindtの方がずっと好きだ)、著者がマズいと思うチョコレートでも中毒になる消費者がいるのだからこのビジネスは大成功である。それ以外の、価格を割り引いてあげたから顧客が満足しているというのは、トラックすべき顧客満足度とは違うのである。どうもこの点が我が国では総体として理解されていないように見える。

起業家と就活生も事業を選べる

さて、投資家は構造的に不利な業種を避けて選択が可能であるが、家業を継いでしまったなどの特殊事情がない限り、他の立場の人も実は事業を選べるのだ。その筆頭は起業家である。起業家の成功の80%は選んだ事業で単に決まっているのではないかとさえ思う。社員が少ないうちは事業のピボットは可能であるものの、勝ってもほどほどのリターンなのに負ける可能性が高すぎる事業は始めから無視すべきではないだろうか? あなたがわざわざやらなくても他の、おそらくはあなたの代わりに犠牲になる起業家や、もしは既存の企業がやってくれるのではないか?

更には、単に就職・転職する立場の一般労働者も選択が可能だ。ここで注意すべきは、構造上儲かりやすいが労働側はコモディティであり、人件費が抑圧されている業種もあることである。こういう企業は投資家として株を買うだけに留めて社員になるのはやめた方が良い。でも人件費がそれほど抑圧されていないようであれば、その会社への就職を実際に考えても良いのでは? プロパンガス会社の社員の給料がどの程度かは著者にはわからないが、もしまぁまぁの水準なら、しょっちゅう宣伝が出ているインターネット企業よりも、無名のプロパンガス企業に行った方が賢いんじゃないか?

しかし起業家も就職を考えている学生も、驚くほどに業種の選択に対して無知であるように見える。巷にはリーダーシップやシリコンバレーの文化に関する本が溢れている。そしてそれらの自己啓発的な内容に触発されて最も参入障壁のない世界に突撃する人は後を絶たない。もちろん、例えばビジネスSNSのLinkedInのように、インターネットの世界では勝者になれば、ネットワーク外部性・winner-take-all現象によって驚くほどの利益を享受できる。しかし内心勝てるか疑問視している人は、別の道を考えて良いと率直に思う。またプロパンガスはニッチ企業だがインターネットはメジャーだという意見には異を唱えておこう。先ほどのパット・ドーシーのリファレンスにはメジャーな大企業であってしかも堀をたくさん持ったビジネスの例が多く出てくる。このリファレンスの方が起業マニュアル or 自己啓発本よりずっと役に立つと著者は思ってしまうのだが、いかがだろうか。

投資アドバイスを聞いて株を買う代わりに就職先を決めたって何の問題もない。株式投資の標準的教科書は間違いなく就職活動に役立つのだが、株はでたらめな書籍が大量に出回っているため、初学者が真のテキストになかなかたどり着けないことが問題なのだろう。

知られていないが、より有利な選択

再び研究の世界に少し戻って、著者がこの10年間で観測した面白い話を一つ紹介したい。著者のメインの仕事である機械学習モデリングでは、ディープ・ラーニングが全盛を迎えていることは多くの人が知る通りである。このディープ・ラーニング技術の三大巨頭として知られるGeoffrey Hinton, Yann LeCun, Yoshua Bengioの3人はいずれもカナダの大学教授であった。このうち、Yoshua Bengio教授やその弟子の論文を著者は、意図せずたまたまであるが10年前に集中的に読んでいたことがある。ただしその頃駆け出しのひよっこだった著者はBengio教授らの深淵な計画を理解することができず、Bengio教授のやっていること (how) を知ることは出来ても、なぜこの研究をやっているのか (why) が理解できなかった。そしてディープ・ラーニング研究を先回りすることなどは全くできなかったのである。

当時読んだ論文で今も覚えているのは [1][2][3] あたりである。当時の著者は高次元空間で多峰性を持つ確率分布の精密な密度推定に関心があって、k-近傍法による局所的な主成分分析を行う [1] から読み始めた。この論文の考え方は難しくなく、著者自身の研究ではこれを上回る方法をBayesian Nonparametricsで賢くやろうと考えていた。

  • そもそもより複雑な数理手法で既存の単純な方法に勝とうという、こういう発想が二流であってアウトなのだ。他人のフィールドでプレイ失敗する愚を著者自身も経験しているからこそ、こうして後進に伝えたいと思っている。このときに書いていたWorking Paperはその後別のトピックを見つけたせいで全てお蔵入りにした。このスイッチの意思決定だけは正解であった。

しかしその後Bengio教授たちは[2][3] でニューラルネットを使った手法にこだわっていた。著者には、当時は不安定な推定手法であったニューラルネットを使う合理性が感じられなかったし、なぜ彼らがニューラルネットの道を突き進むのかも理解できなかった。今となっては、Distributional Representationの考え方とか、彼らの構想のほぼ全てが本質を突いていたことがわかる。後知恵を更に書くなら、当時まだマイナーな研究をしていた彼らにコンタクトして、その後のいくつかのディープ・ラーニング論文のブレイクスルーに参画することも可能だったかもしれない。そして、それほど人気のない彼らの一団に加わるためには当時なら競争は必要なかった。とはいえ、howしか見えずwhyが理解できなかった当時の著者にはこの選択は不可能である。

ここで更に面白いのは、この3巨頭教授たちがいずれも、コンピューター・サイエンスとビジネスのメッカとされるアメリカではなくカナダで研究していたことである。カナダの大学院はいずれも良質だが、競争の激しいアメリカのトップ大学院に進学するよりは当時は倍率が低かったのではないだろうか。Bengio教授の研究室ホームページには、「私たちはhard workする。けれどここはカナダであってアメリカではない。死ぬまで働くようなことはしないよ」と書いてあった。熾烈な競争を勝ち抜いてエリートになったけど、それとは違う傍流にいった人たちの方が後で大きく勝つなら、いったいそんな熾烈な競争とやらをする意味は何なのか? なぜハーバード、スタンフォードの難しい入学試験を受ける必要がある?

独立独歩、そしてカナダ発のディープ・ラーニングの成功は、目立つ世界で脚光を浴びることばかりに目がいって競争に明け暮れ、道端に落ちている金塊に気づかないことのバカバカしさを教えてくれる。今でこそディープ・ラーニングが脚光を浴びている存在だが、当時はニューラルネットにこだわった人たちこそがプロパンガス会社であり、他の複雑な数式に拘泥した人々は掘がなく倒産してゆくインターネット企業だったのである。

見てくれの恐ろしさ

結論は月並みである。人々は脚光を浴びることとか、儲かってそうに「見える」こと・活躍してそうに「見える」ことに惹かれすぎ、そして過大なコスト(e.g., ブランド料)を払うのだ。小さな国・村社会で育つとそういう発想が強くなるかもしれない。そんなとき、テレビやウェブサイトを閉じて家族の顔を思い出してほしい。儲かるように見える方の事業ではなく、実際に儲かる事業に参画することで、貴方は支えてくれる人たちに恩返しできる。幸せがあるのはそちらの方だろう。

Reference

[1] P. Vincent and Y. Bengio, “Manifold Parzen Windows,” Advances in Neural Information Processing Systems 15, 849-856, 2003.

[2] Y. Bengio and M. Monperrus, “Non-Local Manifold Tangent Learning,”  Advances in Neural Information Processing Systems 17, 129-135, 2005.

[3] Y. Bengio, H. Larochelle, and P. Vincent, “Non-Local Manifold Parzen Windows,” Advances in Neural Information Processing Systems 18, 115-122, 2006.

合理化途中の過渡状態と不合理を受け入れた定常状態

母校の集中講義で機械学習とゲーム理論の数理的類似性に関して話してきた。大学からの依頼で行ったものであるが、その要請はかつての自分と同様に社会人博士課程に通う学生への助言である。在学中の研究とその後の展開や、研究成果をどう実ビジネスや仕事に生かしていくかを体験談として話して欲しいというものだった。博士取得後に深めた知見の方が在学中の成果よりも大きいと著者は考えているので、学生時代の話は触り程度にして、その後の研究トピックの広がり方・掘り下げ方について、転職後に加わった視点も交えて紹介した。以下はその説明資料である。OpenOffice.org ImpressとLaTeX beamerが混在しているのは全てをbeamerで準備する時間がなかったことによる、デザイン上の妥協である。

提供した視点の中で、その拡張に将来性があると2016年時点で著者が考えているのは以下に列挙した両者の対応である。特に、機械学習側の関数近似テクニックや緻密な確率的モデリングを行動ゲーム理論に持ち込むことで、人間同士が相互作用する社会環境 (人間系) における意思決定を、もっと数値的根拠が確かな状況で行えるものと期待している。

  • 正則化のない最尤推定はナッシュ均衡の計算に類似しており、
  • 事前分布を用いるベイズ推定やJames-Steinの縮小推定は限定合理性を扱う行動ゲーム理論における、Quantal Response Equilibrium (QRE)の計算に似ている
  • 明示的な正則化項を追加する代わりに最尤推定の最適化ステップを途中で中断するアプローチであるearly stoppingはCognitive Hierarchy Theoryと似ており、これも行動ゲーム理論で使われるテクニックである

Google DeepMindはAlphaGoでDeep Reinforcement Learning (深層強化学習)を用いたが、Deep Belief Learning (深層信念学習)という社会科学技術がイノベーションを起こす、というのが著者の大胆な予想である。しかしこれは当たるも八卦当たらぬも八卦の話なので、もう少しsolidな上記メッセージに戻ると、用いた資料で最も重要な一枚は次のスライドだろう。

ml-vs-gt

 

与えられた特定のゲームにおける実現シナリオの候補として、ナッシュ均衡はその定義は厳密ではあるが、実社会でのゲームにおいて実際に発生するシナリオからはしばしば乖離した予測を示す。最尤推定が学習データという狭いデータセットに対しては最大の予測能力を示しても、テストデータを持ってくるとそうはならない点と似てるとは感じないだろうか。

一方、ベイズ推定は事前分布という固定点を導入し、そちらにshrink(縮小)させることで、学習データに対する説明能力を少し妥協する。しかしこの小さな妥協はテストデータに対する予測能力を大きく向上させる。QREも同様で、他のプレイヤーの合理性に確信が持てない状況で、不確実性を撹乱項として明示的に確率モデル化することで、より実社会の集団的意思決定結果に近い予測結果を返してくれる。ベイズ推定もQREも、データやゲームに依存しない固有の確率モデルを入れることで汎化能力を上げる、という思想が共通している。

加えて、実用上は、固定点への縮小戦略ないしアルゴリズムは厳密なベイズ推定解でなくても良い。要は、事前分布の中心に相当する固定点があって、そこに少し近づける方法論であれば何でもよく、その一つがDeep Learningでよく使われるEarly Stoppingである。Early Stoppingは、複雑なゲームの均衡を数値的に計算する場合に使われる Belief Learning (信念学習) を途中で打ち止めにする方法と類似しており、Cognitive Hierarchy Theoryはこの打ち止め自体を確率モデル化したものである。

機械学習研究者コミュニティの中には、統計学だけでなく認知科学の研究も行っており、行動経済学的な現象の発生メカニズムを数理モデル化している人たちがいる。著者もその端くれであると自負している。昨年、著名な国際会議のNeural Information Processing Systems (NIPS)に出席した際には、パネルディスカッションにおいてBayesian Nonparametricsの大家の教授が同様の見方を他の認知科学研究者から聞いたと言っていた。この教授が誰であるか業界人にはバレバレであるが、著者の記憶が間違っている可能性もある。後で「私はそんなことは言ってない」というクレームが発生しても責任は持てないので名前は伏せることにしておく。

講義は機械学習と行動ゲーム理論の接続に限らず、与太話も含めていろいろ話してみた。科学的根拠の薄い仮説であることを断った上で、スライドの最後のセクションには私見をいろいろ載せている。一方で全ての意見が無根拠というわけでもない。例えば、リスクは避けろ、不確実性はテイクしろというメッセージは i) 偉大なバリュー投資家たちのコアとなる考え方で、ii) 多腕バンディット問題におけるexplorationのgainがどういうときに最大になるか考えた上で 持っている意見である。すぐれた起業家や研究者がリスクテイカーだというのはおそらく嘘だ。彼らは不確実性をテイクしているのであって、避けられるリスクは極力全て避けている。製鉄ビジネスを始めるときにいきなり自力で始めるのではなく破綻した製鉄所を安く買い取って始める、とかね。

これから博士課程に通おうと思っている人や、社会人博士における研究テーマの選定で迷いがある人は参考にしていただければ幸いであるし、個人的な質問があれば twitter account @rikija に連絡くだされば話せる範囲でお答えします。

集合知の質: 1ドル1票か1人1票かあるいは? (2)

衆愚制や民主主義の危機が叫ばれる中で、単純な均等投票以外の集合知が民主主義陣営の強力なサポーターになってくれるかもしれない。集合知の質: 1ドル1票か1人1票かあるいは? (1) で、集合的意思決定手法の一つである予測市場について紹介し、その光と闇について論じた。予測市場の株価は予測対象に対する知見が高い人の予測に高いウェイトを振った加重平均値であり、これを予測値とした意思決定は低いバイアスを享受できる。実際にお金をかけさせることで真剣な予測値を作り出すことができる点、加えて人工知能・統計学アプローチと違って既存のビッグデータがなくても意思決定できる点は、プラットフォームとしてのアドバンテージとなる。しかし最近はUKのEU離脱をバイナリー値としては予測し損ねたという失敗例もある。最終株価が単純なアンケート or 選挙に比べて未来を正確に予想しているかどうかには、依然として議論があるだろう点を前回議論した。


普通の人たちを予言者に変える 「予測市場」という新戦略

今日は予測市場の最終株価以外の産物を役に立てられないか考えてみる。最終株価よりもすぐれた予測値を、統計学もしくは金融工学を駆使することで得られないだろうか。具体的には、予測市場が産み出した株価の時系列データと出来高等の個々の取引記録を利用することを想定する。議論のスコープからは今回は外すけども、予測市場株価を原資産に見立てたデリバティブ: 先物, オプションを作ったら更に予測精度が上がるかもしれない。

予測市場及びその派生市場で得られた多くの証券データは、それらを統計的アルゴリズムに入力することで最終株価よりも優れた予測値を生み出す可能性がある。また予測精度自体は同じであったとしても、過渡的なデータが予測対象に関するインサイトを提供する場合があり、その情報自体が市場参加者、つまり一般市民の政治的意思決定能力を向上する可能性もあるのだ。

過渡的な情報に価値があるという見解は、著者が効率市場仮説 (Efficient Market Hypothesis; EMH)を支持していないことに由来する。EMHが完全に成り立つなら最終株価以外の指標は役に立たない。EMHは市場が常に定常状態(=均衡)にいる、もしくは一瞬で定常状態に遷移すると仮定することでほとんどのトレーダーがリターンを取れない、と主張する。EMHの反証は統計的裁定機会の存在を示すことによって行われることが多いが、少なくとも短期トレードではこの裁定機会を見つける困難さゆえにEMHが想像以上に妥当に思えてしまうトレーダーも多い。ファンダメンタルズに基づいた中長期投資ではそれほど反証は難しくないのだが。

短期トレードが難しいとしてもEMHが完全には成り立っていないと言える根拠は、そのおかしな仮定にある。過渡状態と定常状態(=均衡)は明確に区別して議論しなければいけない。またこれらを明示的に区別することで、EMHが成り立たないなら株価はどうやって動くのかある程度モデルを立てることができる。モデルの設計と検証を立てるのはアカデミックな成果を争う研究領域となるのでブログでは避けることとしつつ、今回は過渡状態の方が定常状態よりも重要であるケースの一つを紹介したい。この背景を経て、予測市場の時系列データを残していくことが民主主義社会における大きな遺産になり得る可能性に気づいてもらえれば幸いである。

今回、過渡状態と定常状態の違いについて導入した上で、次回はどのような予測市場の過渡状態を残したいか、著者なりの政治的見解を書いてみようかと思う。今の所の素案にあるのは、「ある政治家が政策Xを実現するか否か」に賭ける予測市場であるが、もっと良いアイデアがあるだろうと思う。

定常状態(=均衡)はしばしば非現実的に見える

突然ではあるが p-美人投票 (p-beauty contest) というゲームを紹介したい。ここではp=2/3のケースを取り上げる。以下のルールのゲームで、各プレイヤーはどのような選択をするだろうか?

  • n (\geq 3)人いるプレイヤーが0以上100以上の整数を一つ、同時に選択する
  • 全プレイヤーの数値の平均値の2/3倍に最も近かったプレイヤーが優勝する

特に難しい点のない単純なルールであるが、図で例時すると図1のとおりである。この例では#1, #2, #3の3人のプレイヤーがそれぞれ35, 15, 22 と宣言し、平均の2/3倍である16に最も近かった#2が優勝した。あなたがプレイヤーの一人だとして、どの数字を選ぶか想像してほしい。平均値は他のプレイヤーの数字によって変わるわけだから、あなたはライバルを出し抜かなければいけない。

pBeautyContest

図1. (2/3)-beauty contestにおける意思決定と結果例

十分に頭の中で想像してもらえただろうか。そうであれば次に進もう。このゲームにはナッシュ均衡が一つだけある。それは全員が0を選択するというものである。そのロジックは次の通りである。

  • ゲームのルールを全くわかっていないナイーブなプレイヤー (これを0-step playerと呼ぼう)を想定すると彼らは0から100をランダムに選ぶのでその期待値は50である
  • 0-step playerを倒すことを想定している1-step playerは50 \times 2/3 = 33.33\ldots のため 33を選ぶだろう。1-step playerは0-step playerよりちょっとだけ先読みしている
  • 1-step playerを更に倒すことを想定している2-step playerは33 \times 2/3 = 22より22を選ぶだろう

こうしてk-step playerを倒す (k+1)-step playerのことを考えていき、全てのプレイヤーがお互いが完全合理的であると予想して無限遠まで読み切ると全員が0を選択することになる。簡単のためにk-step目までの期待値による説明を書いたが、期待値でなく他の代表値を使ったり、0-step, 1-step, …, k-step playersがそれぞれいる状況で(k+1)-step playerの振る舞いを考えても結論は同じである。2/3をどんどんかけていく等比級数の極限である0が均衡となる。先読みばかりしているエリートの選択というのはお互いに似てくるわけだ。またそのような共通の思考回路を暗黙に持つことで無難な幕引きを図るのがエリートの特徴とも言えるし、それこそが彼らがつまらない人物に見える主因かもしれない。

「今」は定常状態 or 過渡状態?

さて、ナッシュ均衡が0だということはわかった。しかしながら、あなたは本当に全員が0を選択すると思うだろうか? あなた個人が0を選択する可能性は十分著者も予見しているが、あなた以外の全員が0を選ぶとあなたが考えているとは、著者は思わない。実際のところ、この「全員が0」という均衡からは、ちょっとした撹乱によって容易に乖離しうる。例えば、

  1. もし他のプレイヤーがゲームの本質に気付いておらず、0よりずっと大きい数字を選択したら?
  2. もしプレイヤーの一人が、自分が負けてもいいのでエリート連中にダメージを与えてやろうと考えたら?

1.はプレーヤーの知性に限界を設けたケースで、2.はプレーヤーは賢いがわざと愚かに振る舞うケースである。理知的な大国間の交渉に比べて、テロリストやヒステリックな人物との交渉はより難しい。現実世界でのそのような読みの難しさをp-beauty contestは簡潔に表現している。

ナッシュ均衡の非現実性は、i) すべての人が一様に無限遠を見通している非現実的仮定や、ii) 確率的な撹乱を無視した決定論的思考 に由来する。実際のところ、[1][2]に掲載された実際の選択は表1の通りである。ゲーム理論家であっても彼らはこのような撹乱を想定しているのであって、0は選択していない。

  • ここでは[2]に掲載された簡略化された表を抜粋している。より広範な調査は[1]に掲載されている。

表1. (2/3)-beauty contestで実際の人間が選んだ平均値

グループ名 n: プレーヤー数
(グループから抽出)
グループの合計人数 選択された平均値
Caltech Board 73 73 49.4
80 year olds 33 33 37.0
High School Students 20-32 52 32.5
Economics PhDs 16 16 27.4
Portfolio Managers 26 26 24.3
Caltech Students 3 24 21.5
Game Theorists 27-54 136 19.1

表1で各グループの性質と選択結果を眺めてみるのはなかなか面白い。カリフォルニア工科大学のボードのお偉いさんたちはほとんどナイーブなプレーヤーのように振舞っていて、学生さんよりもずいぶん値が高い。お年を召されて真面目に考えなくなってしまったのだろうか? などと不謹慎な想像だって出来る – 実際のところ80歳の人たちの平均値も結構高い。さらに学びたい方のために補足: p-beauty contestはリチャード・セイラーの最新刊でも紹介されている。セイラー教授のキャリアの築き方も含めて (学生からの人気を維持するために137点満点のテストを作った話とか) 面白い一冊なので興味のある方はどうぞ。


行動経済学の逆襲 (早川書房)

表1で示されたように、ゲームの中に完全合理的でないプレイヤーが混じっている場合、たとえあなたがとても合理的であったとしても考え直す必要がある。そのような状況における予測値を定量的に与えてくれる方法論は認知階層理論 (Cognitive Hierarchy Theory; CHT) [1] と呼ばれている。各プレイヤーは自分は (k+1)-stepまで読めるが他人は最大でもk-stepまでしか読めないと考えている自信過剰家であり、0-step, 1-step, …, k-step playerの人口比を予想して選択を行っているというモデルを導入するのである。そして kの値と人口比分布を実データから推定することで高い予測値を得ようとするところが、完全合理性一本やりのナッシュ均衡と違っているわけだ。

参考: 機械学習アルゴリズムと行動ゲーム理論との関係

(この項目は参考文献を探している研究者向けである)

さらに撹乱を加えてより予測を精確にする場合、ナッシュ均衡を確率モデル的に一般化した質的応答均衡 (Quantal Response Equilibrium; QRE)を数値計算することになる。CHTが過渡状態で計算を止めるearly stoppingを行うのに対して、QREは確率を入れた上で無限遠まで計算する。しかしどちらもナッシュ均衡よりも初期状態 or 一様分布のような固定点に近づける 正則化として働く点は共通している。その具体論に立ち入るのは予測市場について議論する本題から外れるので割愛する。

参考書としては以下が優れているほか、そのうち機械学習との接点について別エントリーで紹介しようと思うので興味ある人は楽しみにしててほしい。ナッシュ均衡の計算は最尤推定と類似しており、QREの計算は明示的に事前分布を入れたMAP推定に近い。CHTはearly stoppingすることによって結果的に初期状態に近い予測値を出すため、近年のdeep learningで使われているearly stopping によるregularization (初期値に近づける)と類似している。


行動ゲーム理論入門

過渡株価を見ながら定常株価を予測する

p-beauty contestの(狭い)理論と現実との関係から一般化したいstatementは単純である。無限遠まで計算した定常状態よりも、過渡状態の方が現実に近い場合が存在する。あるいは撹乱を入れながら計算した「アニーリングされた定常状態」を計算するべきなのである。そのようなインプリケーションを予測市場に対して適用した場合、我々のやるべきことは明確だ。過渡状態とは個々の意思決定者が残した途中の記録であるから、注文情報や株価時系列データにその情報が含まれており、それを積極的に利用するということである。

p-beauty contestにおいてはk-step playerに(k+1)-step playerが勝とうとするプロセスは心の中で走る時間経過であった。一方、予測市場では 時刻 tまでの株価を見て 時刻(t+1)における投資家の振る舞いが決まってくる。この時刻は物理世界における実時間である。しかし各時刻 t のそれぞれにおいては、各投資家は他の投資家を出し抜こうとする心的プロセスを走らせる。つまるところ心的時間と物理的時間の両方における動力学が働くことになる。他の投資家が完全に合理的で彼らより高いリターンがあげられないのなら、どうして市場に参入するだろうか? 市場に参加するものはすべからく何処かで自信過剰なのであり、その自信過剰性と市場の相互作用が結果的に高精度な政治的意思決定を可能にするのである。

投資家の間の激しい競争を踏まえると、基本的には過去の株価の方が現在株価より正しいというケースは少ないであろう。しかしp-beauty contestの実データに見られる限定合理性からは、過去の株価から背後のマスター方程式を推定して現在株価よりも妥当な推定値を予測するというアプローチが不可能でないことも示唆される。より優れた計量アプローチでは、現在の株価 (price)をvalueの最良推定値とは考えないファンダメンタル投資家に発想が近くなるだろう。長期のファンダメンタル投資家は、定常状態から離れたおかしな過渡状態にいると判断した株式を購入する。そしてその過渡状態から数年のうちに定常状態に収束すると考える。定常状態を理解した上で過渡状態をモニターすることが大事だと見なしているわけだ。

民主主義の強化という我々の目的の場合、一つの政治的意思決定のために数年も待つことはできない。定常状態に収束するまで待っていられないケースが度々ある。UKのEU離脱予測失敗のケースでは、予測市場が本来持っている「賢い投資家に力を与え愚かな投資家を退場させる」時間が投票前に確保できなかった。ならば、過渡状態から計算機上でマルコフ連鎖を回して定常状態を先読みするとか、一部の投資家の認知バイアスをアラートで察知して異常値を排除する、といったデータ加工をしても良いはずだ。そのようにして修正された予測市場株価時系列の方が市場そのままの値よりも本質を突いているかもしれない。加えて、そのようなデータ加工プロセスをも公開することで、市民の意思決定能力が高まる可能性もある。

最後に一つだけ実例を紹介させていただきたい。2013年のACM SIGKDD (データマイニング領域におけるトップ国際会議) で発表された [3] では、フォード社が意思決定インフラとして予測市場を導入したことで得られたメリットについて言及している。この場合、例えば青い車を増やすべきか赤い車を増やすべきかという意思決定において、世界中の社員のボトムアップな知恵を集約するためのインフラとして、投資家である社員が賭ける予測市場が導入された。賭けに勝とうと思うと、各社員が一丸となって今の消費者の好みを調査したりお得意さんにヒアリングしたりする。

株価自体もそれなりに役立ったようであるが印象的な言及として、ニュースイベントと株価時系列との対応関係を取ることで、どういうニュースに社員が過剰反応したりするのか、どこで市場の変化があったのかがモニタリングできるようになった点があった。株価時系列一つ残すメリットは、その株価自身だけではない。他のデータと組み合わせて回帰分析を行うなど、もっと高度な知見収集インフラとして役立つわけである。ビジネスで勝利すべく血眼になって予想を行う投資家の知恵を公的・政治的領域にも役立てられるようになったら我々は民主主義国に暮らしていたことを今よりもずっと感謝するようになるだろう。

References

[1] C. F. Camerer, T.-H. Ho and J.-K. Chong, “A Cognitive Hierarchy Model of Games,” The Quarterly Journal of Economics, 119(3):861-898,  2004.

[2] T. H. Ho, N. Lim, and C. F. Camerer, “Modeling the psychology of consumer and firm behavior with behavioral economics,” Journal of Marketing Research, 43(3):307–331, 2006.

[3] T. A. Montgomery, P. M. Stieg, M. J. Cavaretta, and P. E. Moraal,
“Experience from Hosting a Corporate Prediction Market: Benefits Beyond the Forecasts,” Proceedings of the 19th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD 13), 1384-1392, 2013.

集合知の質: 1ドル1票か1人1票かあるいは? (1)

集合知、あるいは反対の集合愚に関する議論がますます盛んになってきていると感じる。民主主義の危機も部分的には叫ばれている。かといって、一人の独裁者が全てを決める社会に持続性がないことは多くの人がすでに知っている。独裁ではない意思決定方法には多くあり、その一部は市場を使って決める。詳しく知りたければ社会的選択理論 (Social Choice)に関する本を参照してほしいが、今回は市場を使ったものに焦点を絞る。市場を使ったアプローチは利点も大きいが完璧ではなく、その利用方法はさらに研究余地がある。市場が産み出したものの何を利用するかが大事なのだ。意思決定に用いる市場は予測市場 (Prediction Market)と呼ばれる。通常は最終株価あるいは現在株価が大事な予測値として使われるのだが、電子化された予測市場のあらゆる取引記録、つまり市場の過渡状態の記録に民主主義を強くする価値があるのではというのが現時点の著者の考えだ。

今日は予測市場の紹介と、その光と闇を取り上げたい。闇として、予測市場がUKのEU離脱予測に失敗したことを取り上げる。光に期待する声として、いわゆるシルバーデモクラシーを嘆く政府内の友人の参考意見を紹介する。その上で次回以降、市場の闇をグレーに変えていく方法論について議論したいと思う。予告だけしておくと次回のキーワードは行動ゲーム理論である。賢くない人たち同士の競争まで考えたより現実的なゲーム理論であり、賢い人が賢くない人の行動を読み間違えて損するケースも取り扱っている。ある意味でUKで起きたことを分析するのに向いたツールである。

投票と統計学

選挙のように、複数人の人の選択の平均を取ることで意思決定を行うケースがこの世にはたくさんある。各投票者の選択は、社会全体にとって「後付けで望ましいことがわかった」正解に対してノイズを乗せたものだと解釈することができる。大雑把には投票とは算術平均を計算する行為であり、たくさんのサンプル数 n を持ってくることで、ノイズ項を0に近づける。一人一人の予想は誤っていても集団の知恵は正解に近いことを期待するわけだ。

大衆は愚かで意思決定を任せてはいけないとあなたが思ったとしても、確率論的に考えれば独裁が望ましくないのは自明である。サンプル数 n(=1) の少なさゆえ推定誤差が高すぎる。この誤差を保ったまま意思決定を続けるとどこかの時刻でほぼ確実に破綻する。たとえ独裁者がアレクサンダー大王のように賢く彼の予想が平均的には真の正解に近かったとしても、n=1での大きすぎるバリアンスはそれをことごとくspoilしてしまう。

  • (独裁者にも実際には家臣がいるからn=1ではない。象徴的意味合いとしてn=1と書いている)
  • 高い誤差のおかげで破綻、というのはボラティリティの高い株をさらに借金して買うことと似ている。その会社が優良企業で長期的に成長するのだとしても、ある特定時点での逆風で債務超過になったらあなたに次のチャンスはない。
  • 一般にGreat manはGreat mistakesを犯すものだ。カール・ポパーが「開かれた社会とその敵」で議論したとおりである。


The Open Society and Its Enemies (Routledge Classics)

反対に、直接民主制は nを最大化することで意思決定の質におけるバリアンスを減らすアプローチである。推定誤差を減らそうというわけだが、この方法に反対する人は大衆が愚かだという観念を持っていることが多い。彼らは独裁制までは支持しないが寡頭制に近いアプローチを好む。nは1よりはある程度大きいが最大ではなく、知識階級が大きなウェイトを持った加重平均を考えようというわけだ。知識階級の方が良い予測値を持っているという仮定が十分に正しければ合理性はある。統計学的に見れば、バリアンスをある程度犠牲にするがバイアスを減らすアプローチであり、両者の合計が最小化できればアプローチは何でも良いということだってできる。

さて、日本国内の報道における知識階級の人々の意見だと、相対的に後者の考え方、つまりバリアンスを犠牲にしてバイアスを下げる考え方が強くなってきているように著者は受け取っている。例えば、UKにおけるEU離脱投票結果において、知識のない一般市民に離脱意思決定をさせてはならなかったとの言説がある。軍事や外交に関わる問題は知識階級と一般市民との知識差が大きすぎるため、知識階級内での投票にとどめた方が良いというわけだ。

著者としては、原則としてのこの知識階級ウェイティング論に異論はないのだが、今回のUK離脱から得られた示唆はむしろ均等ウェイティングの良さを再確認させるものだった。無論、外交問題を国民投票しろと言っているわけではない。知識階級が今回の結果を予測できなかったことと予測市場の失敗という事件が、知識人の予測能力をディスカウントすべき証拠の一つとして提示されたのだ。

予測市場 = 賢い or 金持ちほど票数が増える投票

単純平均を信じない人々にも何種類かいる。右派の富豪の一部は、金を持っている人の方がそうでない人より賢いのだから票がカネで買えるべきだと思っている。左派の知識人の一部は専門知識の深さによって票が増えるべきだと思っている。残る我々庶民は率直な感覚を覚えておくべきだ。どちらも傲慢であると。しかし、少なくとも右派の理想をすでに実現している投票システムがこの世には存在する。それが予測市場である。そして予測市場は左派の発想も内包している。だから予測市場について利点と欠陥を知ることは、あなたが傲慢な右派 or 左派と対峙する時の有効な知恵になるだろう。


普通の人たちを予言者に変える 「予測市場」という新戦略

予測市場とは、UK国民投票で言えば最終投票結果がStay or Leaveのどちらかになるかを予想して、予想した方向に株式をlong or shortする株式市場である。”Stay” stockに対して自分の好きな金額を賭けることができる。予想した方向が当たればあらかじめ決められた金額が受け取れ、外れると掛け金は紙くずになる。リターンは株式取得時の価格と最終的なpaybackとの比で計算される。例えば Stayが勝つと$1帰ってくる予測市場の現在株価が $0.4 だったら、集団として人類は40%の確率でStayが勝つと予測しているということだ。一つの大きな特徴は、競馬のように一回だけギャンブルして終わりではなく、その時々の情勢に応じて掛け金を追加したり損きりできる点である。この結果、最新の情報が株価に織り込まれるとされる。

途中から参入したり脱退できるという性質は強力な予測能力の根拠となる。例えばStayの株価が$0.4だが、投資家であるあなたの極めて精密な推定が60%の確率でStayだったとしよう。しかしどう見積もっても70%はないこともあなたは知っていたとする。あなたはStay株式を買って大きなリスクをとるべきだろうか? 答えは部分的にはそうだが、最後まで株式を持っていてはいけない。あなたのやることは次の通り。

  • $0.4の価格で株式を買う
  • 数日後、あなたの予想に世間が追いついて株価が$0.6に上がる
  • この時点で株式を売り抜けて利益を得る。これ以上持っていても、あなたの予測が正しい限り期待リターンはゼロだから。

要は本当の投票日まで待たなくても、各人が自分の予想にあったポジションを取ることができるわけだ。このポジショニング上の柔軟性があるため、そして金を儲けるためなら人は必死に先読みや調査をするので、予測市場の株価は無責任なアンケート回答よりも真実を反映しやすい傾向がある。自分の予測に絶大な自信がある人は、多額の金額を賭けるだろう。それが本当に正しいならその人は大金を儲け、次回はもっと大きな金額を賭けられる。一方、大言壮語したが外した愚か者は大金を失って市場から退出していく。つまり、賢い人ほど金が増えて投票ウェイトも上がってくる合理的な仕組みだというわけだ。ここで一つポイント: このウェイト上昇が合理的だと完全には納得しなかったあなたはセンスがある。次回の記事を待ってほしい

予測市場には、明確な既存データがないドメインでも予測を提供できるメリットもある。コンピューターを使った人工知能・統計的予測ではまずデータベースの整備が必要で、例えば途上国での投資はそれだけで大変だったりするのだが、予測市場は賭け事をする場所さえ作ってしまえば人々の脳の中の知識が勝手に株価という予測値に変換される。複雑なクエリーいらずのすぐれたデータベース作成システムでもあるのだ。

大きく外した予測市場と富裕投資家

このように原理上の多くの魅力を持った予測市場だが、実は今回のUK国民投票ではStay (Remain)に賭ける株価となっていた。しかし結果はLeaveとなり、市場の予測は失敗した、とされる。例えばThe Economistは次のような記事を掲載したほか、Financial Timesには賭けの内訳に関する記述もあった。

こういったの記事に対しては実際に予測市場を運営している側からは反論もあるようだ。この論争には行動経済学上の解釈も含まれているようなので、これから読み込もうと思う。著者はまだ要点を把握していないが、次回記事の執筆前には理解しておきたい。

Financial Timesの記事を読むと分かるが、今回の予測市場では、金額が小さい小口投資家の多くがleaveに賭けており、少数の富裕層が大金をstayに賭けていたようである。その合計をとった結果、市場全体の予想はstayであった。

さて、この少数の大金を賭けた「富裕層 or 知識人」は派手にお金を失ったわけである。この結果を見た人はある種のコモンセンスに従ってこう考えるはずだ。金額でウェイティングせずに予測した人の人数だけ見たらleaveと正しく予想してたんじゃないの? と。

彼らはお金を失った。だから次回以降も賭けを続けるならこの外した「賢くない」人たちの影響力は下がるだろう。しかしUKのEU離脱に関する予想は今回一回きりである。未来に約束されていたはずの市場の効率性はもたらされない。そして、少なくとも今回の投票においては「賢くない」人はアンダーウェイトされなかった。時刻 t での失敗/成功は 時刻 (t+1)以降にしか反映されないという性質が、しばしば致命的になるのだ。均衡(定常状態)ではなく、過渡状態を考えなければいけないのである – だからこそ次回行動ゲーム理論が鍵になるのだが。

責任を持たせる予測市場

しかし予測市場に依然として期待する人もいる。公務員の友人の中に期待している人がいると言ったらどう感じるだろうか。放漫財政にYESを言う高齢者に疲れ果てた人にとって、市場ベースの投票は福音にも聞こえるのである。

まず最初に断っておくと、著者にはシルバーデモクラシーが高齢化社会である日本の真の問題なのかどうかは不明である。シルバーデモクラシーではなく若者の投票率が低いことが問題だという考えもできる。つまり、全員が真面目に投票したら自然と集合知が発揮されて良い政治的選択をするのかもしれない、と。しかし投票をしない人たちがすでに投票をしている人と劇的に違っていてしかも既存の投票者よりも賢い選好を示すとは思い難い。投票しなかった人の選好という欠損値を補間しても、既存の投票率と似た分布しか示さないように思える。そしてその似た分布が結果的にもたらす政治的選択は現在のものと同一である。このあたりの欠損値推定がどうなるかは興味深いが、そのような社会実験を行うためには無記名投票ではなくて記名投票して回帰分析する必要がある。このような一様でない補間は投票の自由・安全を脅かす危険を持っているわけだ。

以降、仮にシルバーデモクラシーが日本の問題だとする。つまり老人は将来の日本の財政・次の世代の負担に対して無責任であり、自分だけが最後まで国富を浪費して若者の未来を奪っていくという考え方である。このようなモラルハザードが発生するのは、愚かな政治的選択による損失が現在時刻でなく将来時刻に発生することに原因がある。そして大衆迎合的政治家と高齢者が結託すると、この将来時刻の損失を効用関数に加えずに意思決定が行われてしまう。

この時、もし老人に愚かな意思決定をした場合には今すぐ損失を負わせることができるなら、彼らも将来の世代にとってよりマシなまともな選択をしてくれるという見方がある。公務員の友人は、老人に選挙投票させる代わりに予測市場で戦わせたいらしい。結局のところは日本の将来の世代に貢献するような政策に対する株主になってほしい、というわけだ。あなたが日本の将来にとって良いことを結果的に選んでいたらあなたはお金持ちになってますます生活がエンジョイできるし、その逆だったら代金を払ってもらうというわけである。特定の政策の採択に株価がつくと、その政策のトータルのペイオフを皆頑張って計算し、その結果として財政問題に対する市民のリテラシーが上がるという方法論なのである。

 

このような予測市場は、前述したUKの国民投票予測とは少し性質が異なると思われる。どの政治家が当選するか予測することにたいした意味はない。しかし個々の政策がもたらす将来のキャッシュフローを考えた時、それが将来の日本にとって望ましくないことがすぐに予見できるものであれば、その政策の株価は暴落するだろう。最終株価をもとに政策を決める場合には、そのような政策は実際に選ばれずに済む。

このあたりは著者も実現イメージがあやふやな段階で書いてることを承知いただきたい。友人も著者も民主主義の価値は依然として信じていて、ただ異時点間意思決定がもたらすモラルハザードをより効率的に緩和する方法を追求しているのである。市場はその魅力をある程度持っているが、わずかな時刻のずれが致命的になり得ることは闇の部分で触れたとおりである。この闇をどれだけ緩和できるかが、確率、統計、投資といったテーマで学びを続けるもののチャレンジだと思うわけである。