Economic Moatの機械学習モデル

バリュー投資を行う上で、誰にとっても客観的で有効なのは財務諸表から計算されうる定量的な説明変数をもとにバリュエーションを行うことである。一方で、コカ・コーラが持つ莫大なブランド価値のように、キャッシュフローに直接影響を与えている、定性的だが強力な側面を見落としてしまうことは望ましくない。このような定性的側面の見落としは、特に環境変化が大きい時期には致命的である。新興企業の一部が既存プレイヤーの利益を侵食した場合には、今までのキャッシュフローを単に外装して予測したものが正しくなくなるためである。

競合他社がそう簡単に破ることのできない、既存企業が作り上げた参入障壁はよくEconomic Moat (堀)と呼ばれる。Moatをバリュエーションにどう反映するかはプロの世界ではアナリストやファンド・マネジャーの重要な仕事であろうし、アマチュアとプロの差が出やすい領域と考えられる。

著者はアマチュアの側なので、アマチュア投資家あるいは金融業界のアウトサイダーにとってメリットが有りうるアプローチを取り上げる。紹介するのはMorningstar社が行っている、機械学習ベースの半定量的 Moat予測モデルである。以下の3ステップからなるアプローチを半と表現した。

  1. 人間のアナリストがカバーしている一部の有名企業に対して、彼らが自分の知見をもとにMoatスコアを手で与える
  2. 財務諸表から生成される説明変数Xと従属変数であるMoatスコアYとの対応関係、つまり Y = f(X) + ε の 関数 f を、大企業データに対して機械学習を用いて学習する
  3. 1.でカバーされなかった中小企業の財務諸表から得られる説明変数X に、2.で得られた関数 fを適用することで、人間がカバーできない多くの全ての企業のMoatを定量化する

時間のある人にはこちらのレポートを直接読んでもらうこととして、簡単な補足を加えてみる。

関数 f には、機械学習分野ではよく知られている Random Forest という手法を用いている。Random Forestを用いているのは多変量非線形の関数を取り扱うことができる汎用性の高さと、個々のtreeが出す予測値の違いを利用してuncertainty (使われた学習データだけからは判断のつかない不確実性)を容易に定量化できるためである。機械学習アルゴリズムは他にもいっぱいあって Gradient Boosted Decision TreesとかDeep Neural Network などを使って更に精度を上げることも可能であろうが、アルゴリズムよりも以下の視点の方が投資家にとってずっと大事である。

  • 説明変数 X  にどのような指標を入れるべきか
  • モデルのバイアス / バリアンス(不確実性)がどれほど存在するか
  • 予測されたMoatスコアをどのように利用するか

 

著者が種々のバリュエーションのテキストを読んだ時に、よく以下の点が気になる。

  • Value Driverとなる説明変数の数が増えるたびに、不確実性が増す

この不確実性増加問題は、Valuationの大家であるNYUのAswath Damodaranも例えばCAPMにおけるbetaの推定を題材として取り上げている。

不確実性が高いというのは、機械学習界隈ではバリアンスが高いとか過剰適合の問題として知られている。より表現能力の高い(バイアスの低い)モデルを作ろうとして学習データにのみ当てはまり将来のテストデータでは的外れな関数を適合してしまう、というよく聞く話である。

バリュエーションでも一般的な機械学習問題でも根っこは共通だが、一つ着目すべき違いもある。バリュエーションの場合、fは最終的な株価を予測する式ではなくて、来年度の売上など理論株価を計算するための中間変数を予測する式になることが多い。つまり説明変数が確定値ではなく確率的であり、不確実性がさらに余計に乗るわけだ。しかしこの問題を無視して各種ドライバーを確定的に計算してしまうアナリストは多く存在する。不確実性は説明変数の数が増えるとどんどん増していくわけだが、その定量化をもしRandom Forestのような枯れたアルゴリズムを使ってそれなりの精度で計算できるなら、投資判断の精度が少しは上がるだろう。

この仕事であるが、単に投資に役立つというだけでなく、機械学習の産業応用として良い例だと思っている。昨今の人工知能ブームの影響か、機械学習のおかげで既存事業のドメイン・エキスパートが必要なくなるという意見を見かける。しかし、このMorningstar社のケースでは、アナリストとシステム両方があることでむしろMorningstarの強みが強化されている。正解データとなる大企業のMoatスコアは、アナリストが入力しなければ不在のままでアルゴリズムは何もできないのだ。この機械学習Moat予測システムの生態系は、客観的な予測のできる優れたアナリスト、daily levelの財務データを低いコストで入手できる業界内の立場、そして財務プロと協業する意思のある統計学者の3者がシナジーを発揮することでできている。

正解データというと、システムトレードに親しんだ人は単純に株価の(例えば1年間の)リターンを従属変数にしようと考えるだろう。しかし著者の個人的意見ではリターンよりもMoatを予測する方が良い。市場が適切な株価を与えていて旨味のある投資機会が存在しないか、それとも過小評価された株式が存在するかはその時々によって違い、非定常である。この非定常性は、独立なランダムネス由来のノイズとは違っているので、単に従属変数に追加でノイズ項が加わっていると仮定するのはナイーブである。従って、リターンを直接予測してポジションを取るよりも、適切株価を誤差つきで計算して、その下限よりも現在株価が安い時だけ買うという保守的アプローチの方が成功可能性が高いだろう。

 

広告

投稿者: rikija

機械学習・認知科学・投資アルゴリズムの研究者。作曲家 (アマチュアですが鋭意努力中) Twitter: @rikija / https://twitter.com/rikija 論文実績等は https://sites.google.com/site/rikiyatakahashi/ を参照

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト /  変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト /  変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト /  変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト /  変更 )

%s と連携中