スキップしてメイン コンテンツに移動

複数の時系列データの因果関係が分かる(?)

今日和。
さて、独学ブログとして本来の路線へ。

本日は、沖本 竜義 著『経済・ファイナンスデータの計量時系列分析』から。
何故ならば、個人的に「時系列データ」の分析に多くの興味を持っているからです。
そこで本業が手薄な期間をつかって勉強しています。
その最中で、おもしろいモデル化手法を知りました。


“VAR モデル” のことです。


この界隈では有名な TJO 氏が解説しているので、その投稿記事へのリンクを貼ります。
本投稿は、多くを以下の 2 リンクを中心とした TJO 氏記事に参考にしてます。
https://tjo.hatenablog.com/entry/2013/07/25/194546 
https://tjo.hatenablog.com/entry/2013/07/30/191853


沖本本、第 4 章冒頭から多少強調のために改変しつつ引用します。

“ベクトル自己回帰(VAR)モデルは、自己回帰モデルを多変量に拡張したものである。VAR モデルを用いる目的は主に 2 つで

  • 1 つは複数の変数を用いて予測精度の向上を図ることであり、
  • もう 1 つは変数間の動学的関係の分析を行うことである。
特に、変数間の動学的関係の分析に関して、VAR モデルは
  • グレンジャー因果性  
  • インパルス応答関数
  • 分散分解
という強力なツールを提供でき、推定も容易であるので、80 年代以降、マクロ経済学やファイナンスの分野で頻繁に利用されるようになった。本章では、多変量のデータの動学的関係を分析する上で非常に重要なモデルである VAR モデルについて述べる。

このなかで、わたしが注目したのは『インパルス応答関数』です。
https://ja.wikipedia.org/wiki/インパルス応答

“インパルス応答(英語: impulse response)とは、インパルスと呼ばれる非常に短い信号を入力したときのシステムの出力である。インパルス反応とも。インパルスとは、時間的幅が無限小で高さが無限大のパルスである。実際のシステムではこのような信号は生成できないが、理想化としては有益な概念である。”

何故、これが有益かというと、以下の具体例から御理解いただけるかと。 

“スピーカー:
1980年代にスピーカーのインパルス応答評価法が開発され、スピーカーの設計が大いに進歩した。スピーカーでは位相歪みが問題となる。これは、周波数特性のような測定可能な一般的特性とは異なる問題である。位相歪みは、共振、コーンにおけるエネルギー蓄積、スピーカー躯体の振動などによって発生する微妙な音の遅延が原因で発生する。位相歪みは音をにじませ(スミアー)、透明感がなくなる原因となる。インパルス応答を測定すると、その時間スミアーが分かるので、コーンや躯体の材質や形状の改良などに使うことで歪みを低減させることが可能となった。当初、短いパルスを使っていたが、システムの線形性を維持するには振幅を大きくできず、結果として出力も小さくなるため、ノイズとの識別が困難だった。その後、M系列のような入力を使うようになり、コンピュータを使ってそこからインパルス応答を求めるようになった。最近では、周波数ごとの遅延応答を図示できるようになっている。その応用としてホールなどの残響を測定し、音響設計をする手段としても用いられる。

実際にインパルスに相当する音と、その応答である残響を聴いてみてください。



この場合、“The Lady Chapel, St Albans Cathedral” のチャペル内の音響構造が、この『残響』に反映されている訳です。


この残響を別の時系列データに適用してみたら、というのが今回のお話になります。
沖本本の例 4.5 になります。
本論は沖本本第 4 章をしっかり読んでいただくとして、TJO 氏による R をつかった具体例の結果、そのグラフ群を貼ります。G7 各国分掲載しますが、特に日本とアメリカのそれに注目して御覧ください。


カナダ:


 フランス:


ドイツ: 

イタリア:

日本:

イギリス:

アメリカ:


上記 7 枚のグラフ群は以下のコマンド(R 言語)によって、沖本先生御自身の HP (http://www.geocities.jp/tatsuyoshi_okimoto/books/tsa.html)から『国際株式市場に於ける各国株式収益率(https://www.msci.com/web/msci)』の時系列データ(日次)について VAR モデルを組み立て分析した結果です。


> library("zoo")
> msci <- read.zoo("msci_day.csv", sep=',', header = TRUE, format = "%Y/%m/%d")
> msci.var <- VAR( msci, p=VARselect( msci )$selection[1] )
> msci.irf <- irf( msci.var, n.ahead=14, ci=0.95 )
> plot( msci.irf )



TJO 氏ブログ(https://tjo.hatenablog.com/entry/2013/07/30/191853)から引用します。

“見方としては、信号処理工学の世界で言われるインパルス応答の解釈と同じで「ある国のMSCIにインパルス入力をぶち込んだ時にどれくらいの時間遅れレスポンスが他の国のMSCIに見られるか」が、この図から分かるという感じです。”

上記のグラフ、たくさんスクロールするのも大変なので、一番下の『アメリカの MSCI にインパルス入力をぶち込んだ時に、どれくらいの時間遅れレスポンスが他の国の MSCI に見られるか』をカンタンに読解してみてください。

  • 黒い実線: インパルス応答(どれくらいの時間遅れレスポンスが他の国の MSCI に見られるか)
  • 赤い上下の点線: インパルス応答に可能な振れ幅の上下限
左列上から 3 つ目、『アメリカ 1 標準偏差のショックの入力があった場合、日本にどんな影響が出るか?』のグラフを観てください。できれば、その下のアメリカ自身に対する影響と見比べながら。

アメリカ市場では当然のごとく、一旦、わずかに株式収益率の応答が跳ね上がったあと、微妙に減少していきます(ほぼ維持)。ところが日本は『風が吹けば桶屋が儲かる』ではありませんが、ドンと跳ね上がると株式収益率がそのまま上がっていきます。ですが、赤い点線のみせる振れ幅もどんどん拡がっていき、影響が増幅されていることが見て取れます。


今度は逆の立場から観てみましょう。
上から 5 枚目『日本』のグラフを見に行ってください。
日本で 1 標準偏差のショックの入力があっても、他の市場にろくに影響を与えていないことが明白になってます。

ここでまた TJO 氏ブログから引用します。

“大事なのは、「時間遅れ(タイムラグ)」の向き。ここを見ることで、「どの時系列がどの別の時系列に対して影響を与える=どちらが原因でどちらが結果か」が分かります。”

つまり、アメリカと日本のあいだで言えば「アメリカ」が原因で「日本」が結果であるような因果関係があることが分かります。その逆ではないのです。「アメリカでくしゃみをすれば、日本がインフルエンザになる」といった物謂が成立しそうなくらいに。


日米のあいだの関係だけではありません。
G7 各国のあいだそれぞれの関係がどうなっているか、上記掲載のグラフ 7 枚からよく観察してみてください。



VAR モデルを使って、複数の時系列データを貫くような関係性を見出し、そこにインパルス応答を応用するだけで、此処までの知見を導き出すことができました。統計科学(データ・サイエンス)は、このような手法の宝庫です。本業のかたわら、余力のあるときに勉強を続けていきたいですね。




余談:
磯部 孝 編『相関関数およびスペクトル』(東京大学出版会:1968 年初版)を買い求めました。きょうのトピックであった『インパルス応答関数』も出てきます。ひとつひとつ勉強することは大切ですが、わたしには基礎が足りません。この秋から放送大学に通い直して、自分が失ってしまった諸学問を学習しなおす所存です。

コメント

このブログの人気の投稿

あたらしい道具

今晩和。 またまた御無沙汰しております。 きょうは、大変おもしろい『道具』に出逢ったので、その御紹介を。 その道具とは “TensorBoard” です。 詳しくは、以下のリンクのページを熟読なさってください。 https://yag-ays.github.io/project/embedding-visualization/ この分析ツールを使ってみるために、国連の『世界人権宣言』を mecab で分かち書きにしてから word2vec に通してみました。 わたしは門外漢なので、あまりよく分かっていませんが、要はこれ、主成分分析(PCA)ですね。いや、オプションで t-SNE という「学習」にも切り替えられますが。 なんで、こんなツールを探し出して使ってみたかというと、実は仕事上の必要から、大量の文献の調査をしているのです。ところがアタマがパンクしそうになるくらい大量で困っていたのでした。そこで、要領よく文献を精査するために、キーワード検索を多用しようか、と云う段階になりました。 そうすると、とあるキーワードに「距離的に近い」別のキーワード群を知りたいと思ったのです。そこでネットを散策していたら上記のページに行き当たり。 上記の例では、対象が『世界人権宣言』ですので、まあ、ドキュメントの量としても短いし、出てくる単語の語彙も限られていて、いわゆる予想どおりの結果になっております。 ですが、これを不特定多数のドキュメント群に対して施したときに、どうなるか? まだ、わたしには分かりません。 ですが、確かな手応えを感じています。 こんなツールが、ちょっと環境を整えるだけで使える時代。 ああ、ほんとうに良くなりました。 感謝深甚です。 追記: 手持ちの参考文献をすべて .txt にして、TensorBoard で可視化してみました。 これはスゴい! 便利です。

霞ヶ関文学の劣化ぶりを垣間見る——『一事が万事?』——

おはようございます。 ちょっと古い(半年前くらいの)トピックなんですが、看過できないものを見かけました。そこで所感をまとめておきます。 【経済産業省】:DXレポート ~ITシステム「2025年の崖」克服とDXの本格的な展開~ https://www.meti.go.jp/shingikai/mono_info_service/digital_transformation/20180907_report.html どうも、あまりにも問題が多すぎるレポートです。 ですから『本文』.PDF の 27 ページに話を絞って、分析します。 https://www.meti.go.jp/shingikai/mono_info_service/digital_transformation/pdf/20180907_03.pdf 『(注)経済損失の算出根拠』からの文章を、じっくりとお読みください。 私見では、まことしやかに数字を列挙しながら「試算」を進めている、この注釈。 論理的な妥当性には、かなり乏しいです。 この「試算」は、3 つの統計調査の引用でできあがっています。 情報処理推進機構(ベースは他社による調査) 日経 BP 社「日経コンピュータ 2017.8.3」の記事 日本情報システム・ユーザー協会「企業 IT 動向調査報告書 2016」 ですが、それらを並べて試算している、そのやり方が微妙にオカシイのです。 まず、これは前提として(仕方なく、)仮に許しましょう。 1. > データ損失やシステムダウン等の システム障害により生じた 2014 年 1 年間の損失額は国内全体で約 4.96 兆円。 つまり、既に 5 年前の段階で年間あたり約 5 兆円の損失を(レガシー系に代表される基幹系システムは)計上している訳です。  次に、ここが要注意です。 2. > (1)セキュリティ 29.1%、 > (2)ソフトの不具合 23.1%、 > (3)性能・容量不足7.7%、 > (4)人的ミス 18.8%、 > (5)ハードの故障・不慮の事故 19.7%。 > レガシーシステムに起因して起こる可能性があるのは、仮に、このうち (1)・(2)・(3)・(...