複数の時系列データの因果関係が分かる（？）

今日和。
さて、独学ブログとして本来の路線へ。

本日は、沖本竜義著『経済・ファイナンスデータの計量時系列分析』から。
何故ならば、個人的に「時系列データ」の分析に多くの興味を持っているからです。
そこで本業が手薄な期間をつかって勉強しています。
その最中で、おもしろいモデル化手法を知りました。

“VAR モデル” のことです。

この界隈では有名な TJO 氏が解説しているので、その投稿記事へのリンクを貼ります。
本投稿は、多くを以下の 2 リンクを中心とした TJO 氏記事に参考にしてます。
https://tjo.hatenablog.com/entry/2013/07/25/194546
https://tjo.hatenablog.com/entry/2013/07/30/191853

沖本本、第 4 章冒頭から多少強調のために改変しつつ引用します。

“ベクトル自己回帰（VAR）モデルは、自己回帰モデルを多変量に拡張したものである。VAR モデルを用いる目的は主に 2 つで

1 つは複数の変数を用いて予測精度の向上を図ることであり、
もう 1 つは変数間の動学的関係の分析を行うことである。

特に、変数間の動学的関係の分析に関して、VAR モデルは

グレンジャー因果性
インパルス応答関数
分散分解

という強力なツールを提供でき、推定も容易であるので、80 年代以降、マクロ経済学やファイナンスの分野で頻繁に利用されるようになった。本章では、多変量のデータの動学的関係を分析する上で非常に重要なモデルである VAR モデルについて述べる。”

このなかで、わたしが注目したのは『インパルス応答関数』です。
https://ja.wikipedia.org/wiki/インパルス応答

“インパルス応答（英語: impulse response）とは、インパルスと呼ばれる非常に短い信号を入力したときのシステムの出力である。インパルス反応とも。インパルスとは、時間的幅が無限小で高さが無限大のパルスである。実際のシステムではこのような信号は生成できないが、理想化としては有益な概念である。”

何故、これが有益かというと、以下の具体例から御理解いただけるかと。

“スピーカー：
1980年代にスピーカーのインパルス応答評価法が開発され、スピーカーの設計が大いに進歩した。スピーカーでは位相歪みが問題となる。これは、周波数特性のような測定可能な一般的特性とは異なる問題である。位相歪みは、共振、コーンにおけるエネルギー蓄積、スピーカー躯体の振動などによって発生する微妙な音の遅延が原因で発生する。位相歪みは音をにじませ（スミアー）、透明感がなくなる原因となる。インパルス応答を測定すると、その時間スミアーが分かるので、コーンや躯体の材質や形状の改良などに使うことで歪みを低減させることが可能となった。当初、短いパルスを使っていたが、システムの線形性を維持するには振幅を大きくできず、結果として出力も小さくなるため、ノイズとの識別が困難だった。その後、M系列のような入力を使うようになり、コンピュータを使ってそこからインパルス応答を求めるようになった。最近では、周波数ごとの遅延応答を図示できるようになっている。その応用としてホールなどの残響を測定し、音響設計をする手段としても用いられる。”

実際にインパルスに相当する音と、その応答である残響を聴いてみてください。

http://www.openairlib.net/sites/default/files/auralization/data/audiolab/lady-chapel-st-albans-cathedral/stereo/stalbans_a_ortf.wav

この場合、“The Lady Chapel, St Albans Cathedral” のチャペル内の音響構造が、この『残響』に反映されている訳です。

この残響を別の時系列データに適用してみたら、というのが今回のお話になります。

沖本本の例 4.5 になります。

本論は沖本本第 4 章をしっかり読んでいただくとして、TJO 氏による R をつかった具体例の結果、そのグラフ群を貼ります。G7 各国分掲載しますが、特に日本とアメリカのそれに注目して御覧ください。

カナダ：

フランス：

ドイツ：

イタリア：

日本：

イギリス：

アメリカ：

上記 7 枚のグラフ群は以下のコマンド（R 言語）によって、沖本先生御自身の HP （http://www.geocities.jp/tatsuyoshi_okimoto/books/tsa.html）から『国際株式市場に於ける各国株式収益率（https://www.msci.com/web/msci）』の時系列データ（日次）について VAR モデルを組み立て分析した結果です。

> library("zoo")

> msci <- read.zoo("msci_day.csv", sep=',', header = TRUE, format = "%Y/%m/%d")

> msci.var <- VAR( msci, p=VARselect( msci )$selection[1] )
> msci.irf <- irf( msci.var, n.ahead=14, ci=0.95 )
> plot( msci.irf )

TJO 氏ブログ（https://tjo.hatenablog.com/entry/2013/07/30/191853）から引用します。

“見方としては、信号処理工学の世界で言われるインパルス応答の解釈と同じで「ある国のMSCIにインパルス入力をぶち込んだ時にどれくらいの時間遅れレスポンスが他の国のMSCIに見られるか」が、この図から分かるという感じです。”

上記のグラフ、たくさんスクロールするのも大変なので、一番下の『アメリカの MSCI にインパルス入力をぶち込んだ時に、どれくらいの時間遅れレスポンスが他の国の MSCI に見られるか』をカンタンに読解してみてください。

黒い実線：　インパルス応答（どれくらいの時間遅れレスポンスが他の国の MSCI に見られるか）
赤い上下の点線：　インパルス応答に可能な振れ幅の上下限

左列上から 3 つ目、『アメリカで 1 標準偏差のショックの入力があった場合、日本にどんな影響が出るか？』のグラフを観てください。できれば、その下のアメリカ自身に対する影響と見比べながら。

アメリカ市場では当然のごとく、一旦、わずかに株式収益率の応答が跳ね上がったあと、微妙に減少していきます（ほぼ維持）。ところが日本は『風が吹けば桶屋が儲かる』ではありませんが、ドンと跳ね上がると株式収益率がそのまま上がっていきます。ですが、赤い点線のみせる振れ幅もどんどん拡がっていき、影響が増幅されていることが見て取れます。

今度は逆の立場から観てみましょう。

上から 5 枚目『日本』のグラフを見に行ってください。

日本で 1 標準偏差のショックの入力があっても、他の市場にろくに影響を与えていないことが明白になってます。

ここでまた TJO 氏ブログから引用します。

“大事なのは、「時間遅れ（タイムラグ）」の向き。ここを見ることで、「どの時系列がどの別の時系列に対して影響を与える＝どちらが原因でどちらが結果か」が分かります。”

つまり、アメリカと日本のあいだで言えば「アメリカ」が原因で「日本」が結果であるような因果関係があることが分かります。その逆ではないのです。「アメリカでくしゃみをすれば、日本がインフルエンザになる」といった物謂が成立しそうなくらいに。

日米のあいだの関係だけではありません。
G7 各国のあいだそれぞれの関係がどうなっているか、上記掲載のグラフ 7 枚からよく観察してみてください。

VAR モデルを使って、複数の時系列データを貫くような関係性を見出し、そこにインパルス応答を応用するだけで、此処までの知見を導き出すことができました。統計科学（データ・サイエンス）は、このような手法の宝庫です。本業のかたわら、余力のあるときに勉強を続けていきたいですね。

余談：
磯部孝編『相関関数およびスペクトル』（東京大学出版会：1968 年初版）を買い求めました。きょうのトピックであった『インパルス応答関数』も出てきます。ひとつひとつ勉強することは大切ですが、わたしには基礎が足りません。この秋から放送大学に通い直して、自分が失ってしまった諸学問を学習しなおす所存です。

データ・サイエンティストは可視化の夢を見るか？

このブログを検索

複数の時系列データの因果関係が分かる（？）

コメント

コメントを投稿

このブログの人気の投稿

恐るべき凋落

霞ヶ関文学の劣化ぶりを垣間見る——『一事が万事？』——