『時系列データ分析のすすめ方』

〜因果分析・モデル化・予測・異常検知・機械学習〜


  《講師》 鈴木智也 (CollabWiz代表)  図解による分かり易さを重視し解説します!
  《時間》 実施時間はご都合に合わせます
       ・1日間 6時間コース (Python実習は概要のみ)
       ・2日間 12時間コース (Python実習もしっかり実施)
  《人数》 10名様〜 (企業内研修を想定しています)
  《場所》 どこでも出張します
  《費用》 メールにてご相談ください

メッセージ
 近年、人工知能や機械学習が注目を集めていますが、技術的な大変化が突然起こったのではなく、過去の研究成果の積み重ねによって深層学習などの新しいモデルが誕生しました。つまりホットな技術を活用するためにも、基礎的な周辺知識は重要です。
 そこで今回のセミナーでは「時系列データ」を対象にし、データの個性を定量化する統計的分析や、数式として表現する時系列モデルを多数紹介します。更にこれらの応用として「将来予測」や「異常検知」に着眼し、より高度な機械学習モデルを取り入れつつ、実務への応用をサポートします。
 本セミナーでは図解による分かり易さを重視しますが、その解説のみに終始せず、フリーソフトPythonやRによる実践方法も多数紹介します。コースを問わず、全てのプログラムを配布しますので、復習やお仕事にご活用いただけます。

習得知識
 ◆ 時系列データを定量的かつ定性的に分類できる
 ◆ 時系列データをモデル化し、予測や異常検知に活用できる
 ◆ 過学習を考慮した適切な予測モデルを機械学習できる
 ◆「線形・非戦形」「定常・非定常」「無相関・独立」の違いを理解できる
 ◆「相関・因果・非独立」の違いを理解できる
 ◆ PythonやRを駆使して各手法をご自身の業務に活用できる

セミナー内容
1.時系列データの特徴を調べる(統計的分析)
 (1) ランダムか?法則的か?
  a. 確率論的モデルと決定論的モデル
  b. その判別方法(法則性の可視化)
 (2) 過去は未来に影響するか?
  a. 相関性と非独立性(非線形相関)の違い
  b. 非独立性の確認(連検定,BDSテスト,相互情報量)
  c. 相関性の確認(相関係数,自己相関関数)
  d. 疑似相関に注意 (偏相関係数)
  e. 偏自己相関関数
 (3). 他から影響を受けるか?
  a. 同時刻の関係(相関性と非独立性の違い)
  b. 時間遅れを伴う関係(相関性と因果性の違い)
  c. 相関性の確認(相互相関関数)
  d. 因果性の確認(移動エントロピー,グランジャー因果テスト)

2.時系列データの変動パターンを数式で表現する(時系列モデル)
 (1) ランダムウォーク
  a. 確率的トレンドと確定的トレンド
  b. 定常性と非定常性
  c. 定常化と単位根検定
  d.トレンド成分と季節成分の分解
 (2). 平均値 (期待値) の推定
  a. AR(自己回帰)モデル
  b. 過学習を防ぐAIC (赤池情報量基準)
  c. ARMA(自己回帰移動平均)モデル
  d. ARIMA(自己回帰和分移動平均)モデル
  e. SARIMA(季節自己回帰和分移動平均)モデル
  f. 残差診断
 (3). 分散値 (リスク) の推定
  a. ARCH モデル
  b. GARCH モデル
  c. ARIMA-GARCH モデル
 (4). 将来予測への応用
  a. モンテカルロシミュレーションによる長期予測
  b. 残差の時間構造も考慮する方法
 (5). 異常検知への応用
  a. 予測モデルを使う方法
  b. 予測モデルを使わない方法

3.機械学習で学習力を強化する(非線形モデル)
 (1) 線形モデルと非線形モデルの違い
  a. 重回帰分析から「非線形重回帰分析」へ
  b. 最も手軽なのに高性能な「k近傍法」
  c. 機械学習の失敗につながる「次元の呪い」
  d. 交差確認法 (CV法)
  e.モデルパラメータとハイパーバラメータの違い
 (2) ニューラルネットワーク
  a. 単一ニューロンモデルの学習則(最急勾配法)
  b. ニューラルネットワークの学習則(逆誤差伝搬法)
  c. 多層ニューラルネットの問題点(勾配消失問題,過学習)
  d. 深層学習(ディープラーニング)を可能にしたオートエンコーダ
 (3) 決定木
  a. 因果関係が分かりやすいIf−Thenルール
  b. 情報エントロピーを低下させる
 (4) 集団学習
  a. 多数決で予測精度を向上させる(集合知)
  b. 予測精度が向上する理由(集合知定理)
  c. いろいろな集団学習 (バギング, ランダムフォレスト, 勾配ブースティング)
 (5) 機械学習による異常検知
  a. k近傍法の場合
  b. 決定木の場合
  c. ニューラルネットワークの場合

付録資料
 (1) フリーソフトPythonの基本操作ガイド
 (2) フリーソフトRの基本操作ガイド
 (3) PythonとRの連携方法


 その他ご希望あれば、お気軽に メール をお寄せください。