無限長モデル距離を用いた異種時系列クラスタリング(時系列解析,統計推理,データベース,一般)
スポンサーリンク
概要
- 論文の詳細を見る
本稿では長さと位相が異なる時系列のクラスタリング(異種時系列クラスタリング)の問題を取り扱う。時系列クラスタリングは、基礎的かつ応用範囲の広い分析手法である。他のクラスタリング問題を扱う場合と比べて、時系列クラスタリングで特に問題となるのが時系列間の距離である。異なる長さと位相を持つ時系列(異種時系列)をどのように比較すれば良いかは自明ではなく、不適切な距離を採用すれば無意味な結果しか得られない。特に、位相差を無視して時系列をクラスタリングするとデータに含まれる特徴的なパターンの情報を含まない無意味なクラスター中心が得られるという問題は「正弦波問題」としてよく知られている。本稿では異種時系列クラスタリングの手法を提案する。提案手法の核となるアイデアは時系列間の距離として観測されたデータ間の距離ではなくデータから学習されたモデル間の距離(KL距離)を用いてクラスタリングを実行することである。この方法を採用する利点は以下の二点である:(1)KL距離を計算する際の積分範囲を揃えることで異なる長さの観測データを直接比較でき、(2)KL距離の積分範囲の端(初期状態・境界条件)を固定することで位相を揃えた比較ができる。このため、提案手法によって長さと位相の異なる時系列のクラスタリングを実現できる。
- 2012-03-05