動的時間伸縮法に基づく平均時系列生成による時系列データの高速クラスタリング
スポンサーリンク
概要
- 論文の詳細を見る
This paper proposes a fast clustering method for time-series data based on average time sequence vector. A clustering procedure based on an exhaustive search method is time-consuming although its result typically exhibits high quality. BIRCH, which reduces the number of examples by data squashing based on a data structure CF (Clustering Feature) tree, represents an effective solution for such a method when the data set consists of numerical attributes only. For time-series data, however, a straightforward application of BIRCH based on a Euclidean distance for a pair of sequences, miserably fails since such a distance typically differs from humans perception. A dissimilarity measure based on DTW (Dynamic Time Warping) is desirable, but to the best of our knowledge no methods have been proposed for time-series data in the context of data squashing. In order to circumvent this problem, we propose DTWS (Dynamic Time Warping Squashed) tree, which employs a dissimilarity measure based on DTW, and compresses time sequences to the average time sequence vector. An average time sequence vector is obtained by a novel procedure which estimates correct shrinkage of a result of DTW. Experiments using the Australian sign language data demonstrate the superiority of the proposed method in terms of correctness of clustering, while its degradation of time efficiency is negligible.
- 社団法人 人工知能学会の論文
- 2003-11-01
著者
-
鈴木 英之進
横浜国立大学大学院工学研究院
-
山田 悠
横浜国立大学大学院工学府
-
鈴木 英之進
九州大学大学院システム情報科学研究院
-
山田 悠
横浜国立大学大学院工学府:(現)(株)nttデータ
-
中本 和岐
横浜国立大学大学院工学研究科
-
鈴木 英之進
横浜国立大学大学院工学府物理情報工学専攻電気電子ネットワークコース
関連論文
- 例外性発見に基づくスパイラル的アクティブマイニング(アクティブマイニング)
- 時系列決定木の実験的評価(9月15日)(「アクティブマイニング」及び一般)
- 時系列決定木の実験的評価(「アクティブマイニング」及び一般)
- 動的時間伸縮法に基づく時系列データからの決定木学習
- プロトタイプラインに基づく医療検査データの高次可視化
- 動的時間伸縮法に基づく時系列データからの決定木学習( 「アクティブマイニング」及び一般 : 文部科学省科学研究費特定領域研究「情報洪水時代におけるアクティブマイニングの実現」公開シンポジウム)
- プロトタイプラインに基づく医療検査データの高次可視化(文部科学省科学研究費特定領域研究「情報洪水時代におけるアクティブマイニングの実現」公開シンポジウム)(特集テーマ : 「アクティブマイニング」及び一般)
- 動的時間伸縮法に基づく時系列データからの決定木学習 (知識ベースシステム研究会(第60回) 人工知能基礎論研究会(第52回) 小特集:「データマイニング」および一般) -- (文部科学省科学研究費特定領域研究 情報洪水時代におけるアクティブマイニングの実現)
- プロトタイプラインに基づく医療検査データの高次可視化 (知識ベースシステム研究会(第60回) 人工知能基礎論研究会(第52回) 小特集:「データマイニング」および一般) -- (文部科学省科学研究費特定領域研究 情報洪水時代におけるアクティブマイニングの実現)
- Experimental Evaluation of Time-series Decision Tree (小特集 「アクティブマイニング」および一般)
- 多重サイコロモデルを用いたEM法による慢性肝炎データ医療検査結果の類型化
- 多重サイコロモデルを用いたEM法による慢性肝炎データ医療検査結果の類型化 (小特集 「ヒューマンエージェントインタラクション」および一般)
- 特徴的な株価変動区間抽出に基づく相場操縦発見(ビジネスとデータマイニング, 「安全・安心な社会生活の実現に向けた知識の活用とソフトウェア開発支援」及び一般)
- 異常値検出のアンサンブルによる軌跡データからの特異行動の発見
- 0. 編集にあたって(最新!データマイニング手法)
- 混合多項分布推定を用いた肝炎データにおける異常検査値の類型化
- 混合多項分布推定を用いた肝炎データにおける異常検査値の類型化 (テーマ:「アクティブマイニング」および一般)
- 教師つき学習と教師なし学習の統合学習のための心理実験と計算モデル
- 分類子学習のためのクラス生成に関する認知科学的実験
- 多数の例外的データが存在する回帰問題のための最小記述長原理の拡張
- 情報理論的手法を用いたデータベースからの例外的知識の発見
- 情報理論的規準を用いたデータベースからの例外的知識の発見
- 動的時間伸縮法に基づく平均時系列生成による時系列データの高速クラスタリング
- LG-3 動的時間伸縮法に基づく時系列データの高速クラスタリング(G. 人工知能)
- 情報理論的枠組に基づくマイノリティ集合の検出
- プロトタイプラインに基づく医療検査データの高次可視化 (知識ベースシステム研究会(第60回) 人工知能基礎論研究会(第52回) 小特集:「データマイニング」および一般) -- (文部科学省科学研究費特定領域研究 情報洪水時代におけるアクティブマイニングの実現)
- 第4回太平洋アジア地域知識発見とデータマイニング国際会議の報告
- 動的時間伸縮法に基づく時系列データからの決定木学習 (知識ベースシステム研究会(第60回) 人工知能基礎論研究会(第52回) 小特集:「データマイニング」および一般) -- (文部科学省科学研究費特定領域研究 情報洪水時代におけるアクティブマイニングの実現)
- 順序ドロー画像を用いたサッカービデオからの戦術特定(人・物のネットワークとマイニング技術の活用, 「安全・安心な社会生活の実現に向けた知識の活用とソフトウェア開発支援」及び一般)
- 不正パターンとのマッチングによる株相場操縦発見 (テーマ:「データマイニングと統計数理」および一般)
- 階層型クラスタリングに基づく検索ウェブページ集合の多視点多粒度型可視化 (テーマ:「データマイニングと統計数理」および一般)
- 図を用いたビデオデータからの戦術特定 (テーマ:「データマイニングと統計数理」および一般)
- 特徴的な株価変動区間抽出に基づく相場操縦発見 (テーマ:「安全・安心な社会生活の実現に向けた知識の活用とソフトウェア開発支援」および一般)
- 順序ドロー画像を用いたサッカービデオからの戦術特定 (テーマ:「安全・安心な社会生活の実現に向けた知識の活用とソフトウェア開発支援」および一般)
- 多目的最適化問題における均等なパレート面探索のための多指向性遺伝的アルゴリズム(セッション3)
- データスカッシング(data squashing)
- 株価変動基準と収益基準に基づく相場操縦発見システム(リスク日避とデータ知能学, セマンティックWebとソフトウェア工学, 一般)
- 2. データスカッシング : 逆転の発想によるスケールダウン戦略(最新!データマイニング手法)
- 株価変動基準と収益基準に基づく相場操縦発見システム (特集 「セマンティックWebとソフトウェア工学」および一般) -- (リスク回避とデータ知能学)
- LF-011 収益基準に基づく株価不正操作発見システム(F. 人工知能)
- 正確な学習よりも得する学習 : 誤分類コストを考慮する分類学習 : (2)解決編
- 正確な学習よりも得する学習 : 誤分類コストを考慮する分類学習 : (1)評価編
- 慢性肝炎データからのスパイラル的例外性発見に向けて (特集 「医療及び化学情報マイニング」および一般)
- 技術開発の動向と展望 データマイニングにおけるデータ変換 (AIシンポジウム(第17回)マーケティングのデータマイニングチャレンジ) -- (データを如何に集めるか? データを如何に活かすか?)
- 1N-7 圧縮情報量密度に基づく発見ルール集合の可視グラフ構造への変換
- KDDカップ2000主催者報告書 : 本質をつかむ (データマイニングコンテスト)
- 単語ウェブ共起頻度とトピック確率モデルに基づく可視化手法を用いた特異なウェブページの特定 (特集:「アクティブマイニング」および一般) -- (セッション3 Webマイニング)
- LF-007 検索エンジンを用いた特異なウェブページの分類(F. 人工知能)
- 一般性と正確性に基づくルール発見の最悪解析
- 例外ルールの発見(「データマイニング特集号」)
- 反復データ圧縮型ブースティングの実験的評価 (テーマ:一般演題及び「webとtext」)
- 花つき決定木による多目的分類学習
- 花つき決定木による多目的分類学習
- 相互情報量基準を用いた連続値クラスに対する仮説の構築
- TWS木を用いた例数圧縮による時系列データの高速クラスタリング (テーマ:一般演題及び「webとtext」)
- KDDプロセスモデルに基づく膠原病データの解析
- UCI KDDアーカイブ : データマイニング研究と実験のための大規模データ集合のアーカイブ (データマイニングコンテスト)
- 花つき木構造による多次元クラスデータからの回帰学習
- 共通病院データ集合からの例外知識発見
- 標準形変換とSupport Vector Machinesによる物体認識
- ヨーロッパにおけるデータマイニングコンテスト (データマイニングコンテスト)
- サポートベクターマシンに基づく医療データからの事例発見 (サポートベクターマシン : その仕組みと応用 : 分類手法の新展開)
- 規則の帰納学習におけるバイアスの経験的比較
- 最遠例順次選択法を用いた概念クラスタリング