テキストデータを用いた問題の早期発見手法(意味表現・データマイニング)
スポンサーリンク
概要
- 論文の詳細を見る
継続的に蓄積されていくテキストデータを用いて,問題を早期に発見する手法を提案する.問題の表現に関しては,領域知識を反映したシソーラス上のカテゴリの組み合わせによって,表現可能な問題クラスを定義し,シソーラスと文書との対応付けを行った.表現可能なクラスに含まれる問題については,問題に関するテキストデータが非常に少ない段階でも検知できる相関分析手法を適用し,その他の未知の問題については,蓄積型テキストデータの特性を考慮し,時系列解析の精度向上を実現した.また,問題報告の冗長性,問題表現の詳細さにも留意し,冗長な報告を統計的に最も情報の価値のある粒度のもの一つに絞り込む手法を提案している.実験ではPCコールセンターのコールログを解析し,特定の機種において"ACアダプタから異音がする"など4件の問題を,週ごとの解析としては最短,またはその次週の時点で警告できた.
- 2004-07-15
著者
-
野美山 浩
日本アイ・ビー・エム株式会社東京基礎研究所
-
宅間 大介
日本アイ・ビー・エム株式会社東京基礎研究所
-
宅間 大介
日本アイ・ビー・エム 東京基礎研
-
野美山 浩
日本アイ・ビー・エム 東京基礎研
関連論文
- 大規模日本語テキストからの依存構造の抽出
- 情報検索システムにおける効果的なナビゲーション機能の提案
- 電子図書館IV : ナビゲーションシステムプロトタイプ
- 電子図書館III : Information Outlining : 触ってわかる情報の輪郭
- 電子図書館II : 基本設計
- 電子図書館I : 将来像
- コーパスからの対訳辞書の半自動生成
- 抄録からのキーワードの自動抽出
- 抄録からのキーワードの自動抽出
- 抄録からの主題文の自動抽出
- 構文情報を用いたキーワード抽出
- サイト・アウトライニング : インターネットからの情報収集と可視化技術
- テキスト情報の可視化を利用した情報検索(「ビジュアルな情報検索」編集にあたって)
- 確率的単語分割コーパスからの単語N-gram確率の計算(音声言語)
- 生コーパスからの単語N-gram確率の推定(仮名漢字変換・形態素構文解析)
- 安全語のアンマスキングによる機密情報マスキングシステム(情報抽出2,夏のデータベースワークショップDBWS 2006)
- 安全語のアンマスキングによる機密情報マスキングシステム(情報抽出)
- 個人適応型情報検索システム : 個人の興味を学習する階層記憶モデルとその協調的フィルタリングへの適用
- IBMプロフェッショナル論文 対話的テキストマイニングのためのソフトウェアアーキテクチャー
- テキストデータを用いた問題の早期発見手法(意味表現・データマイニング)
- 新聞記事データベースからの話題の抽出II-話題の構造の解析
- 新聞記事データベースからの話題の抽出
- 情報量から見た自然言語処理システムに対する考察
- 漸進的学習機能を備えた日本語形態素解析
- テキストからの知識獲得支援ツール
- IBMプロフェッショナル論文 コールセンターのログデータを用いた製品等の不具合の早期発見
- 情報獲得のパラダイムとしてのInformation Outlining (「1997年情報学シンポジウム」プログラム--人と情報学の調和をめざして) -- (マルチメディア技術2(情報の高度利用に向けて))
- 事例の一般化による機械翻訳