テキスト分析のためのOLAPシステム(<特集>情報融合)
スポンサーリンク
概要
- 論文の詳細を見る
今日の計算機環境の整備,インターネットの普及によりテキスト形式で記述された文書データが多く蓄積されるようになった.大量の文書から有用な知見が発見できれば非常に有益であるが,構造化されていない文書データから目的の文書を取捨,選択し,様々な角度から分析することは構造化されたデータに比べ容易ではない.一方,オンライン分析処理(OLAP)は各次元に沿って構造化されたデータを探索的に分析し,非定型の問合せに対して高速に分析結果を提供することができる.このような従来の多次元データベースを用いて文書データを分析する際,次元や次元値の定義,高速な応答時間を実現することは容易ではない.本橋では,大量の文書を分析するために,0LAPとオントロジを統合するためのデータモデルとデータ操作を提案する.
- 2007-06-15
著者
-
武田 浩一
日本アイ・ビー・エム(株)東京基礎研究所
-
猪口 明博
日本アイ・ビー・エム株式会社東京基礎研究所
-
猪口 明博
日本アイビーエム 東京基礎研究所
-
猪口 明博
大阪大学産業科学研究所
-
武田 浩一
日本アイ・ビー・エム(株) 東京基礎研究所
関連論文
- テキストマイニング・類似文書検索システムによるEBMに基づく診療ガイドライン作成支援の有効性
- 大規模生物医学文献データベースのテキストマイニング・ツール (テキストマイニング(Part2))
- ライフサイエンス向けテキストマイニングツールMedTAKMI(テキストマイニングの応用(2))
- ライフサイエンス分野におけるテキストマイニング技術適用の動向(テキストマイニングの応用(2))
- 文献データベースからの生医学インフォマティクス (創薬ゲノミクス・創薬プロテオミクス・創薬インフォマティクス) -- (創薬インフォマティクス)
- XMLがもたらす創造的ネットワーク : 動的な情報源と分散エージェント (「創造的ネットワーク化情報環境に向けて」)
- AGMアルゴリズムの高速化と立体構造解析への適用
- AGMによる3次元構造と生理活性の相関解析
- AGMによる3次元構造と生理活性の相関解析(「アクティブマイニング」及び一般 : 文部科学省科学研究費特定領域研究「情報洪水時代におけるアクティブマイニングの実現」公開シンポジウム)
- Apriori-based Graph Miningアルゴリズムの高速化
- テキスト分析のためのOLAPシステム(情報融合)
- UIMA : 非構造情報処理アーキテクチャ(研究のツールボックス 第6回)
- パターンベース翻訳システムPalmTreeの文脈処理
- SLP・NL合同セッション「ここまでできるぞ音声/言語処理技術」 : 言語編 : 6 パターンベース英日翻訳システムPalmTree
- パターンベース翻訳システム : PalmTree
- 日本語文書校正支援システムの設計と評価
- 統計的手法による漢字複合語の自動分割
- 日本語文書校正支援システムCRITACのテキスト・コンパイラ
- 構造化文書上における校正・推こう手法の検討
- マイニング技術を活用した定量的な診療プロセス分析への挑戦
- ラベルの概念階層を利用したグラフマイニング (特集 「医療及び化学情報マイニング」および一般)
- クラスラベル付きグラフデータからの有用なパターンペア発見 (特集 「医療及び化学情報マイニング」および一般)
- 多頻度グラフマイニング手法の一般化
- 企業における集合知の活用事例「InnovationJam」--全世界のIBM社員、家族、そしてお客様が一体となったオンライン・ディスカッション (特集 Web2.0による企業イノベーション)
- 4.ビジネス・インテリジェンスと人工知能技術(人工知能技術と産業応用)
- S1-6 e-メールのテキストマイニング(特別セッション(S1) : テキストマイニング)(第30回日本行動計量学会大会発表一覧)
- e-メールのテキストマイニング(テキストマイニング)
- サイト・アウトライニング : インターネットからの情報収集と可視化技術
- 海外におけるナレッジマネジメントの実践(「ナレッジマネジメントとその支援技術」)
- テキストマイニングのための情報抽出
- テキストマイニングのための情報抽出
- テキスト情報の可視化を利用した情報検索(「ビジュアルな情報検索」編集にあたって)
- 特集「ビジュアルな情報検索」編集にあたって
- 大量のテキストからの知識マイニング
- 4N-5 知識管理のためのテキストマイニング
- テキストマイニング--非構造データからの知見抽出技術
- 知識ベースを利用した機械翻訳システムShalt2 ( 自然言語処理の実動システム)
- 英日機械翻訳システムShalt2の日本語生成文法
- 英日機械翻訳システムShalt2における並列句の取り扱い
- 特集「ディジタル図書館」の編集にあたって
- 頻出グラフマイニング手法の一般化に関する研究(セッション5B : パターン抽出)
- 頻出グラフマイニング手法の一般化に関する研究(パターン抽出)(「夏のデータベースワークショップ(DBWS2003)」一般)
- HIVデータに対するデータマイニング (小特集:「Semantic Webとインテリジェントコンテンツ」および一般)
- 多頻度グラフパターンの完全な高速マイニング手法
- 膨大なグラフ構造データからの高速マイニング手法
- 知識発見研究の現状と展望 : 知識発見研究の方向性及びバスケット分析のための数値属性データの離散化
- 数値属性離散化におけるMDLPとAICの比較 (テーマ「共通データに基づく知識発見手法の比較と評価(2)」および一般)
- 多頻度パターン抽出方法の有機塩素化合物への適用
- バスケット分析のための構造化データにおける数値属性離散化
- 数値属性データに対するバスケット分析手法
- バスケット分析のグラフ構造デ-タへの拡張と通信ネットワ-クデ-タへの適用 (「ネットワ-クとAI」小特集セッション)
- Web探訪
- KDnuggets
- Jian Pei, Jiawei Han, Behzad Mortazavi-Asl, Helen Pinto, Qiming Chen, Umeshwar Dayal and Mei-Chun Hsu: PrefixSpan: Mining Sequential Patterns Efficiently by Prefix-Projected Pattern Growth, Proc.of International Conference of Data Engineering (ICDE2001),
- インターネットでの情報の記述と交換方式の最近の動向(「XML:インターネット上での情報の記述と交換」)
- Watson--クイズ番組に挑戦する質問応答システム
- 異種データに対する統合的情報検索
- 頻出パターンマイニングのグラフ系列への適用(系列パターンマイニングの最近の動向)
- 2012年度喜安記念業績賞紹介:知識の蓄積による問題解決に向けた新たな試み