大量のテキストからの知識マイニング
スポンサーリンク
概要
- 論文の詳細を見る
大量のテキストデータは貴重な知識源となる可能性を持つ反面、個々の内容を解釈し全体的な傾向をつかんで有益な知識を獲得するためには大変な労力が必要となる。そのため、せっかくのテキストデータが有効に活用されていない場合が多い。本稿では、テキストマイニング技術の確立を目標として数十万件に及ぶ顧客からの間合せデータを実際に処理した試みを通じ、どのような処理を行えばどのような知識を獲得できるかについての知見を示す。 最初に、大量の文書データの複雑性と分析の困難性を示し、そこからいかにして有益な知識を自動的に抽出するかを考察した上で、具体的なデーターへの適用例とその結果を示す。
- 一般社団法人情報処理学会の論文
- 1999-10-15
著者
-
長野 徹
日本アイ・ビー・エム東京基礎研究所
-
那須川 哲哉
日本アイ・ビー・エム株式会社東京基礎研究所
-
武田 浩一
日本アイ・ビー・エム(株)東京基礎研究所
-
長野 徹
日本アイ・ビー・エム株式会社東京基礎研究所
-
長野 徹
日本アイ・ビー・エム
-
那須川 哲哉
日本アイ・ビー・エム 東京基礎研
-
武田 浩一
日本アイ・ビー・エム(株) 東京基礎研究所
関連論文
- IBMプロフェッショナル論文 作業効率の高いテキスト合成音声チューニング環境
- コーパスベース日本語音声合成フロントエンド (システム開発論文特集)
- 波形重畳型音声合成の韻律と音質のためのF0傾きモデルの利用(音声合成・韻律,第9回音声言語シンポジウム)
- コーパスベース日本語音声合成フロントエンド(音声システム,システム開発論文)
- テキストマイニング・類似文書検索システムによるEBMに基づく診療ガイドライン作成支援の有効性
- テキストマイニングの普及に向けて : 研究を実用化につなぐ課題への取組み
- 合成音声を用いたオンライン動画音声ガイド提供の実現に向けて
- 波形重畳型音声合成の韻律と音質のためのF0傾きモデルの利用(音声合成・韻律,第9回音声言語シンポジウム)
- 波形重畳型音声合成の韻律と音質のためのF0傾きモデルの利用(音声合成・韻律,第9回音声言語シンポジウム)
- 大規模生物医学文献データベースのテキストマイニング・ツール (テキストマイニング(Part2))
- ライフサイエンス向けテキストマイニングツールMedTAKMI(テキストマイニングの応用(2))
- ライフサイエンス分野におけるテキストマイニング技術適用の動向(テキストマイニングの応用(2))
- 文献データベースからの生医学インフォマティクス (創薬ゲノミクス・創薬プロテオミクス・創薬インフォマティクス) -- (創薬インフォマティクス)
- XMLがもたらす創造的ネットワーク : 動的な情報源と分散エージェント (「創造的ネットワーク化情報環境に向けて」)
- テキスト分析のためのOLAPシステム(情報融合)
- UIMA : 非構造情報処理アーキテクチャ(研究のツールボックス 第6回)
- コールセンターにおける目的を持ったビジネス会話のモデリングと会話マイニングへの応用
- 音声合成を用いたインターネット動画用音声ガイド
- 木構造変換を利用した評判分析手法
- パターンベース翻訳システムPalmTreeの文脈処理
- SLP・NL合同セッション「ここまでできるぞ音声/言語処理技術」 : 言語編 : 6 パターンベース英日翻訳システムPalmTree
- パターンベース翻訳システム : PalmTree
- 日本語文書校正支援システムの設計と評価
- 統計的手法による漢字複合語の自動分割
- 日本語文書校正支援システムCRITACのテキスト・コンパイラ
- 構造化文書上における校正・推こう手法の検討
- S1-5 テキストからの意図抽出(特別セッション(S1) : テキストマイニング)(第30回日本行動計量学会大会発表一覧)
- マイニング技術を活用した定量的な診療プロセス分析への挑戦
- 音声合成のための自動アクセントラベリング(セッション5 : 音声認識+音声合成)
- 音声合成のための自動アクセントラベリング(セッション5 : 音声認識+音声合成)
- N-gramモデルを用いた音声合成のための読みおよびアクセントの同時推定(音声言語,情報処理技術のフロンティア)
- 確率モデルを用いた読み及びアクセント推定(言語解析, 対話)
- 企業における集合知の活用事例「InnovationJam」--全世界のIBM社員、家族、そしてお客様が一体となったオンライン・ディスカッション (特集 Web2.0による企業イノベーション)
- 4.ビジネス・インテリジェンスと人工知能技術(人工知能技術と産業応用)
- S1-6 e-メールのテキストマイニング(特別セッション(S1) : テキストマイニング)(第30回日本行動計量学会大会発表一覧)
- e-メールのテキストマイニング(テキストマイニング)
- サイト・アウトライニング : インターネットからの情報収集と可視化技術
- 海外におけるナレッジマネジメントの実践(「ナレッジマネジメントとその支援技術」)
- テキストマイニングのための情報抽出
- テキストマイニングのための情報抽出
- テキスト情報の可視化を利用した情報検索(「ビジュアルな情報検索」編集にあたって)
- 特集「ビジュアルな情報検索」編集にあたって
- 大量のテキストからの知識マイニング
- 4N-5 知識管理のためのテキストマイニング
- テキストからの意図抽出(テキストマイニング)
- 知識発見のためのテキストマイニング技術
- 4N-7 テキストマイニングのための情報抽出 : 情報レベルの最適化
- 4N-6 知識発見のためのテキストマイニング技術
- テキストマイニングのための情報抽出手法
- テキストマイニング--非構造データからの知見抽出技術
- 表層的な文脈情報を用いた自然な文生成の試み
- 知識ベースを利用した機械翻訳システムShalt2 ( 自然言語処理の実動システム)
- 英日機械翻訳システムShalt2の日本語生成文法
- 英日機械翻訳システムShalt2における並列句の取り扱い
- 特集「ディジタル図書館」の編集にあたって
- 編集にあたって(使いやすくなった自然言語処理のフリーソフト : 知っておきたいツールの中身)
- インターネットでの情報の記述と交換方式の最近の動向(「XML:インターネット上での情報の記述と交換」)
- Watson--クイズ番組に挑戦する質問応答システム
- 文脈制約と文脈選好を利用した文脈処理システムDIANA
- 2 テキストマイニング : 膨大な文書データの自動分析による知識発見 (フィールドを広げる自然言語処理)
- テキストマイニング : 膨大な文書データからの知識獲得 : 概要
- テキストマイニング : 膨大な文書データからの知識獲得 : 意図の認識
- 異種データに対する統合的情報検索
- 編集にあたって (フィールドを広げる自然言語処理)
- コールセンターにおけるテキストマイニング(「テキストマイニング」)
- テキストマイニング基盤技術(「テキストマイニング」)
- 頑健な文脈処理のパラダイム : 文脈依存性を考慮した自然言語処理
- 文や句による日本語テキストの検索 : 語と語の係り受けを用いた検索の試み
- 文脈情報を利用した自然言語文における構造的曖昧性の解消
- 2012年度喜安記念業績賞紹介:知識の蓄積による問題解決に向けた新たな試み
- ACL'95会議報告
- 文脈情報を利用した不適格文の構文解析
- 自然言語解析における複数文一括処理手法
- 自然言語処理システムにおける出力信頼度の自動評価
- 文脈制約を利用した曖昧性解消
- 大語彙連続音声認識と音節N-best音声認識を用いたSpoken Term Detectionの高精度化