クラスタ内変動最小基準に基づくテキストセグメンテーション(自然言語)
スポンサーリンク
概要
- 論文の詳細を見る
テキストをトピック単位に分割するテキストセグメンテーションは,テキストを構造化するための重要な要素技術の1つである.本論文では,テキストを単語の意味表現の1つである概念ベクトルの系列に変換し,ベクトルの系列を分割するクラスタ列で,クラスタ内のベクトルの変動量の総和であるクラスタ内変動が最小となるものをトピック区間列とする手法を提案する.提案手法の特徴は,テキストの1区間の意味的なまとまりの度合いを該区間内のベクトルの変動量により判断する点と,テキストの局所的な範囲内の情報のみでなく,テキスト全体のベクトルの分布情報に基づき,セグメンテーションを行う点にある.新聞記事を用いた評価実験の結果,局所的な範囲内でトピック境界を判断する従来手法よりも高精度であることを確認した.
- 一般社団法人情報処理学会の論文
- 2006-03-15
著者
関連論文
- 音声認識を用いたマルチメディアコンテンツのインデクシング
- 話題構造抽出に基づく会議音声インデクシングシステム(音声,聴覚)
- 単語概念ベクトルを用いた文書群からの代表語抽出(テーマ,膨大なデータから学ぶもの)
- 絵文字の語義抽出と役割の曖昧性解消 (「知能と社会・ネットワーク」および一般)
- αダイバージェンスに基づく単語連想と文書分類への適用(テーマ関連セッション3,コンピュータビジョンとパターン認識のための学習理論)
- 競合学習を用いたエントロピー最小基準クラスタリング法(一般,First Person Visionのための認識・理解)
- 全単語間共起を考慮した概念ベース生成手法(一般,First Person Visionのための認識・理解)
- αダイバージェンスに基づく単語連想と文書分類への適用(テーマ関連セッション3)
- 確信度推定を用いた複数分類器の結合 (「Web情報処理」および一般発表)
- Web検索を用いたテキストセグメンテーション (特集 いまだかつてない検索サービス実現に向けたWebコンピューティング技術)
- 単語概念ベクトルを用いた文書群からの代表語抽出(テーマ,膨大なデータから学ぶもの)
- 話題構造抽出に基づく会議音声インデクシング
- 競合学習を用いたエントロピー最小基準クラスタリング法(一般,First Person Visionのための認識・理解)
- 競合学習を用いたエントロピー最小基準クラスタリング法(一般,First Person Visionのための認識・理解)
- 全単語間共起を考慮した概念ベース生成手法(一般,First Person Visionのための認識・理解)
- 大語彙連続音声認識を用いた音声・映像コンテンツのインデクシング
- 3D-6 絵文字を考慮したテキスト解析の研究(自然言語処理(1),一般セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 単語・意味属性間共起に基づくコーパス概念ベースの生成方式
- 未知語の概念ベクトル推定手法(知識獲得,知識表現,生成)
- 未知語の概念ベクトル推定手法(知識獲得,知識表現,生成)
- 全単語間共起を考慮した概念ベース生成手法(一般,First Person Visionのための認識・理解)
- D-5-5 クエリログを利用した未知語抽出手法(D-5. 言語理解とコミュニケーション,一般セッション)
- 学習データのクラスタリングを用いた文書分類(手法検討,ライフログ活用技術,オフィス情報システム,ライフインテリジェンス)
- 単語間の階層関係に基づくテキスト分類方式(一般セッション,センシング技術とその応用)
- F-4 概念ベクトルによるトピックセグメンテーションのニュース音声への適用(音声・音声言語情報処理,F.音声・音楽)
- 単語間の階層関係に基づくテキスト分類方式(一般セッション,センシング技術とその応用)
- 単語・意味属性間共起に基づく単語間の階層関係の抽出(言語理解とオントロジーシンポジウム)
- 文書クラスタリングアルゴリズムと基準の比較 (パターン認識・メディア理解)
- 文書クラスタリングアルゴリズムと基準の比較 (データ工学)
- 単語・意味属性間共起に基づく概念ベースの拡張方式
- クラスタ内変動最小基準に基づくテキストセグメンテーション(自然言語)
- クラスター内変動最小アルゴリズムに基づくトピックセグメンテーション
- 単語の概念ベクトルを用いたテキストセグメンテーション(21世紀のグループウェア)
- インスタント質問文検索システムの提案(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- インスタント質問文検索システムの提案(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 文書クラスタリングアルゴリズムと基準の比較(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 文書クラスタリングアルゴリズムと基準の比較(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 単語概念ベクトルを用いた文書群からの代表語抽出
- 単語概念ベクトルを用いた文書群からの代表語抽出