名詞の文書内頻度を利用したテキストセグメンテーション
スポンサーリンク
概要
- 論文の詳細を見る
計算機可読な文書が増大しつつある現在,利用者がこれらから効率良く情報を得るための支援システム・ツールが必要不可欠である.特に,話し言葉からの書き起こし文書(座談会など)では,段落などの構造や章見出しなど基本的な情報が存在しないため,文書検索などのためにもこれらを自動的に得ることが重要となる.本研究では,このような書き起こし文書を対象とし,文書解析の重要な要素である段落分割について検討する.手法としては,情報検索で良く用いられるtfやidfという数値を用い'シソーラス情報を用いずとも比較的良好な結果を得ることが出来ることを確認した.
- 一般社団法人情報処理学会の論文
- 1997-01-20
著者
関連論文
- シナリオ文書からの存在・行動マップの作成とその応用
- 複数マニュアルの自動ハイパーテキスト化における類似度計算手法について
- 自動ターム抽出における重み付け方法の比較
- 日本語マニュアルの内容検索システム
- 情報検索手法を利用した関連マニュアル群のハイパーテキスト化 (新しいシステムソフトウェア)
- 電子化マニュアルにおける自動ハイパーテキスト化手法
- シナリオを用いたドラマのシーン検索システム
- 座談会 「人工知能研究の現状と問題点」
- 日本語マニュアル文におけるアスペクト辞の意味について
- 座談会 人間の知能と機械の知能 : 1986年9月6日 於:北海道大学