語彙的連鎖に基づくパッセージ検索
スポンサーリンク
概要
- 論文の詳細を見る
計算機上の文書データの増大に伴い, 膨大なデータの中からユーザの求める文書を効率よく索き出す文書検索の重要性が高まっている.最近の文書検索では, ユーザの入力したクエリーと関連の高い文書の一部分を取り出して類似度を計算するパッセージレベルの検索が注目されている.パッセージ検索におけるパッセージとは, 文書中でクエリーの内容と強く関連する内容を持つ連続した一部分のことを言う.パッセージ検索では, このパッセージをどのように決定するかが問題となる.良いパッセージを決定するためには, パッセージ自体が意味的なまとまりを形成し, パッセージの位置やクエリーや文書に応じて柔軟に設定される必要があると考えられる.本稿では, 文書中の文脈情報である語彙的連鎖を利用し, クエリーと文書の適切な類似度を計算できるパッセージ決定手法について述べる.また, このパッセージを使用し, 検索精度を向上させる検索手法について述べる.
- 一般社団法人情報処理学会の論文
- 1998-09-17
著者
-
奥村 学
北陸先端科学技術大学院大学情報科学研究科
-
望月 源
東京外国語大学外国語学部
-
岩山 真
(株)日立製作所中央研究所
-
奥村 学
北陸先端科学技術大学院大学
-
岩山 真
株式会社日立製作所中央研究所
-
望月 源
北陸先端科学技術@@S 大学院大学情報科学研究科
-
岩山 真
東京工業大学精密工学研究所:日立製作所
-
岩山 真
東京工業大学:日立製作所
関連論文
- 論文と特許を対象にした技術動向分析 第7回,第8回NTCIRワークショップ 特許マイニングタスク
- 「サ変名詞+する」から動詞相当句への言い換え
- 「サ変名詞+する」の動詞への言い換え
- 大規模クラスでの情報リテラシー教育実施に関する一考察
- 書誌情報データベースにおける非ローマンアルファベット系言語の原綴り・翻字相互変換システム
- 非ローマンアルファベット系言語の原綴り・翻字相互変換システムの構築
- 非ローマンアルファベット系言語の原綴り・翻字相互変換システムの構築(セッション1: 言語情報・情報検索)
- 対話的文書検索における文書クラスタリングの役割
- 対話的文書検索における文書クラスタリングの役割
- 特許情報処理を指向したテストコレクションの構築 : 情報検索と自然言語処理の融合を目指して(NTCIR特別セッション)
- 特許情報処理を指向したテストコレクションの構築 : 情報検索と自然言語処理の融合を目指して(NTCIR特別セッション)
- 論文と特許を対象にした技術動向分析--第7回、第8回NTCIRワークショップ特許マイニングタスク (検索の高効率化と精度向上)
- 特許コーパスを用いた検索タスクの提案
- 3C-2 転置インデックスに位置情報を付与する新手法(情報検索,一般セッション,データベースとメディア)
- ハイブリッド型文書検索システムの試作と性能評価(夏のデータベースワークショップ2007(データ工学,一般))
- ハイブリッド型文書検索システムの試作と性能評価(テキスト検索,夏のデータベースワークショップ2007(データ工学,一般))
- AAAI90
- TD-1-6 DualNAVIによる連想的テキストアクセス
- 複数の表層的手がかりを統合したテキストセグメンテーション
- EDR電子化辞書検索システム「GAEA」version1.0β 使用説明書
- 語彙的連鎖を利用した文書検索
- 最良パス探索を用いた凝集型クラスタリングアルゴリズム
- 決定木獲得アルゴリズムを用いたテキストセグメンテーション
- 重回帰分析とクラスタ分析を用いたテキストセグメンテーション
- 階層ベイズクラスタリングアルゴリズムの並列化
- 共起関係と格の重要性を考慮した音声対話文の格解析
- 語彙的結束性に基づいた語義曖昧性解消の観点から見たシソーラスの比較
- 複数の知識の組合せを用いたテキストセグメンテーション
- コーパスから二重確率的シソーラスを自動的に獲得する手法の提案
- 語彙的結束性に基づいたテキストセグメンテーション
- 音声対話理解のための言語解析法
- 語義曖昧性を考慮した有意な語彙連鎖の生成
- 格変換による単文の言い換え
- 言い替えを使用した要約の手法
- 論争支援マルチモーダル実験システム MrBengo
- 論争支援のマルチモーダル実験システム
- 英語ディクテーション学習支援システムの構築
- 適合性フィードバックの効率化について
- 適合性フィードバックの効率化について
- Finch, S. : Exploiting Sophisticated Representations for Document Retrieval, Proc. 4th Conf. on Applied Natural Language Processing, pp.65-71 (1994).
- 5. 比喩の計算モデル (<特集> アナロジー)
- 手がかり句を用いた特許請求項の構造解析(自然言語)
- ローカルアラインメントを用いたテキスト間の柔軟な対応付け
- 手がかり句を用いた特許請求項の修辞構造解析
- 手がかり句を用いた特許請求項の修辞構造解析
- 語彙的結束性に基づく語彙的連鎖の計算
- 語彙的連鎖に基づくパッセージ検索
- 語彙的連鎖に基づくパッセージ検索
- 語彙的連鎖に基づくパッセージ検索
- 電脳文章要約術 : 計算機はいかにしてテキストを要約するか
- 確率モデルに基づくパッセージ分類とその応用
- 確率的クラスタリングを用いた文書連想検索
- 自動文書分類のための新しい確率モデル
- 論理文法におけるギャップの扱い
- 比喩を含む言語理解における顕現性の役割
- 比喩を含む言語理解における視点の役割
- 自然言語処理のための英語文法
- 自然言語解析システムLangLAB
- 決定木学習を用いたテキスト自動要約手法に関するいくつかの考察
- 非ローマンアルファベット系言語の原綴り・翻字相互変換システムの構築(セッション1: 言語情報・情報検索)
- 日本語から手話への機械翻訳における手話単語辞書の補完方法について
- 手話表記法の提案と日本語から手話への変換方法の検討
- 増進的曖昧性解消モデルに基づいた日本語解析
- 一般化弁別ネットワークを用いた日本語解析
- 増進的曖昧性解消モデルに基づいた統合的日本語解析
- 語彙的連鎖計算プログラム Lexical Chainers version 1.50.2 マニュアル
- テキスト簡易要約器 Posum version 1.50.2 マニュアル
- 語彙的連鎖に基づく要約の情報検索タスクを用いた評価
- 読みやすさの向上と冗長性の排除を考慮した重要個所抽出型要約
- テキストを自動的に要約する技術(2)要約の善し悪しをはかる
- テキストを自動的に要約する技術(1)テキスト中の重要な文を抜き出す
- 5N-2 決定木学習を用いたテキスト自動要約手法に関するいくつかの考察
- 情報検索タスクに基づいた評価による要約手法の比較
- 情報検索タスクに基づいた評価による要約手法の比較
- Hypertextual IPALexicons brows system-HiPAL-使用説明書
- センター理論による日本語談話の省略解析
- 一般化LR構文解析法による文中の複数箇所の誤りの検出と修正
- 日本語から手話表記文への変換に関する検討
- IPAL辞書の自動的ハイパーテキスト化
- 括弧付コーパスを利用した文法獲得手法
- 矩形レイアウトモデルに基づく文書画像の領域識別 : 文書見出しの識別
- 大規模デ-タ上での効率的な検索手法について--ハッシュ,トライ
- DL-MT:文章中の情報を多面的に提示して読解を支援する
- 科学技術日本語学習支援多言語対応辞書の項目設定に関する研究
- オンライン科学技術日本語学習支援のための多言語対応辞書作成に向けて
- 日本語読解支援システム「DL」の検証 : DLで処理した文章の読解プロセスの研究(2) 漢字圏・非漢字圏・中間圏グループにおける差異
- 日本語読解支援システム「DL」の検証 : 日本語学習者の読解プロセスの研究
- F-034 統計データのRDF化のためのテンプレート(F分野:人工知能・ゲーム)