検索質問文書の主題分析に基づく類似文書検索(セッション4 : 情報検索)
スポンサーリンク
概要
- 論文の詳細を見る
類似文書検索において、検索質問文書内に記述されている複数の主題要素を抽出し、主題要素ごとの検索結果と、記述特徴を考慮した主題重要度を用いた高精度な検索手法を提案する。主題要素別に、検索要求の生成、検索と主題要素重要度の付与を行い、主題要素重要度を加味した統合により最終検索結果を出力するものである。特に、本手法を特許の請求項を入力とする無効資料調査特許検索に適用する。従来の語の出現頻度の情報と、特許文書での請求項の前提部分や本質部分といった記述形式や構造情報を用いて、各構成要素重要度の算出を行う。 5年分の特許文書データを用いた評価実験により、提案手法が従来手法より高精度な検索が可能であることを示す。
- 一般社団法人情報処理学会の論文
- 2004-05-13
著者
-
石川 徹也
東京大学史料編纂所・前近代日本史情報国際センター
-
藤井 敦
筑波大学大学院図書館情報メディア研究科
-
石川 徹也
筑波大学大学院図書館情報メディア研究科
-
高木 徹
NTTデータ技術開発本部
-
高木 徹
(株)nttデータ技術開発本部
-
藤井 敦
筑波大
関連論文
- 「歴史知識学」の特集にあたって(歴史知識学)
- 論文と特許を対象にした技術動向分析 第7回,第8回NTCIRワークショップ 特許マイニングタスク
- 伝統的モンゴル語と現代モンゴル語を対象とした双方向的な翻字手法(自然言語)
- 栄養素等摂取バランスを考慮した料理レシピ検索システム(コンテンツ技術,Web情報システム)
- 中国語への翻字における確率的な漢字選択手法(自然言語処理)
- 中国語への翻字における漢字選択の手法(意味・応用)
- 中国語への翻字における漢字選択の手法(意味・応用)
- モンゴル語コーパスからの外来語抽出
- 言葉の印象に基づく自動翻字手法
- 伝統的モンゴル語の電子化方式とテキスト検索への応用(自然言語処理)
- E-021 World Wide Webを用いたヘルプデスク指向の質問応答システム(E分野:自然言語)
- D-030 小説テキスト自動分類のためのジャンル推定と人物抽出(D分野:データベース)
- テキスト情報を対象としたハイブリッド型情報推薦システムにおける擬似投票方式(社会人学生論文)
- 検索質問の主題分析に基づく類似文書検索と特許検索への応用(情報検索)
- アイテムの主題分析に基づく協調フィルタリングシステムの推薦予測方式(フィルタリング、文書分類)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- アイテムの主題分析に基づく協調フィルタリングシステムの推薦予測方式(フィルタリング、文書分類)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- Webマイニングによる事典的コンテンツの構築と多様なアクセス手法(インターネット環境のコンテンツ技術及び一般)
- 検索質問文書の主題分析に基づく類似文書検索(セッション4 : 情報検索)
- 検索質問文書の主題分析に基づく類似文書検索(セッション4 : 情報検索)
- ユーザ投票と情報アイテム間類似度を併用した情報推薦システム : 擬似投票方式の提案と評価(セッション4 : コンテンツ配信と情報推薦)
- 複数Webページの要約による用語説明の自動生成(ツール,質問応答,要約)
- アイテムの主題分析に基づく協調フィルタリングシステムの推薦予測方式
- 日英特許公報を用いた対訳辞書および翻訳メモリの構築
- 説明の観点に基づくテキストの分類と要約(文書分類・要約)
- 現代モンゴル語コーパスからの外来語抽出と日蒙対訳辞書の構築
- 特許情報を用いた辞典検索システム(情報検索)
- 特許情報を用いた辞典検索システム(情報検索)
- 4U-4 料理レシピを対象とした関連検索システム(文書の分類と検索,学生セッション,人工知能と認知科学)
- 4ZK-1 時事問題に対する賛否両意見の自動収集手法(情報爆発時代におけるテキストデータ処理,学生セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 時事問題に関する賛否両意見の収集(評判分析・文脈解析)
- Web検索質問の自動分類と質問応答への応用(セッション1:テキストマイニング)
- Web検索質問の自動分類と質問応答への応用(セッション1:テキストマイニング)
- 中国語への翻字における関連語抽出の効果(翻訳・多言語化)
- 中国語への翻字における関連語抽出の効果
- 百科事典としてのWWW(WWW上の情報の知的アクセスのためのテキスト処理)
- 1.キーワードサーチを超える情報爆発サーチ : 自然言語処理で価値ある未知をマイニング(パートI:情報爆発時代における新しい基盤技術,情報爆発時代におけるわくわくするITの創出を目指して)
- 歴史知識Ontology構築の研究 : その論理と実際
- WWWは百科事典として使えるか? : 大規模コーパスの構築
- World Wide Webを用いた事典知識情報の抽出と組織化
- 技術文書を対象とした言語横断情報検索のための複合語翻訳
- 日本語複合語の自動分割と日英語基対訳辞書の作成
- 日米対応特許コーパスを用いた対訳抽出手法
- 日米対応特許コーパスを用いた対訳抽出手法
- 質問応答における常識的な解の選択と期待効用に基づく回答群の決定(質問応答)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- 質問応答における常識的な解の選択と期待効用に基づく回答群の決定(質問応答)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- N-gramの部分的強調による定型表現への言語モデル適応手法(音声,聴覚)
- 講演音声の認識における言語モデルのタスク適応
- 音声入力型情報検索のための自由発話収録
- 単語の共起関係と構文情報を利用した単語階層関係の統計的自動識別
- LF-001 事典コーパスを用いた単語階層関係の統計的解析(F. 人工知能)
- D-5-3 教育コンテンツの構造に着目した分類手法
- 教育コンテンツの特徴を利用した自動分類
- 教育コンテンツの特徴を利用した自動分類
- 教育コンテンツの特徴を利用した自動分類
- 意味情報に基づく検索と全文検索の統合
- 意味情報に基づく検索と全文検索の統合
- 地形図の地図記号のための認識要素
- SGMLによる『情報管理』誌の冊子体・電子版同時作成の開始と全文検索の試み
- SGMLによる「情報管理」誌の冊子体・電子版同時作成の開始と全文検索の試み
- 新時代における情報提供術 : 全文データベースの事例紹介
- シソーラス掲載語の重要性を考慮した文書スコアリング
- フルテキストと抽出キーワードを利用した情報検索
- フルテキストと抽出キーワードを利用した情報検索
- 単語出現共起関係を用いた文書重要度付与の検討
- 特許調査を効率化する請求項理解支援機能
- NTCIR-3 ワークショップにおける音声入力型ウェブ検索タスク
- 歴史オントロジー構築のための史料からの人物情報抽出
- 情報フィルタリングの利用システム : 情報推薦システム(情報のフィルタリング)
- 部分N-gram頻度情報を利用した質問応答定型表現への言語モデル適応
- 音声入力型テキスト検索システムのための音声認識
- 音声入力型文書検索システムの開発とテストコレクションの構築
- 絵本に関する知識データに基づく質疑応答システムの研究
- 確率モデルを用いた日本語ゼロ代名詞の照応解析
- 特許検索における分類手法の比較評価
- E-5 多言語特許検索システムの開発と評価(要約・情報検索,E.自然言語・文書)
- 日米対応特許データに基づく対訳自動抽出
- 日本語形態素・構文解析システムJEMONIの開発と評価について
- 多言語情報検索のための複合語翻訳
- ユーザの情報利用目的に基づく検索システム
- 多言語情報検索のための複合語翻訳
- ユーザの情報利用目的に基づく検索システム
- 未知語検出を用いた語彙統制のない音声検索
- TRC(ADEAC=自治体史テキスト検索および編纂史料閲覧システム) (業者プレゼンテーション)
- 音声文書検索を用いたオンデマンド講義システム
- 音声文書検索を用いたオンデマンド講義システム
- 音声文書検索を用いたオンデマンド講義システム
- 質問翻訳と文書翻訳を統合した日英言語横断情報検索
- World Wide Webを利用した百科事典的知識の収集法 (テーマ:「エージェント技術:基礎と応用」および一般)
- 日立デジタル平凡社『世界大百科事典』の研究利用事例 (特集 デジタル百科への期待)