2000-DBS-122-47 構造化文書をランキング可能な全文検索システム
スポンサーリンク
概要
- 論文の詳細を見る
近年, Webコンテンツの記述の枠組みとしてXMLが注目を集めている.一般的なWebコンテンツとしてのXML文書の検索においては, 文書構造と文書内のテキストに記述された内容に基づく検索結果のランキング機能を実現することが重要である.本稿では, まず, WebコンテンツとしてのXML文書を検索対象とする全文検索システムへの要求条件を明らかにする.次に, この要求条件を満たすものとして, フォーマットファイルに記述された1)検索対象とするXML文書の部分構造, 2)インデクスファイルの形式, 3)単語の抽出方法の指定に基づき, インデクスファイルを作成する全文検索システムを提案する.
- 一般社団法人情報処理学会の論文
- 2000-07-26
著者
-
林 良彦
日本電信電話株式会社nttサイバースペース研究所
-
林 良彦
Nttサイバースペース研究所
-
菊井 玄一郎
Atr音声言語通信研究所
-
菊井 玄一郎
NTTサイバースペース研究所
-
富田 準二
NTTサイバースペス研究所
-
富田 準二
日本電信電話株式会社nttサイバースペース研究所
関連論文
- 特徴的部分文字列と共起情報を用いた固有表現の詳細ラベル付与 (言語理解とコミュニケーション)
- 音声認識を用いたマルチメディアコンテンツのインデクシング
- WordNet名詞データの日本語化とその利用
- 情報探索におけるGUIに関する一考察
- 機械翻訳システムに対する利用者適応の分析 : 異文化コラボレーションを目指して(一般 : データマイニングI)
- トピックと属性を用いたブートストラップ法に基づく語彙獲得
- 特徴的部分文字列と共起情報を用いた固有表現の詳細ラベル付与
- D-14-11 音声認識結果の単語系列の言語的妥当性に基づく正誤判定(D-14. 音声・聴覚)
- 特別編 : オンラインジャーナルを利用しよう!
- 小特集「マルチリンガル情報アクセス」の企画・編集にあたって
- マルチリンガル情報アクセス
- グラフモデルの提案とテキスト検索システムへの適用による評価
- 2000-DBS-122-47 構造化文書をランキング可能な全文検索システム
- DE2000-69 構造化文書をランキング可能な全文検索システム
- 多言語分散情報検索アーキテクチャに関する検討
- 多言語分散情報検索アーキテクチャに関する検討
- SLP・NL合同セッション「ここまでできるぞ音声/言語処理技術」 : 言語編 : 5 クロスリンガルWWWサ-チエンジンTITAN
- 検索結果の再構成によるナビゲーション支援
- トレンド・トラッキング型テキスト自動分類の試み
- トレンド・トラッキング型テキスト自動分類の試み
- インターネットと多言語情報処理 (<特別論説>情報処理最前線)
- インターネット情報探索システムTITANとその可視化手法
- WWW 情報空間における Resource Discovery と Navigation 支援
- 日本文推破支援システムにおける書換え支援機能の実現方式
- 連体節の切り離しによる複文の分割翻訳
- P.N.ジョンソン=レアード 著, AIUEO訳, "メンタルモデル" 産業図書, A5判, 602p,, \5,600, 1988
- SLP・NL合同セッション「ここまでできるぞ音声/言語処理技術」 : 言語編
- SLP・NL合同セッション「ここまでできるぞ音声/言語処理技術」 : 言語編 : 1 言語処理技術の現状
- 説明的テキストにおける文の連接関係の解析手法
- 順序保存ダイジェスト法によるWebページ間の部分複製検出
- 文脈的素性を用いた固有表現間の関係性判定
- リッチアノテーション : 固有表現に焦点をあてた知識抽出の試み(情報抽出(テーマセッション2))
- リッチアノテーション : 固有表現に焦点をあてた知識抽出の試み(情報抽出(テーマセッション2))
- 3D-7 地理的距離と有名度を用いた地名の曖昧性解消(自然言語処理,一般セッション,人工知能と認知科学)
- テキストからの知識抽出による新しいWeb情報アクセスに向けて (特集 ポータルサービスを支える自然言語処理技術)
- 大語彙連続音声認識を用いた音声・映像コンテンツのインデクシング
- クロス言語情報検索と多言語情報アクセスシステム (特集論文1 高度検索技術)
- D-14-19 ニュースコンテンツにおける音響信号自動判別の検討
- F-4 概念ベクトルによるトピックセグメンテーションのニュース音声への適用(音声・音声言語情報処理,F.音声・音楽)
- WWW上の検索サービスの技術動向
- 探索ロボットに基づくWWWサーチエンジン : TITANを中心に
- 技術文章向けの日本文推敲支援システムの実現と評価
- 92-39 自然言語テキストのロバストな処理
- 日本語受動文の能動化可否判定アルゴリズムの検討
- 接続構造解析に基づく日本語複文の分割
- 91-31 語彙的結合関係による構文多義の解消
- 文分割における連用中止表現の扱い
- 日本語受動文の能動化可否判定アルゴリズムの検討
- 日本語不適性表現の検出機構
- 89-9 テキストからの語彙知識の獲得
- 言語における話者の認識と多段翻訳方式
- 日英翻訳システムALT-J/Eにおける日本語解析技術
- 多言語情報アクセスシステム (特集 ポータルサービスとその高度化技術)
- 主題グラフ及び関連度情報からの単語重要度付与を用いた情報検索システムの提案
- 主題グラフ及び関連度情報からの単語重要度付与を用いた情報検索システムの提案
- 公共の場でのインタラクティブメディア実証実験「みらいチューブ」実験報告(MBL4:アプリケーション/実証実験)
- 公共の場でのインタラクティブメディア実証実験「みらいチューブ」実験報告(MBL4:アプリケーション/実証実験)
- 言語の壁を越えて文書を検索する : クロスランゲージ情報検索(マルチリンガル情報アクセス)
- トピック情報を用いたブートストラップ法に基づく語彙獲得