Document Query by Example文書の例示検索
スポンサーリンク
概要
- 論文の詳細を見る
インターネットの爆発的な普及によって、これまで情報検索に縁のなかった一般の人が情報検索を行いたいという要求が生まれている。現在の代表的な情報検索システムは、キーワード検索と全文検索が存在するが、どちらの検索法でも非専門家の検索要求に応えることは難しい。 現在のキーワード検索においては検索に用いるキーワードの選定には、サーチャー的な専門性が要求される。全文検索においては、より一般的ではあるが、適切な検索要求を指示することは依然として、一定程度の専門性を要求されることには変わりない。そこで専門性を必要としない検索システムが求められる。 全文検索システムの代表的なアクセス法としては、シグナチャの研究は存在するが、日本語文書を対象として実証的に構成した例は少ない。同時に曖昧な検索を許容する例も少ない。この論文では、検索対象の例示となり得る文書を指示し、この文書に類似した文書をその類似度のランク付けを含めて検索可能な検索・アクセス手法を提案する。この論文では、1文字漢字と2文字漢字の度数分布を統計的に求め、基本漢字シグナチャを階層的に構成する。各文書毎に1文字と2文字の基本シグナチャ上の度数分布を作成し、特徴ファイルとする。類似度検索は指定文書と検索対象文書との距離を特徴ファイルを用いた情報量基準をもとに計算し、この値で行う。
- 一般社団法人情報処理学会の論文
- 1996-03-06
著者
-
芝野 耕司
東京国際大学商学部所属
-
芝野 耕司
東京国際大学 商学部 経営情報学科
-
木村 浩明
東京国際大学 商学部 経営情報学科
-
湯浅 聖記
東京国際大学 商学部 経営情報学科
-
堀口 雅祥
東京国際大学 商学部 経営情報学科
関連論文
- マルチメディア著作権保護のための PGP を用いたシグネチャーマスキング法
- Drag and Dropを用いたSQL問合せの生成
- バーチャルライブラリへの試み
- お節介データベースにおける問合せ処理
- Document Query by Example文書の例示検索
- マルチメディアスクリプティング環境におけるアイコンプログラミング
- WWWサービスに対する構造をもった全文検索サポート
- 一般講義支援の電子ホワイトボードシステム
- アイコン化とスクリプトエディタを備えた教育用AV制御システム
- ネットワークを利用したビジネスゲーム
- コンピュータ支援によるオーディオビジュアルランゲージラボラトリ(CAVLL)
- SGMLの現在 (特集:編集工学-DTPとSGML-)
- アニメーテッドファインダへの試み
- プログラムパブリッシングシステム
- モーフィング付きスケルトントゥイーニング
- 仮名漢字変換システムの現状
- エディタ設計のためのユーザビヘービアの評価 : インテリジェントエディタCLOEの設計
- エディタ設計のためのユーザ・インタフェース評価 : インテリジェント・エディタCLOEの開発
- robot と Hot Sauce を用いた個人 Home Page 環境管理
- 3.マルチメディアデータベースSQL/MMの標準化 (データベース関連技術の標準化)
- 2.SQL-92の追加機能とSQL3 (データベース関連技術の標準化)
- SMDLからMusic TEXへの電子化テキストの変換
- MIDIインプロバイザーの作成
- デ-タベ-ス言語SQLのフル言語拡張 (新しいデ-タベ-ス技術論文特集)