隣接ページのクエリ尤度を考慮した文書特徴付け手法の実装とその評価
スポンサーリンク
概要
- 論文の詳細を見る
検索エンジンを通してユーザの情報要求を満たす情報を返すためには,各々の文書の内容を正確に考慮した特徴付けを行い順位付けする必要がある.文書検索技術には TF-IDF 法のような経験則的に得られた手法が用られてきたが,近年の研究では確率的言語モデルを用いた情報検索が主流となり, また検索精度も向上していることが確認されている.この検索モデルでは,文書に対してクエリが生成される確率をクエリ尤度として算出し,このクエリ尤度が各文書スコアとされる.本稿では,この検索モデルでは考慮されていない文書間に存在する文書内容の関連性を,隣接文書のクエリ尤度を用いて考慮することによって新たな文書の特徴付手法を提案し,Web 文書検索へ応用することでその有効性を示す.
- 2009-11-13
著者
関連論文
- 分布値データに対するクラスタリング法の提案(学生研究発表賞セッション)
- 非対称可変分類法のシミュレーションによる評価
- 統計学習コンテンツの評価システム構築の試み
- 教育・学習支援のためのデータ指向統計解析環境(統計教育)
- 国勢調査の従業地・通学地集計による神奈川県内市町村の結び付きの分析(一般セッションIV)
- データ指向統計環境DoSS^@dにおけるデータ収集・登録機能(多変量解析I)
- 非階層的クラスター化法を用いた非対称データの分類(一般セッション2)
- 非対称クラスター化法の評価について(日本計算機統計学会 第19回シンポジウム)
- データ・ストーリーデータベースのための統計環境とWebテクノロジー(SGセッション2, 日本計算機統計学会第18回大会報告)
- 非対称平均連結クラスター化法について(セッション1, 日本計算機統計学会第18回大会報告)
- 可変分類法の非対称データへの適用及びその分類結果の評価(数量化・MDS)
- 社会ネットワークデータのクラスタリング(非対象データの分析, 第32回 日本行動計量学会大会発表一覧)
- 平均連結クラスター化法による非対称データの解析(非対象データの分析, 第32回 日本行動計量学会大会発表一覧)
- 解析ストーリーに基づく統計学習システム
- 社会ネットワークデータのクラスタリング(非対称データの分析)
- 平均連結クラスター化法による非対称データの解析(非対称データの分析)
- データ・ストーリーデータベースのための統計環境とWebテクノロジー(SGセッション2)
- 非対称平均連結クラスター化法について(セッション1)
- 統計データのデータベースと解析ストーリーの多角的利用
- D-4 データ(シナリオ/ストーリ)に基づく統計学習システムの構築(企画セッション:ネットベースの統計環境の利用と応用)(2003年度統計関連学会連合大会記録(日本統計学会第71回大会))
- Webベース統計解析システムの開発
- Webディレクトリの階層構造を利用した検索対象文書の分野推定に基づいた言語横断情報検索
- 大規模XMLデータに対する分散問合せ処理の効率化(XML,テーマ : 「デジタルアーカイブの活用(応用)」および一般)
- B-2 共同利用のための統計分析ライブラリの構築(日本統計学会第67回大会記録 : 統計科学情報の高度利用(1))
- ユーザからの負担なく構築したプロファイルに基づく適応的Web情報検索(コンテンツ技術,Web情報システム)
- 情報探索技術を用いたXML部分文書の探索手法
- 検索結果を統合するための関数選択手法(マルチメディア)(夏のデータベースワークショップDBWS2004)
- 検索結果を統合するための関数選択手法(セッション8A : マルチメディア)(夏のデータベースワークショップ : DBWS2004)
- 大規模XMLデータに対する分散問合せ処理の効率化(XML,テーマ : 「デジタルアーカイブの活用(応用)」および一般)
- XML文書検索システムにおける文書内容の統計量を利用した検索対象部分文書の決定(コンテンツ技術, Web情報システム)
- Prologを使ったRDFデータからのユーザ指定による文書構築(セッション4 : XML・構造化文書の蓄積とアクセス)
- Prologを使ったRDFデータからのユーザ指定による文書構築(セッション4 : XML・構造化文書の蓄積とアクセス)
- 自動化・統合化された Web サービス動的実行システム(情報システム開発の支援環境と手法)(情報システム論文)
- キーワードに基づいた部分文書検索における解答部分文書が持つ性質の分析(Web,XML,文書検索)(データ工学,ディペンダビリティ,一般)
- キーワードに基づいた部分文書検索における解答部分文書が持つ性質の分析(Web,XML,文書検索)(データ工学,ディペンダビリティ,一般)
- M-074 移動端末のためのトポロジ変化に強いクラスタリング手法(M.ネットワーク・モバイルコンピューティング)
- E-006 文書構築のためのツールとしてのProlog(E.自然言語・文書・ゲーム)
- キーワードを利用したXML文書検索
- 移動オブジェクトのクラスタリング手法に関する一提案(知識の蓄積と活用)(ユビキタス社会における情報流通および一般)
- 検索結果を統合するための情報量の概念を考慮したスコア正規化手法
- ハイパリンクで結ばれた隣接ページの内容に基づくWebページのためのTF-IDF法の改良(情報検索・文書分類)
- クラスタリングされた大量データの低次元表示法
- 木構造変量を含むシンボリックデータに対する非階層的クラスター分析法(セッション2B)
- 非対称グラフに対するLayeredクラスタリング法について(セッション2B)
- 区間代数のヒストグラムデータへの拡張(セッション3A)
- 複旋律音楽を対象とした楽曲検索システムのためのGTTM適用の検討(音楽検索)
- 6S-8 複数の重みを保持した木構造データに対する類似度算出法の検討(XML・グラフデータベース,学生セッション,データベースとメディア,情報処理学会創立50周年記念)
- 5S-9 複数評価項目を考慮した推薦手法の提案(情報推薦(2),学生セッション,データベースとメディア,情報処理学会創立50周年記念)
- 3Q-4 隣接文書の特徴を考慮した文書特徴付け手法の精度比較(情報抽出,学生セッション,データベースとメディア,情報処理学会創立50周年記念)
- 隣接ページのクエリ尤度を考慮した文書特徴付け手法の実装とその評価
- 索引語の統計量を用いたXML部分文書検索法の組合せ利用とその効果
- 索引語の統計量を用いたXML部分文書検索法の組合せ利用とその効果
- 2.非対称k-medoids法を用いたWikipedia XMLコーパスの分析(特別セッション 非対称データの解析I)
- 3ZA-2 他者の意見を反映した洋服コーディネート推薦システム(情報社会を支える技術(2),学生セッション,コンピュータと人間社会)
- 3ZA-1 ワンルーム型居住空間における家具配置支援システム(情報社会を支える技術(2),学生セッション,コンピュータと人間社会)
- XML情報検索における構造問合せを利用した部分文書スコアリング(DE-2検索とXML文書処理,インターネット環境でのデータ工学とディペンダビリティ,及び一般)
- XML情報検索における構造問合せを利用した部分文書スコアリング(DE-2検索とXML文書処理,インターネット環境でのデータ工学とディペンダビリティ,及び一般)
- XML検索(私のブックマーク)
- XML文書における要素名と文書構造を利用した情報フィルタリング
- 非対称階層的重複クラスタリング法の提案(非対称データの解析III,日本行動計量学会 第38大会 抄録集)
- 3次元自己組織化マップに基づく文書のブラウジングと検索
- 統計学習コンテンツの評価システム構築の試み
- B-1 Webを利用した教育用データ公開システムの構築(統計分野におけるインターネットの活用(1))(日本統計学会第69回大会記録)
- Webを利用した教育用統計データ公開システムの構築
- 系統計教育におけるデータ収集・登録機能の活用 : モバイル統計解析システム構築の試み
- データ(シナリオ/ストーリー)に基づく統計学習システムの構築
- データ・解析事例データベースの構築
- 歴史的文献画像のための電子スクラップブックシステム
- 歴史文献画像に関する注釈の管理と再利用
- 非対称凝縮型階層的分類法の更新式と単調性について
- 階層的クラスター化法の許容性と空間のゆがみについて(第12回日本計算機統計学会大会報告)
- 階層的クラスター分析における空間の歪みとその調整 (第11回日本計算機統計学会シンポジウム報告)
- 組合せ的階層分類法における空間の歪みについて
- 凝縮型階層的クラスター化法における許容性の基準について
- 階層的クラスター化法の許容性と空間のゆがみについて
- 階層的クラスター分析における空間の歪みとその調整
- 外部委託率に着目したソフトウェアプロジェクトの生産性分析
- Adaptive Web Search Considering User's Ephemeral and Persistent Preferences
- Improvement in TF-IDF scheme for Web Pages and its Retrieval Accuracy
- 部分グラフを基本単位としたWeb文書検索 : 単語の出現密度分布の適用
- 自己組織化マップと検索エンジンを用いたWeb文書の分類ビュー機構
- 自己組織化マップと適合フィードバック機能を用いたWeb文書群の分類ビュー機構について
- 部分グラフを基本単位とするWeb文書群の検索モデルと自動分類について
- 自己組織化のマップを用いたWeb文書の対話的分類とその視覚化
- 多段階自己組織化マップによるビデオ映像記述支援と類似シーン検索(新世代ダータベース技術 : インターネット・マルチメディア・モーバイルを中心として)
- 映像データベースの内容記述へのコンテンツ情報の応用
- DLLSA : Dynamic Link Libraryを用いた統計解析ライブラリ
- B-1 統計総合サイトの役割と機能 : 分析, 教育, 書籍のオンライン化を通して(日本統計学会第68回大会記録 : 統計科学情報の高度利用)
- 統計分析のライブラリの構築について(第13回日本計算機統計学会大会報告)
- 統計総合サイトの役割と機能 : 分析, 教育, 書籍のオンライン化を通して
- 統計分析ライブラリの構築について
- 高校における統計教育の展望について
- 視覚化法を用いた野球配球の特徴把握 : 多元データを用いたアプローチ(Session 4A(スポーツ統計))
- 符号付有向グラフによる社会構造の分析(特別セッション 非対称データの解析(1))
- 単相3元非対称(非)類似度データに対するクラスタリング法について(一般セッション 数学・統計(5))
- 符号付有向グラフを用いた非対称データの視覚化(特別セッション 非対称データの解析(2))
- 文理融合系学部におけるデータサイエンス教育の試み : ゆとり世代から新指導要領世代へ(特別セッション 新指導要領を踏まえた大学における統計教育の動き)
- 対象の分類を伴う多重対応分析法(学生研究発表賞セッション,セッション1B)
- SC5-5 経時的に得られた非対称非類似度データに対するトレンドとばらつきを考慮した多次元尺度構成法について(特別セッション 非対称データの解析(1))
- カテゴリカル3相3元データの分析法について(セッション1B 学生研究発表セッション)