グラフモデルの提案とテキスト検索システムへの適用による評価
スポンサーリンク
概要
- 論文の詳細を見る
文,文書,文書集合間の類似性を判定することは,テキスト検索,情報フィルタリング,文書のカテゴリ分け,文書クラスタリング等の要素技術である.我々は,このような文書間の類似性判定のための新しいモデルとして,グラフモデルを提案する.グラフモデルは,単語の重要度をノードの重みとし,単語間の関連度をリンクの重みとしたグラフによって文書の主題を表現し,これらグラフ間の類似度計算によって文書間の類似性判定を行うものである.本稿では,まず,グラフモデルの基本概念とその実現方法について述べる.次に,グラフモデルを実際にテキスト検索システムに適用し評価を行う.その評価結果から,特に1つの文書内に複数の主題を持つ文書(Webページ等)や,文書集合(ユーザプロファイル,分類カテゴリの特徴,クラスタ等)を対象とした場合に,グラフモデルがベクトル空間モデルよりも精度の高い類似性判定ができることを示す.さらに,関連度のインデクスを前処理で作成することによって,リアルタイムの類似性判定が必要となるテキスト検索システム等にも,本手法の適用が可能であることを示す.
- 一般社団法人情報処理学会の論文
- 2002-03-15
著者
-
池田 哲夫
岩手県立大学大学院ソフトウェア情報学研究科
-
竹野 浩
日本電信電話株式会社NTTサイバーソリューション研究所
-
池田 哲夫
日本電信電話株式会社nttサイバースペース研究所
-
菊井 玄一郎
ATR音声言語コミュニケーション研究所
-
林 良彦
日本電信電話株式会社nttサイバースペース研究所
-
菊井 玄一郎
Atr音声言語通信研究所
-
富田 準二
日本電信電話株式会社, NTTサイバーソリューション研究所
-
富田 準二
日本電信電話株式会社nttサイバースペース研究所
-
富田 準二
日本電信電話株式会社 Nttサイバーソリューション研究所
-
林 良彦
日本電信電話(株)nttサイバースペース研究所
関連論文
- 音声認識を用いたマルチメディアコンテンツのインデクシング
- 携帯型端末を用いた音声自動翻訳システムとフィールド実験(モバイルと放送の融合時代を迎えて(1セグ放送, モバイル放送, 携帯放送融合サービス, 1セグ対応携帯端末, モバイルコンテンツと放送コンテンツの融合, マルチメディア配信, ディジタル放送受信機, および一般))
- コンビニエンス・ストアにおける新商品発売時のデータマイニングを用いた売れ行き予測(データマイニング)
- 遠隔DBアクセスの実現方式
- 品詞の組合せの拡張による看護学分野での専門用語抽出再現率の改善(情報抽出,夏のデータベースワークショップDBWS 2006)
- 品詞の組合せの拡張による看護学分野での専門用語抽出再現率の改善(情報抽出)
- Webページ集合からのサイト再構成の一手法(高速ネットワークとマルチメディアアプリケーション)
- 機械介在対話方式による音声データの収集
- Web文書のページタイプを用いた適応約分類と試作システムの評価(Webインテリジェンスとインタラクション)
- 複数のマルコフモデルを用いた階層化言語モデルによる未登録語認識(音声、聴覚)
- 連続音声認識システムにおけるfactoringテーブルのコンパクト化と不要単語仮説のガーベジコレクション
- 文認識率の向上に向けたFSAとNGRAMの併用モデルによる大語彙連続音声認識
- ROVER法を用いた音声認識結果の統合と誤認識文のリジェクション
- 文クラスタリングによる複数言語モデルを用いた誤認識文の推定
- サブワードモデルを用いた未登録語認識の効率的探索手法(音声言語情報処理とその応用)
- 後続仮説数の管理機能を用いた単語グラフの仮説数削減
- 2つの単語クラスから生じた未登録語のサブワードモデルによる音声認識
- サブワードモデルを用いた未登録語認識における効率的探索手法
- 課題遂行型対話実験による日英及び日中音声翻訳システムの評価
- 音声翻訳研究の展開(機械翻訳)
- コンビニにおける新商品発売時の売上データマイニング : 目的変数と説明変数の導出(データマイニング)(夏のデータベースワークショップDBWS2004)
- コンビニにおける新商品発売時の売上データマイニング : 目的変数と説明変数の導出(セッション8B : データマイニング)(夏のデータベースワークショップ : DBWS2004)
- ディレクトリを用いたWeb環境における地図情報提供システムの構築
- ディレクトリを用いた情報提供に関する一手法 : 地図情報への適用
- 携帯型端末を用いた音声自動翻訳システムとフィールド実験
- E-013 日本語話者の中国語運用能力との比較による日中翻訳評価の検討(E.自然言語・文書・ゲーム)
- 日本語話者の英語運用能力との比較による英日翻訳の評価(機械翻訳・言い換え)
- 地盤応答震度推定法を組み込んだ地震災害時初動活動支援システムの提案(社会・人間系の情報システム,情報社会の基礎を築く情報システム)
- 大規模用例を用いた音声認識誤り訂正の検討
- 旅行会話基本表現コーパスを用いた認識誤り訂正の検討
- 旅行会話基本表現コーパスを用いた認識誤り訂正の検討
- 旅行会話基本表現コーパスを用いた認識誤り訂正の検討
- 音声翻訳のための中国語対話コーパスの整備とその評価(マルチモーダル, コーパス・言語モデル)
- 音声翻訳のための中国語対話コーパスの整備とその評価(マルチモーダル, コーパス・言語モデル)
- 異種コーパスの組合せによるトリガー言語モデルの構築
- 異種コーパスの組合せによるトリガー言語モデルの構築
- 異種コーパスの組合せによるトリガー言語モデルの構築(言語モデル)(第6回音声言語シンポジウム)
- 異種コーパスの組合せによるトリガー言語モデルの構築(言語モデル)(第6回音声言語シンポジウム)
- 異種コーパスの組合せによるトリガー言語モデルの構築(言語モデル)(第6回音声言語シンポジウム)
- 信頼度尺度に基づく音声認識誤りの検出および誤り訂正(合成, 韻律, 生成, 一般)
- 用例型構文解析による句構造情報を利用した言語モデル
- 機械翻訳システムに対する利用者適応の分析 : 異文化コラボレーションを目指して(一般 : データマイニングI)
- 地図情報提供サービスにおける絵地図利用方式
- モバイル環境における地図情報提供サービスの一構成方式
- D-14-11 音声認識結果の単語系列の言語的妥当性に基づく正誤判定(D-14. 音声・聴覚)
- 28 常時微動H/Vスペクトル比を用いた細密度計測震度分布推定法の提案
- 常時微動データベースを用いた地震の細密度震度予測方法(A.被害予測と緊急対応)
- 文クラスタリングによる複数言語モデルを用いた誤認識文の推定
- グラフモデルの提案とテキスト検索システムへの適用による評価
- 2000-DBS-122-47 構造化文書をランキング可能な全文検索システム
- DE2000-69 構造化文書をランキング可能な全文検索システム
- 多言語分散情報検索アーキテクチャに関する検討
- 多言語分散情報検索アーキテクチャに関する検討
- SLP・NL合同セッション「ここまでできるぞ音声/言語処理技術」 : 言語編 : 5 クロスリンガルWWWサ-チエンジンTITAN
- 検索結果の再構成によるナビゲーション支援
- インターネット情報探索システムTITANとその可視化手法
- 翻訳システムを介した音声対話における相手話者音声と翻訳テキスト表示の影響について(対話)
- 翻訳システムを介した音声対話における相手話者音声と翻訳テキスト表示の影響について(対話)
- 音声インタフェースのための発話を単位とした話題及び発話行為タイプの推定(音声,聴覚)
- 音声対話処理のための発話単位のトピック推定
- 無限混合ディリクレ文書モデル(文書処理,質問応答)
- 言語表現のベクトル空間モデルにおける最適な計量距離(自然言語処理)
- 専門外の患者を抱えた医師のための, 診断や治療方針の遠方の医師への相談システム(医療データ, 夏のデータベースワークショップDBWS2005)
- 専門外の患者を抱えた医師のための, 診断や治療方針の遠方の医師への相談システム(医療データ, 夏のデータベースワークショップ2005)
- 外部連携によるビデオハイパーメディア(VHM)の高機能化
- ビデオハイパーメディア(VHM)における圧縮映像データ再生方式の一検討 : メディア再生環境の構築
- 外部WWWサーバとの連携による分散型知的CAIシステムCALATの高度化・高機能化
- データ流通プラットフォームシステム : DB-STREAM
- DB流通における更新差分データ抽出方式に関する検討
- DB流通におけるデータ抽出方式に関する考察
- DB再構築におけるDB流通システムの適用法に関する考察
- DB流通基本システム(DB-STREAM)とその適用
- DB流通の基本方式につ いて
- 大規模DB向け正規化手法
- 一貫性制約を考慮したDB概念設計法
- 分散データベースの同期制御の一方式
- 商品購入の前後関係を考慮したレコメンド方式と評価(インターネット環境のコンテンツ技術及び一般)
- 次世代コンテンツモデルMCOM
- 分散した地理情報を統合利用する情報ナビゲーションシステム
- D-4-10 複数の地図情報提供システムへの統一的アクセス方法について
- 地図連動型情報提供サービスにおける絵地図利用方式
- 地図連動型情報提供サービスにおける絵地図利用方式
- 5T-3 マルチメディアアプリケーション開発における上流工程支援手法の一検討
- マルチメディアアプリケーション開発の上流工程支援方法の考察
- マルチメディアアプリケーションのデータモデルと開発環境の考察(マルチメディア通信と分散処理)
- VHMにおけるシナリオ柔構造化実現方式の検討
- 次世代コンテンツモデルMCOM(高速ネットワークとマルチメディアアプリケーション)
- 6-1 マルチメディアコンテンツ再利用時における著作権保護方式の検討
- Multimedia Content Object Model及びその実装
- A-16-15 オブジェクト指向に基づくコンテンツ記述方式
- 連邦データベースシステムにおけるスキーマ構築の一方式
- 多様な属性表現に対応した類似検索の一手法
- 多様な属性表現に対応した類似検索の一手法
- 主題グラフ及び関連度情報からの単語重要度付与を用いた情報検索システムの提案
- 主題グラフ及び関連度情報からの単語重要度付与を用いた情報検索システムの提案
- XML文書検索エンジンLISTAとポータルサービスへの応用 (特集 ポータルサービスとその高度化技術)
- SF-025-3 肝細胞癌に対する生体肝移植後の予後因子および分子標的としてのmicroRNAに関する検討(SF-025 サージカルフォーラム(25)肝 基礎-1,第112回日本外科学会定期学術集会)
- PS-007-2 胃癌におけるトラスツズマブ治療のためのHER2判定上の問題点と対応(PS-007 胃 基礎-3,ポスターセッション,第112回日本外科学会定期学術集会)
- SF-033-5 多施設共同による膵癌術後の膵液瘻に関する危険因子と予後規定因子の解析(SF-033 サージカルフォーラム(33)膵 合併症-1,第112回日本外科学会定期学術集会)
- VSY-5-2 腹腔鏡下幽門側胃切除後のデルタ吻合の機能評価とその弱点を克服する新しい吻合法の工夫(VSY-5 ビデオシンポジウム(5)胃癌手術における再建法と機能評価,第112回日本外科学会定期学術集会)