単語の連想関係に基づく情報検索システムInfoMAP
スポンサーリンク
概要
- 論文の詳細を見る
情報検索の対象となるテキスト文書は単語の集まりから構成されており、単語の意味表現は情報検索システムの基礎として重要である。本研究では、コーパスにおける単語の共起関係から導出した多次元の単語ベクトルで単語の意味を表現する。単語ベクトルをアプリケーションで利用する場合には、ベクトルの次元の大きさが問題となる。我々は単語ベクトルの次元を縮退させるために特異値分解(SVD)を用いる。また、単語ベクトルを文脈ベクトルに拡張してInfoMapと呼ぶ情報検索システムを構築した。本稿では、SVDを用いた単語ベクトルの構築方法、SVDと主成分分析との関係、InfoMap情報検索システムの構成と分野依存の英語コーパスOHSUMEDを用いた予備的な実験結果について報告する。
- 一般社団法人情報処理学会の論文
- 1999-03-01
著者
-
高山 泰博
三菱電機(株)情報技術総合研究所
-
Kaufmann Stefan
スタンフォード大学言語・情報研究センター
-
Flournoy Raymond
スタンフォード大学言語・情報研究センター
-
Peters Stanley
スタンフォード大学言語・情報研究センター
関連論文
- 見出し構造を用いた情報機器操作マニュアルからの用語知識獲得方式
- D-5-2 CRM 向けテキストマイニング方式の提案
- eCRM向け概念抽出型テキストマイニング
- 1N-1 ヘルプデスク支援システムにおける用語獲得
- 対話型ヘルプデスク支援システムにお1ナる事例べース構築
- 自然言語事例ベース検索の設計支援への適用
- 自然言語事例ベースの仕様書文解析の評価
- eCRM向け概念抽出型テキストマイニング
- ヘルプデスク支援システムにおける問題解決機能
- 技術文書からの用語知識の自動獲得方式の検討(セッション2:情報のラベリングと知識の獲得,学生チャレンジ特集)
- 技術文書からの用語知識の自動獲得方式の検討(セッション2:情報のラベリングと知識の獲得,学生チャレンジ特集)
- D-5-8 表層格解析を用いた業務文書チェック方式(D-5.言語理解とコミュニケーション,一般講演)
- 10.Socio Sense : 過去9年に及ぶWebアーカイブから社会の動きを読む(第2部:情報の高信頼蓄積・検索技術等の開発,学と産の連携による基盤ソフトウェアの先進的開発)
- 5L-6 ウェブからの分析対象文書抽出手法の検討(リーディングプロジェクト e-society:WebアーカイブとWebデータ解析技術,一般セッション,リーディングプロジェクト e-society)
- D-13-8 適合性フィードバックに基づいた文書チェックルール作成支援方式(D-13.知能ソフトウェア工学,一般講演)
- D-5-6 意味構造抽出のための係り受け解析に関する考察(D-5.言語理解とコミュニケーション,一般講演)
- カタカナ異表記を考慮したユーザ辞書システムの拡張
- 専門用語辞書からの情報抽出と翻訳支援への適用
- 日英機械翻訳における数量表現処理の拡張
- D-5-7 情報検索のタスク評価手法に関する一考察(D-5. 言語理解とコミュニケーション)
- JEIDA機械翻訳システム評価基準(利用者編) : ユーザのための評価項目の作成とアンケート調査による検証
- 文字成分表型全文検索システムのSGML文書検索への拡張
- D-5-1 インタネット全文検索と関連文書検索を用いたポータル構築支援
- 自然言語事例ベースの仕様書文解析への応用
- 単語の連想関係に基づく情報検索システムInfoMAP