機械翻訳を用いた英日・日英言語横断検索に関する一考察
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,日本語テストコレクションBMIR-J2およびこれを英訳したデータを用い,情報フィルタリングシステムNEATと機械翻訳システムASTRANSACによる日・英間の言語横断検索の検索精度評価実験を行う.英語検索要求による日本語文書の検索実験では,文書の日英機械翻訳と検索要求の英日機械翻訳のアプローチを比較し,前者のアプローチにより単言語検索の場合の90%以上,後者のアプローチにより80%以上の精度が実現できることを示す.さらに,日本語テストコレクションの検索要求を人手で英訳して英日言語横断検索の模擬実験を行う場合に2人の翻訳者を起用することにより,検索精度が人手による翻訳結果に大きく左右されることを示す.一方,日本語検索要求による擬似英語文書の検索実験では,検索要求の日英機械翻訳の前後にローカルフィードバックを行うことにより,単言語検索の場合と同程度の精度を実現する.これは実際の英語文書を検索対象とした場合の精度の上限を示すものと考えられる.最後に,機械翻訳精度と検索精度との関係について考察を行う.
- 社団法人情報処理学会の論文
- 1999-11-15
著者
-
酒井 哲也
株式会社東芝研究開発センター
-
酒井 哲也
(株)ニューズウォッチ
-
梶浦 正浩
株式会社東芝研究開発センター
-
住田 一男
株式会社東芝研究開発センター
-
Jones Gareth
Department of Computer Science, University of Exeter
-
Collier Nigel
東京大学工学部
-
Jones G
Univ. Exeter
-
Jones Gareth
Department Of Computer Science University Of Exeter
-
梶浦 正浩
(株)ニューズウォッチ
-
酒井 哲也
(株)東芝研究開発センター知識メディアラボラトリー
-
Jones Gareth
Research And Development Center Toshiba Corporation
-
梶浦 正浩
(株)東芝研究開発センターヒューマンインターフェースラボラトリー
関連論文
- 高精度な音声入力質問応答のための疑問表現補完(音声質問応答,インタラクションの理解とデザイン)
- 効率的な番組視聴を支援するための話題ラベルの生成とその評価(セッション2:情報のラベリングと知識の獲得,学生チャレンジ特集)
- 質問応答システムの正解順位とユーザ満足率の関係について(言い換え・質問応答)
- 固有表現抽出と回答タイプ体系が質問応答システムの性能に与える影響(自然言語処理)
- 質問応答型検索の音声認識誤りに対するロバスト性向上(質問応答・応用)
- 質問応答型検索の音声認識誤りに対するロバスト性向上
- 質問応答と,日本語固有表現抽出および固有表現体系の関係についての考察(抽出)
- 質問応答技術に基づくマルチモーダルヘルプシステム(知識の蓄積と活用)(ユビキタス社会における情報流通および一般)
- LD-8 意味役割解析に基づく高適合英語文書の検索(D. データベース)
- 機械翻訳を用いた英日・日英言語横断検索に関する一考察
- 日本語情報検索システム評価用テストコレクションの構築
- 確率モデルに基づく日本語情報フィルタリングにおけるフィードバックによる検索条件展開および検索精度評価
- Cross-language情報検索のためのBMIR-J2を用いた一考察
- 情報フィルタリングのためのブール式と文書構造を利用した検索条件生成と検索精度評価
- 日本語情報検索システム評価用テストコレクション BMIR-J2
- 情報フィルタリングシステムNEATのための検索要求文からのプロファイル生成
- ベンチマーク BMIR-J1 を用いた情報フィルタリングシステム NEAT の評価
- 情報フィルタリングシステム NEAT の開発
- 電子図書館のための効率的な文書検索 : 検索/提示のための文書構造化と抄録生成
- 自動抄録機能をもつ対話的文書検索システム : システムの機能と構成
- 趣味と仕事(平成19年度論文賞の受賞論文紹介)
- チュートリアル: 情報検索テストコレクションと評価指標
- LD-003 Evaluating the Task of Finding One Relevant Document Using Incomplete Relevance Data
- Q,Rの次はO,そしてP...(平成18年度論文賞の受賞論文紹介)
- コモンHIサービス環境の開発
- 情報フィルタリングシステムNEATのための検索要求文からのプロファイル生成
- 効率的な番組視聴を支援するための話題ラベルの生成とその評価(セッション2:情報のラベリングと知識の獲得,学生チャレンジ特集)
- 質問応答システムの正解順位とユーザ満足率の関係について(言い換え・質問応答)
- 人名と番組名の言い換えに対応する音声認識インタフェース
- 2U-3 クライアントマシンの自動設定・修復を行うヘルプデスクシステム : その2 : パッケージ化されたファイル群の差分転送方式
- 2U-2 クライアントマシンの自動設定・修復を行うヘルプデスクシステム : その1 : エンドユーザサポートに応用した場合の効果の検証
- 新聞記事からの用語定義の抽出と固有表現クラスに基づく分類(情報抽出・単語分類)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- 新聞記事からの用語定義の抽出と固有表現クラスに基づく分類(情報抽出・単語分類)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- ウィキペディアを活用した探検型検索サイトのクエリログ分析(検索・対話)
- ウィキペディアを活用した探検型検索サイトのクエリログ分析(検索・対話)
- ウィキペディアを活用した探検型検索サイトのクエリログ分析 (情報学基礎・自然言語処理)
- RD-001 クリックスルーに基づく探検型検索サイトの設計と開発(データベース,査読付き論文)
- N-008 教学支援システムに関する学生アンケートの分析(N分野:教育・人文科学)
- N-021 自然言語表現に基づく学生アンケート分析システム(N.教育・人文科学)
- 係り受け木を用いた日本語文書の重要部分抽出(要約)
- 係り受け木を用いた日本語文書の重要部分抽出(言語理解とコミュニケーション)
- AI:過去・現在・未来
- 編集にあたって(「実世界に近づくインタフェース技術」)
- 電子流通実装基盤SPAgent
- 電子流通実装基盤SPAgent
- 4P-5 医学・生物学文献からのタグ付きコーパスの作成
- 文書構造解析に基づく自動抄録生成と検索提示機能としての評価
- 文書構造に基づく自動抄録生成
- 自動抄録機能をもつ対話的文書検索システム : 自動抄録機能
- 自動抄録機能をもつ対話的文書検索システム : 検索機能
- 対話的文書検索のための文書構造解析
- 文書の構造解析に基づく文書情報検索
- 日本語論説文自動抄録システムの試作と評価
- 日本語論説文の自動抄録のための文脈構造解析
- I-003 応用規格に基づいたXML文書への変換を可能とする紙文書を対象とした階層的文書変換システム(I分野:画像認識・メディア理解)
- XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析(文書・文字メディアの認識・理解, 一般)
- XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析(文書・文字メディアの認識・理解, 一般)
- XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析
- XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析
- 表層表現抽出と文書構造解析に基づくXML文書変換システム(セッション1 : Web文書生成・管理)
- WWWにおける情報検索技術の動向
- よりよい検索システム実現のために : 正解の良し悪しを考慮した情報検索評価の動向
- The Atmosphere of AIRS : 情報検索の新しい国際会議の紹介
- レレバンスフィードバック
- WWWを対象にした情報フィルタリングサービス
- WWW情報フィルタリング・検索システム : FreshEye : 全体システムの構成と動作
- WWW情報フィルタリング・検索システム : FreshEye : サービス概要
- In contrast to anti-tumor activity, YT cell and primary NK cell cytotoxicity for Cryptococcus neoformans bypasses LFA-1
- Learning formal languages from Feasible Teachers
- Cross-Language Information Access : a case study for English and Japanese
- Cross-Language Information Access :a case study for English and Japanese
- First Experiments on the BMIR-J2 Collection using the NEAT System
- 知的情報検索の動向
- 文の意味役割解析に基づく全文検索
- 文の意味解析に基づく全文検索
- 対話的抄録生成機能を持つ文書検索システム
- LD_007 NTCIR公式結果に基づく文書検索技術の進歩に関する一考察(D分野:データベース)
- LD-002 ひとつの高適合文書を高精度に検索するタスクのための評価指標(D分野:データベース)
- 日中英3言語6方向音声翻訳システム(翻訳・要約)
- 日中英3言語6方向音声翻訳システム(翻訳・要約)
- マルチデータベース日本語インタフェースの試作 : 問合せの生成・実行
- マルチデータベース日本語インタフェースの試作 : 日本語入力文解析処理
- チュートリアル: 情報検索テストコレクションと評価指標