言語横断検索により自動収集された日英関連報道記事からの訳語対応の獲得
スポンサーリンク
概要
- 論文の詳細を見る
本論文では,WWW上の報道記事サイト等から日本語および英語など,異なった言語で書かれた文書を収集し,多種多様な分野について,分野固有の固有名詞(固有表現)や事象・言い回しなどの訳語対応を半自動的に獲得する枠組を提案する.特に本論文では,言語を横断して内容的に関連した日英報道記事を収集する手法について述べ,さらに,言語横断関連報道記事検索により自動収集された日英関連記事対から,半自動的に訳語対応を獲得する手法を提案する.評価実験においては,評価用記事集合に対して言語横断関連報道記事検索の性能を評価した後,言語横断関連報道記事検索の性能と訳語対応獲得の性能の相関について分析した結果について詳しく述べる.
- 一般社団法人情報処理学会の論文
- 2002-07-15
著者
-
千葉 靖伸
アライドテレシス株式会社
-
宇津呂 武仁
豊橋技術科学大学工学部情報工学系
-
宇津呂 武仁
筑波大 大学院システム情報工学研究科
-
堀内 貴司
豊橋技術科学大学工学部情報工学系
-
浜本 武
豊橋技術科学大学工学部情報工学系
関連論文
- 機械学習を用いた複数の大語彙連続音声認識モデルの出力の混合 : 旅行会話音声における評価
- 代表・派生関係を利用した日本語機能表現の解析
- 日本語機能表現の自動検出と統計的係り受け解析への応用
- 機能表現を考慮した統計的日本語係り受け解析(解析・対話)
- 機能表現を考慮した統計的日本語係り受け解析
- 機械学習を用いた日本語機能表現のチャンキング
- 日本語複合辞用例データベースの作成と分析(自然言語,情報処理技術のフロンティア)
- 正誤判別規則学習を用いた複数の日本語固有表現抽出システムの出力の混合
- 正誤判別規則学習を用いた複数の日本語固有表現抽出システムの出力の混合
- 正誤判別規則学習を用いた複数の日本語固有表現抽出システムの出力の混合
- ブートストラップによる低人手でコスト日本語固有表現抽出
- 統計的日本語固有表現抽出における固有表現まとめ上げ手法とその評価
- 大規模コーパスを用いた日本語機能表現呼応可能性規則の作成および日本語学習支援での利用
- カスタマイズ性を考慮した擬人化音声対話ソフトウェアツールキットの設計(音声言語情報処理とその応用)
- 擬人化音声対話エージェント基本ソフトウェアの開発プロジェクト報告(プロジェクト紹介(2))(第5回音声言語シンポジウム)
- 擬人化音声対話エージェント基本ソフトウェアの開発プロジェクト報告(第5回音声言語シンポジウム : プロジェクト紹介(2))
- 擬人化音声対話エージェント基本ソフトウェアの開発プロジェクト報告(第5回音声言語シンポジウム : プロジェクト紹介(2))
- 擬人化音声対話エージェントツールキットGalatea
- 言語横断検索により自動収集された日英関連報道記事からの訳語対応の獲得
- 言語横断検索により自動収集された日英関連報道記事からの訳語対応の獲得
- 日本語ディクテーション基本ソフトウェア(99年度版)
- 日本語機能表現辞書の編纂
- 機能表現「なら」の機械翻訳のための言い換え(言い換え,文法)
- 機械学習を用いた日本語複合辞のチャンキング(抽出, 言い換え)
- 関連用語収集問題とその解法
- ウェブから収集した専門分野コーパスと要素合成法を用いた専門用語訳語推定
- ウェブを利用した専門用語の分野判定(自然言語処理)
- 自動検出のための慣用句の分類と語彙的情報(語と慣用句)
- 音韻論的・形態論的制約を用いたモンゴル語句生成・形態素解析
- 日英関連報道記事を用いた訳語対応推定
- 質問文中のキーワードと解候補の連想の強さを用いた解の決定
- 音韻論的・形態論的制約を用いたモンゴル語形態素解析(解析)
- 音韻論的・形態論的制約を用いたモンゴル語形態素解析(解析)
- 音韻論的・形態論的制約を用いたモンゴル語句生成(機械翻訳)
- 日英二言語文書を用いた訳語対応推定 : ウェブ上の非対訳文書を用いた訳語候補順位付け(情報抽出・翻訳知識獲得)
- 日英報道記事からの訳語対応推定 : ターム頻度と訳語対応推定性能の相関の評価(情報抽出・翻訳知識獲得)
- 4択クイズを連想問題として解く(検索・多義性解消)
- 講演スタイルの解説番組を対象にした音声認識の検討
- 講演スタイルの解説番組を対象にした音声認識の検討
- 複数の大語彙連続音声認識モデルの出力の共通部分を用いた信頼度 : 信頼度を利用した複数モデルの出力の混合
- 複数の大語彙連続音声認識モデルの出力の共通部分を用いた信頼度 : 単語の特徴と信頼度の相関
- 複数の大語彙連続音声認識モデルの出力の共通部分を用いた信頼度 : 音響モデルの組合せと信頼度の相関
- 複数の大語彙連続音声認識モデルの出力の共通部分を用いた信頼度の性能分析
- 機械学習を用いた複数の大語彙連続音声認識モデルの出力の混合(音声,聴覚)
- 複数の大語彙連続音声認識モデルの出力の共通部分を用いた高信頼度部分の推定(音声, 聴覚)
- NTCIR-3音声入力ウェブ検索タスクにおける複数音声認識モデル混合の評価
- SVMを用いた複数の大語彙連続音声認識モデルの出力の混合
- 機械学習を用いた複数の大語彙連続音声認識モデルの出力の混合
- 複数の大語彙連続音声認識モデルの出力の共通部分を用いた信頼度の実験的評価
- 複数の音声認識システムの出力の共通部分を利用した確信度
- 音声入力によるWeb検索のためのキーワード認識・抽出法の改善(認識・理解・対話)
- 音声入力によるWeb検索のためのキーワード認識・抽出法の改善(認識・理解・対話)
- 講演音声における認識結果の高信頼度部分の抽出とそれを用いた教師なし話者適応(話者適応・識別)(第5回音声言語シンポジウム)
- 講演音声における認識結果の高信頼度部分の抽出とそれを用いた教師なし話者適応(第5回音声言語シンポジウム : 話者適応・識別)
- 講演音声における認識結果の高信頼度部分の抽出とそれを用いた教師なし話者適応(第5回音声言語シンポジウム : 話者適応・識別)
- 講演音声における認識結果の高信頼度部分の抽出とそれを用いた教師なし話者適応
- 音声入力によるWeb検索のためのキーワード認識・抽出法の検討