機械翻訳の品質向上のための対訳コーパスからの統計的前編集システムの自動構築
スポンサーリンク
概要
- 論文の詳細を見る
機械翻訳(MT)の品質向上のための翻訳前の書き換え(前編集)について述べる.これまでの前編集は主にルールに基づくものであるため,MTシステムに依存し,かつシステム構築に労力を要した.これに対し,本論文では,MTシステムに依存しない統計的前編集システムの自動構築手法を提案する.具体的には,対象とするMTシステムに適した前編集システムを,当該MTシステムを含む複数のMTシステムおよび対訳コーパスから自動構築する手法を提案する.本手法の最も重要な特徴は,前編集によって翻訳品質の向上が得られる学習データを自動生成できる点にある.ロイター日英記事の対応付けデータを用いて4種類の日英MTシステム用前編集システムを構築したところ,3種類のMTシステムについて,多くの文に対して翻訳品質を向上させる前編集システムが構築できた.提案手法である前編集システムの学習データの自動生成は,3種類のMTシステムの前編集システム構築に効果的であったこと,および他の1種類のMTシステムの前編集システム構築に悪影響がなかったことを示し,提案手法の有効性を示した.
- 2012-06-15
著者
関連論文
- 音声理解を指向したベイズリスク最小化枠組みに基づく音声認識(音声,聴覚)
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(第8回音声言語シンポジウム)
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- E-021 大規模単言語コーパスの利用による機械翻訳用対訳辞書の新規連語獲得性能の向上(E分野:自然言語・音声・音楽)
- LN-003 英語学習者の英文読解能力推定のための読解時間予測法(教育・人文科学)
- LN-002 英語学習者の英文読解時間に統語的要因が及ぼす影響(教育・人文科学)
- 音声理解を指向した音声認識のための単語重要度の自動推定(学生セッション II)
- 音声ドキュメント検索評価のためのテストコレクションの試作(第8回音声言語シンポジウム)
- 音声ドキュメント検索評価のためのテストコレクションの試作(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 外国語学習・教育支援を目的とした学習者発話動画の自動字幕付与システムの検討(音声・言語・音響教育,一般)
- 統計的前編集のための対訳コーパスからの学習データの自動生成
- 日本語講演音声ドキュメント検索における索引付けの検討
- NTCIR-9 SpokenDoc: 音声検索語検出と音声ドキュメント検索の評価枠組の設計
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 日本語講演音声ドキュメント検索における索引付けの検討
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- 最適フロアリング係数を用いた反復スペクトルサブトラクションによるミュージカルノイズの低減(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 広域文書類似度と局所文書類似度を用いた講演音声ドキュメント検索
- 広域文書類似度と局所文書類似度を用いた講演音声ドキュメント検索
- 広域文書類似度と局所文書類似度を用いた講演音声ドキュメント検索
- 5U-4 会議の情報保障における吹き出し型字幕の有用性の調査(音声インタフェース・システム,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 多言語音声の同時認識枠組みの提案
- 音声ドキュメント検索評価のためのテストコレクションの試作(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- E_029 関係節の英日翻訳法に関する統計的特徴抽出の試み(E分野:自然言語)
- 英文読解効率テストの有効性の検証(言語の学習・教育)
- LN_005 英文読解速度テストの有効性の検証(N分野:教育・人文科学)
- 二言語コーパスからの語彙知識獲得のための対訳辞書登録候補の選別
- LN-001 読解支援システムの統一的評価法(N分野:教育・人文科学)
- LE-003 サポートベクターマシンを用いた対訳辞書登録候補の自動選別(E分野:自然言語)
- 前置詞句・等位構造を含む英語固有表現とその対訳表現の獲得(対訳表現獲得)
- 複合語の内部情報・外部情報を統合的に利用した訳語対の抽出
- LK-005 読解過程検定ツールOPERATION2の評価(K. ヒューマンコミュニケーション&インタラクション)
- 複合語内外の言語情報を統合的に利用した低出現頻度・辞書未登録訳語対の抽出(抽出(2))
- 統計的前編集のための対訳コーパスからの学習データの自動生成 (音声)
- 統計的前編集のための対訳コーパスからの学習データの自動生成 (言語理解とコミュニケーション)
- 音声中の検索語検出のためのテストコレクション構築 -中間報告-
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出
- 音声による大規模知識ベース検索のための単語重要度を考慮したベイズリスク最小化デコーディング
- 音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング(大語彙音声認識)(第6回音声言語シンポジウム)
- E-002 高フロアリング係数を用いた反復スペクトルサブトラクションによるミュージカルノイズの低減の検討(E分野:自然言語・音声・音楽,一般論文)
- 4W-5 複数の機械翻訳器による学習データの自動生成とそれに基づく統計的前編集(機械翻訳,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 機械翻訳のための統計的手法に基づく前編集
- 機械翻訳のための統計的手法に基づく前編集
- 機械翻訳のための統計的手法に基づく前編集
- 談話標識の統計的選択に基づいたCSJの講演からの重要文抽出(言語モデル・要約)(第5回音声言語シンポジウム)
- 単語アライメントを用いた英日機械翻訳文の流暢さの自動評価
- 人間による翻訳文と機械翻訳文の語彙的差異の計量分析
- 読解効率に基づく英文読解能力測定テストの開発とその信頼性・妥当性の検証
- 会議の情報保障を目的とした吹き出し型字幕提示方式の検討(システム)
- 音声理解を指向した音声認識のための単語重要度の自動推定(学生セッション II)
- 国際会議・ニュースのアーカイブのための統計的機械翻訳を利用した音声認識の検討
- D-14-8 ベイズリスク最小化音声認識に基づく大学情報検索システムの構築(D-14.音声,一般セッション)
- 音声入力型大学情報検索システムに対するベイズリスク最小化音声認識の適用
- 音声入力型大学情報検索システムに対するベイズリスク最小化音声認識の適用
- 単語対応付けに基づく日本語学習者による作文の自動識別
- 不便な旅もよいのでは(ちょっとしたエッセイ,コーヒーブレーク)
- 人間による翻訳文と機械翻訳文における動詞の馴染み度の比較分析
- 講演の書き起こしに対する統計的手法を用いた文体の整形
- ドキュメント翻訳のための統計的手法に基づく原言語文の自動変換
- 音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング(大語彙音声認識)(第6回音声言語シンポジウム)
- 音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング(大語彙音声認識)(第6回音声言語シンポジウム)
- 講演音声認識のための教師なし言語モデル適応と発話速度に適応したデコーディング(音声,聴覚)
- 初等中等教育における授業音声認識のための言語モデルの検討(一般セッション,福祉と音声処理,一般)
- 初等中等教育における授業音声認識のための言語モデルの検討(一般セッション,福祉と音声処理,一般)
- クラウド時代の新しい音声研究パラダイム
- 機械翻訳の品質向上のための対訳コーパスからの統計的前編集システムの自動構築
- 広域文書類似度と局所文書類似度を用いた講演音声ドキュメント検索
- 多言語音声の同時認識システムにおける翻訳モデルとスコア計算の高速化
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 機械翻訳の品質向上のための対訳コーパスからの統計的前編集システムの自動構築
- 雑音下音声受音におけるWeighted反復スペクトル減算法を用いたミュージカルノイズの低減(音声,聴覚,学生論文)
- K-051 英文読解能力測定モデルへの熟語難易度の導入(教育工学(3),K分野:教育工学・福祉工学・マルチメディア応用)
- K-052 英語学習支援のための聴解コーパスの有効性の検証(教育工学(3),K分野:教育工学・福祉工学・マルチメディア応用)
- K-053 英文読解速度テストに用いたテキストの難易度を考慮したテスト有効性の検証(教育工学(3),K分野:教育工学・福祉工学・マルチメディア応用)
- オープンソース音声認識エンジンJuliusへのベイズリスク最小化機能の実装と評価(音声,聴覚,システム開発論文)
- 講演音声ドキュメント検索のための擬似適合性フィードバック