統計的前編集のための対訳コーパスからの学習データの自動生成
スポンサーリンク
概要
- 論文の詳細を見る
機械翻訳システムを用いて自然性が高いテキストを翻訳すると,適当な結果が得られないことがある.逆に,自然性の低いテキストを機械翻訳システムに入力した方が好ましい翻訳ができることがある.このことから,自然な原文を機械翻訳しやすい文に前編集することで翻訳品質の向上が期待できる.そのため,本研究では,対訳コーパスを用いて統計的前編集モデルの自動学習を行う.具体的には,ある文とその対訳文を機械翻訳して得られる文のペアから,自然な文を翻訳しやすい文に変換するための学習データを自動作成し,自然性の低いテキスト,例えば直訳調の文に対してはうまく翻訳できることがある.統計的機械翻訳の枠組みに基づいて自動変換を行う方法について述べる.
- 2010-12-13
著者
-
南條 浩輝
龍谷大学
-
南條 浩輝
龍谷大学理工学部情報メディア学科
-
吉見 毅彦
龍谷大学理工学部
-
山本 祐司
龍谷大学理工学研究科
-
南條 浩輝
龍谷大学理工学部
-
南條 浩輝
龍谷大 理工
-
南條 浩輝
龍谷大
-
吉見 毅彦
龍谷大学理工学研究科
-
南條 浩輝
龍谷大学理工学研究科
関連論文
- 音声理解を指向したベイズリスク最小化枠組みに基づく音声認識(音声,聴覚)
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(第8回音声言語シンポジウム)
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- E-021 大規模単言語コーパスの利用による機械翻訳用対訳辞書の新規連語獲得性能の向上(E分野:自然言語・音声・音楽)
- LN-003 英語学習者の英文読解能力推定のための読解時間予測法(教育・人文科学)
- LN-002 英語学習者の英文読解時間に統語的要因が及ぼす影響(教育・人文科学)
- 最適フロアリング係数を用いた反復スペクトルサブトラクションによるミュージカルノイズの低減 (音声)
- 音声理解を指向した音声認識のための単語重要度の自動推定(学生セッション II)
- 音声ドキュメント検索評価のためのテストコレクションの試作(第8回音声言語シンポジウム)
- 音声ドキュメント検索評価のためのテストコレクションの試作(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 外国語学習・教育支援を目的とした学習者発話動画の自動字幕付与システムの検討(音声・言語・音響教育,一般)
- Spoken Term Detection のためのテストコレクション構築とベースライン評価
- 統計的前編集のための対訳コーパスからの学習データの自動生成
- 日本語講演音声ドキュメント検索における索引付けの検討
- NTCIR-9 SpokenDoc: 音声検索語検出と音声ドキュメント検索の評価枠組の設計
- 音声中の検索語検出のためのテストコレクション構築 : 中間報告
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 日本語講演音声ドキュメント検索における索引付けの検討
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- 最適フロアリング係数を用いた反復スペクトルサブトラクションによるミュージカルノイズの低減(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 最適フロアリング係数を用いた反復スペクトルサブトラクションによるミュージカルノイズの低減(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 最適フロアリング係数を用いた反復スペクトルサブトラクションによるミュージカルノイズの低減(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 広域文書類似度と局所文書類似度を用いた講演音声ドキュメント検索
- 広域文書類似度と局所文書類似度を用いた講演音声ドキュメント検索
- Spoken Term Detection のためのテストコレクション構築とベースライン評価
- 広域文書類似度と局所文書類似度を用いた講演音声ドキュメント検索
- 5U-4 会議の情報保障における吹き出し型字幕の有用性の調査(音声インタフェース・システム,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 音声ドキュメント検索評価のためのテストコレクションの試作(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- E_029 関係節の英日翻訳法に関する統計的特徴抽出の試み(E分野:自然言語)
- 2000-SLP-31-11 種々のタスクにおける大語彙連続音声認識システムの性能評価と診断
- 英文読解効率テストの有効性の検証(言語の学習・教育)
- LN_005 英文読解速度テストの有効性の検証(N分野:教育・人文科学)
- 二言語コーパスからの語彙知識獲得のための対訳辞書登録候補の選別
- LN-001 読解支援システムの統一的評価法(N分野:教育・人文科学)
- LE-003 サポートベクターマシンを用いた対訳辞書登録候補の自動選別(E分野:自然言語)
- 前置詞句・等位構造を含む英語固有表現とその対訳表現の獲得(対訳表現獲得)
- 複合語の内部情報・外部情報を統合的に利用した訳語対の抽出
- LK-005 読解過程検定ツールOPERATION2の評価(K. ヒューマンコミュニケーション&インタラクション)
- 複合語内外の言語情報を統合的に利用した低出現頻度・辞書未登録訳語対の抽出(抽出(2))
- 統計的前編集のための対訳コーパスからの学習データの自動生成 (音声)
- 統計的前編集のための対訳コーパスからの学習データの自動生成 (言語理解とコミュニケーション)
- 音声中の検索語検出のためのテストコレクション構築 -中間報告-
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出
- 音声による大規模知識ベース検索のための単語重要度を考慮したベイズリスク最小化デコーディング
- 音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング(大語彙音声認識)(第6回音声言語シンポジウム)
- E-002 高フロアリング係数を用いた反復スペクトルサブトラクションによるミュージカルノイズの低減の検討(E分野:自然言語・音声・音楽,一般論文)
- 日本語講演音声ドキュメント検索における索引付けの検討
- 4W-5 複数の機械翻訳器による学習データの自動生成とそれに基づく統計的前編集(機械翻訳,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 5U-3 音響防犯システムのためのSVMを用いた叫び声の検出と音声認識(音声インタフェース・システム,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 3U-3 多言語音声の同時認識のための統計的翻訳モデル(音声認識・理解,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 大規模な日本語話し言葉データベースを用いた講演音声認識
- 話し言葉音声認識のための言語モデルとデコーダの改善
- 話し言葉音声認識のための言語モデルとデコーダの改善
- 講演音声認識のための音響・言語モデルの検討
- 講演音声認識のための音響・言語モデルの検討
- 講演音声認識のための音響・言語モデルの検討
- 機械翻訳のための統計的手法に基づく前編集
- 機械翻訳のための統計的手法に基づく前編集
- 機械翻訳のための統計的手法に基づく前編集
- 談話標識の統計的選択に基づいたCSJの講演からの重要文抽出(言語モデル・要約)(第5回音声言語シンポジウム)
- 談話標識の統計的選択に基づいたCSJの講演からの重要文抽出(第5回音声言語シンポジウム : 言語モデル・要約)
- 談話標識の統計的選択に基づいたCSJの講演からの重要文抽出(第5回音声言語シンポジウム : 言語モデル・要約)
- 談話標識と話題語に基づく統計的尺度による講演からの重要文抽出(自然言語情報処理研究会と一部合同開催 : NL・SLP合同開催 : 音声対話1)
- 談話標識と話題語に基づく統計的尺度による講演からの重要文抽出
- 単語アライメントを用いた英日機械翻訳文の流暢さの自動評価
- 人間による翻訳文と機械翻訳文の語彙的差異の計量分析
- 講演音声認識のための言語モデルの教師なし適応
- 会議の情報保障を目的とした吹き出し型字幕提示方式の検討(システム)
- 音声理解を指向した音声認識のための単語重要度の自動推定(学生セッション II)
- 講演音声認識のための言語モデルの教師なし適応
- 講演音声認識のための言語モデルの教師なし適応
- D-14-8 ベイズリスク最小化音声認識に基づく大学情報検索システムの構築(D-14.音声,一般セッション)
- 音声入力型大学情報検索システムに対するベイズリスク最小化音声認識の適用
- 音声入力型大学情報検索システムに対するベイズリスク最小化音声認識の適用
- 講演の書き起こしに対する統計的手法を用いた文体の整形
- ドキュメント翻訳のための統計的手法に基づく原言語文の自動変換
- 音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング(大語彙音声認識)(第6回音声言語シンポジウム)
- 音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング(大語彙音声認識)(第6回音声言語シンポジウム)
- 講演音声認識のための教師なし言語モデル適応と発話速度に適応したデコーディング(音声,聴覚)
- 講演音声認識のための話題・話者・発音変動に適応した言語モデル
- 発話速度に依存したデコーディングと音響モデルの適応
- 発話速度に依存したデコーディングと音響モデルの適応、
- 発話速度に依存したデコーディングと音響モデルの適応
- 発話速度に依存したデコーディングの検討
- 講演音声認識のための話速別モデル化の検討
- 種々の大語彙連続音声認識タスクにおける認識誤りの自動診断
- 大語彙連続音声認識における認識誤り原因の自動同定
- 大語彙連続音声認識における認識誤り原因の自動同定
- クラウド時代の新しい音声研究パラダイム
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 音声ドキュメント処理ワーキンググループ活動報告
- 音声ドキュメント処理ワーキンググループ活動報告