5 非制限話し言葉翻訳に関する最近の技術進展(<特集>多言語自動通訳技術の実現に向けて)
スポンサーリンク
概要
- 論文の詳細を見る
話し言葉翻訳は,自然言語処理研究における最も困難なタスクである.話し言葉翻訳では,音声認識と機械翻訳のそれぞれの課題を解決しさらにこの2つの技術を融合しなければならない.融合タスクの中心的課題は,音声認識から機械翻訳への誤り伝播の抑制と,話し言葉翻訳の探索における計算複雑性である.過去の研究プロジェクトは,より現実的なタスクとするため,旅行情報の要請や予約のスケジューリングといったドメインを対象として,管理された状況で録音した音声を用いるという制限つきの話し言葉翻訳に取り組んできた.その結果,本特集号でも述べられているようにC-STARコンソーシアムやいくつかの国際研究プロジェクトによって,話し言葉翻訳システムが開発された.近年,アメリカのGALEプロジェクトとヨーロッパのTC-STARプロジェクトという2つの主要プロジェクトが,いわゆる非制限話し言葉翻訳に取り組み始めた.従来の話し言葉翻訳のプロジェクトは,実験室で録音された話し言葉に注力していたが,TC-STARとGALEの両プロジェクトは,ニュース放送や政治演説のように実生活で録音された話し言葉,found speechの翻訳を対象としている.我々が非制限話し言葉翻訳に注目するようになったのは,以下の理由からである.・機械翻訳における統計的アプローチが目覚ましい進展を遂げ,いわゆるルールベースアプローチによる精巧な従来の手法に対して十分対抗できるようになった.・機械翻訳の共通の評価指標と基準の採用により,評価キャンペーンが広まって研究所間で評価結果を共有でさるようになった.・統計的機械翻訳システムをトレーニングするための大規模対訳コーパスが利用可能となり,性能向上と機械翻訳分野の改革をもたらした.・強力なオープンソースツールが利用可能となり,統計的機械翻訳に取り組む研究コミュニティが急速に拡大した.本稿では,TC-STARプロジェクトの研究課題とプロジェクトで導入された評価の枠組みを紹介し,話し言葉翻訳のコア技術である音声認識や機械翻訳について,筆者らが所属するイタリア・トレントの研究機関FBK-irst(旧ITC-irst)の最近の成果について述べる.
- 2008-06-15
著者
-
奥村 明俊
NEC 情報メディア研究所
-
奥村 明俊
NEC マルチメディア研究所
-
奥村 明俊
NEC共通基盤ソフトウェア研究所
-
Federico Marcello
Fondazione Bruno Kessler-FBK-irst
-
Giuliani Diego
Fondazione Bruno Kessler-FBK-irst
-
Lazzari Gianni
Fondazione Bruno Kessler-FBK-irst
-
奥村 明俊
NEC C&Cメディア研究所
関連論文
- 英日翻訳システムを基にした多言語翻訳システムの構築
- 5 非制限話し言葉翻訳に関する最近の技術進展(多言語自動通訳技術の実現に向けて)
- 5W1H情報を利用する情報分類・ナビゲーション
- PDAで動作する旅行会話向け日英双方向音声翻訳システム
- LE-009 ロボットとの対話によるマルチメディアブログ創作と評価(自然言語・音声・音楽)
- テキスト要約の複数の正解に基づいた評価
- 音声・映像認識連携への取り組み : 0.編集にあたって
- 3 携帯端末用多言語自動通訳システムの実用化に向けて(多言語自動通訳技術の実現に向けて)
- PDAで動作する旅行会話向け日英双方向音声翻訳システム
- 2D-2 携帯電話試作機上で動作する旅行会話向け自動通訳システムの開発(音声・音楽情報処理,一般セッション,人工知能と認知科学)
- MIIDAS : 情報の選別とEasy Readingのためのエピソード
- MIIDAS:情報の適合的選別による文書フィルタリング
- MIIDAS : 情報の選別的共有のためのオントロジ構築とその増進的学習
- 5W1H分類・ナビゲーションによる情報活用プラットフォーム
- オントロジによる多次元情報集配信
- 文書参照/引用履歴を利用したノウハウ活用エージェント
- 大規模データのセルフナビゲーショナルアクセス : SPIRAL Method
- 編集にあたって (小特集 音声・映像認識連携への取り組み)
- 2D-3 携帯電話試作機上で動作する旅行会話向け音声認識システム(音声・音楽情報処理,一般セッション,人工知能と認知科学)
- 2P-5 コンパラブルコーパスによるキュエリタームの拡張とクロス言語検索
- 3P-13 5W1H情報の在否により結果を分類する情報検索システム
- 非定形文書中の日程情報を自動配信するスケジュールリマインダ
- 情報配信オントロジおよび5W1H分類による情報活用環境の構築
- コンパラブルコーパスによる単語共起頻度を用いたクロス言語検索
- ノウハウ共有エージェントによる文書作成支援
- 編集にあたって(多言語自動通訳技術の実現に向けて)