統計翻訳における木構造制約の導入(機械翻訳・医療情報)
スポンサーリンク
概要
- 論文の詳細を見る
機械翻訳において,構文情報は非常に有用であり、近年ではこの情報を統計翻訳にも取り入れる試みがなされている.構文情報を統計翻訳に用いる場合,その情報をコーパスから統計的に学習することになるが,それを用いない場合と比較して大量のパラメータも学習する必要が生じる.大量のパラメーターの学習を行うためには同じく大量の学習コーパスを必要とし,そのためにデータスパースネスの問題が生じる.このデータスパースネスの問題を避けるために,本稿では次の2点の仮定に基づく学習を必要としない構文情報モデルを提案する.翻訳原言語での関係のある単語は,翻訳先でも関係がる.関係を表すアークは交差しない.本モデルはSSMT2007英中翻訳タスクのデータを用いた実験で,従来法より1.9ポイント高いBLEU値(31.3から33.2)と,4.9%低いWER(69.2%から64.3%)を示し,有効性が確認できた.
- 一般社団法人情報処理学会の論文
- 2007-09-25
著者
-
隅田 英一郎
(独)情報通信研究機構知識創成コミュニケーション研究センター
-
隅田 英一郎
(独)情報通信研究機構
-
隅田 英一郎
情報通信機構:国際電気通信基礎技術研究所
-
隅田 英一郎
情報通信研究機構:atr音声言語コミュニケーション研究所
-
山本 博史
(独)情報通信研究機構,ATR音声言語コミュニケーション研究所
-
大熊 英男
(独)情報通信研究機構,ATR音声言語コミュニケーション研究所
-
隅田 英一郎
Atr音声言語コミュニケーション研究所:(現)独立行政法人情報通信研究機構およびatr音声言語コミュニケーション研究所
-
山本 博史
近畿大学:情報通信機構:国際電気通信基礎技術研究所
-
隅田 英一郎
Atr音声言語コミュニケーション研究所自然言語処理研究室 : 独立行政法人情報通信研究機構
-
大熊 英男
情報通信機構:国際電気通信基礎技術研究所
関連論文
- NICT知識創成コミュニケーション研究センターの研究と高度言語情報融合フォーラム(ALAGIN)の活動について(Web情報処理,Webとデータベースに関する技術報告)
- NICTにおける音声・言語研究拠点MASTARプロジェクトについて(「ユニバーサルコミュニケーションを実現するための言語処理技術」シンポジウム)
- 音声翻訳研究20年の夜明け : 受賞業績 携帯電話によるネットワーク型コーパスベース音声翻訳システムの構築(平成19年度喜安記念業績賞紹介)
- 2D-5 多言語音声翻訳基盤の通信インタフェースの検討と構築(音声対話・翻訳,一般セッション,人工知能と認知科学)
- 英語コミュニケーション能力の自動測定技術の提案
- 機械翻訳の研究・開発における翻訳自動評価技術とその応用(テキストの自動評価)
- G_012 Using Ontological Knowledge to Disambiguate Unknown Words in Semantic Tagging
- 2 ここまできた音声翻訳技術(多言語自動通訳技術の実現に向けて)
- 複数の編集距離を用いた口語翻訳文の自動評価
- 機械翻訳システム評価法の最前線
- 英語能力測定のための空所補充問題の自動生成手法(言語の学習・教育)
- 音声翻訳技術開発の経験に基づく外国語能力評価法の提案
- N-Best疑似コーパスを利用したピボット翻訳(「ユニバーサルコミュニケーションを実現するための言語処理技術」シンポジウム)
- 統計翻訳における木構造制約の導入(機械翻訳・医療情報)
- LG_003 統計翻訳のための言語モデルのオンラインタスク適応(G分野:音声・音楽)
- 編集距離を使った用例翻訳の高速検索方式と翻訳性能評価(自然言語)
- 大規模用例を用いた音声認識誤り訂正の検討
- 旅行会話基本表現コーパスを用いた認識誤り訂正の検討
- 旅行会話基本表現コーパスを用いた認識誤り訂正の検討
- 旅行会話基本表現コーパスを用いた認識誤り訂正の検討
- 音声翻訳システムと評価
- 機械翻訳最新事情 : (下)評価型ワークショップの動向と日本からの貢献
- 統計翻訳指標を導入した構文トランスファに基づく用例翻訳(機械翻訳)
- 階層的句アラインメントを用いた統計的機械翻訳(自然言語処理)
- 生成方向を考慮した統計的機械翻訳のためのデコーディングアルゴリズム(自然言語)
- パラレルコーパスからの機械翻訳向け同義表現抽出(自然言語)(「インタラクション:理論,技術,応用,評価」)
- E-53 Paraphrasing by Statistical Machine Translation
- SMT指標を用いた複数翻訳エンジンからの最適訳選択
- SMT指標を用いた複数翻訳エンジンからの最適訳選択
- 句に基づく構文トランスファ方式統計翻訳(自然言語)
- 単語翻訳モデルを用いた翻訳後編集による湧き出し語対策(自然言語,情報処理技術のフロンティア)
- 単語翻訳モデル駆動型の翻訳後編集(言い換えと翻訳)
- 単語翻訳モデル駆動型の翻訳後編集(言い換えと翻訳)
- 機械翻訳のための文簡易化(機械翻訳)
- 発話を対象とした類似文検索と機械翻訳への適用
- 自動評価を用いた機械翻訳規則のフィードバッククリーニング(自然言語)
- スラッシュ・リーディングのためのテキスト分割
- 直訳性を利用した機械翻訳知識の自動構築
- E-52 直訳性に着目した対訳コーパスフィルタリング(機械翻訳(2),E.自然言語・文書)
- 音声翻訳システム : ATR-MATRIXの開発と評価(音声言語情報処理とその応用)
- 多言語の翻訳
- 形態素体系間の情報変換手法
- 階層Pitman-Yor過程に基づく可変長n-gram言語モデル(知識処理,インタラクションの理解とデザイン)
- Pitman-Yor過程に基づく可変長n-gram言語モデル(言語モデル・応用)
- Web時代の音声・言語技術
- 音声翻訳システム実利用データを用いたシステム改善手法(音声翻訳,統計的機械学習,異文化コラボレーション論文)
- 高度言語情報融合フォーラム(ALAGIN) (知識創成コミュニケーション特集) -- (産学官連携)
- 多言語音声翻訳システム"VoiceTra"の構築と実運用による大規模実証実験(音声,聴覚,システム開発論文)