編集距離を使った用例翻訳の高速検索方式と翻訳性能評価(自然言語)
スポンサーリンク
概要
- 論文の詳細を見る
本稿では編集距離を使った用例翻訳システムの実装方式と大規模コーパスを使った翻訳性能評価について報告する.この用例翻訳方式では,コーパスの中から最も類似した文を選び出す仕組みがその中核にある.その実装のための効率的で検索もれのない手法を提案する.提案手法では検索対象領域の分割と単語グラフ表現,A*アルゴリズムを利用する.翻訳性能評価では旅行会話ドメインの数10万文規模のコーパスを使用する.まず日英翻訳で,3種類の言語資源(対訳コーパス,対訳辞書,シソーラス)と翻訳性能の関係について検証する.また複数の言語対について翻訳システムを構築することにより多言語適用性を確認する.
- 一般社団法人情報処理学会の論文
- 2004-06-15
著者
-
隅田 英一郎
ATR音声言語コミュニケーション研究所
-
山本 博史
Atr音声言語コミュニケーション研究所
-
隅田 英一郎
Atr音声翻訳通信研究所
-
隅田 英一郎
情報通信機構:国際電気通信基礎技術研究所
-
隅田 英一郎
情報通信研究機構:atr音声言語コミュニケーション研究所
-
土居 誉生
ATR音声言語コミュニケーション研究所
-
隅田 英一郎
Atr音声言語コミュニケーション研究所:(現)独立行政法人情報通信研究機構およびatr音声言語コミュニケーション研究所
-
山本 博史
近畿大学:情報通信機構:国際電気通信基礎技術研究所
-
隅田 英一郎
Atr音声言語コミュニケーション研究所自然言語処理研究室 : 独立行政法人情報通信研究機構
-
土居 誉生
Atr音声言語コミュニケーション研究所:(現)株式会社cskシステムズ 神戸大学大学院自然科学研究科
関連論文
- 英語コミュニケーション能力の自動測定技術の提案
- 複数のマルコフモデルを用いた階層化言語モデルによる未登録語認識(音声、聴覚)
- 連続音声認識システムにおけるfactoringテーブルのコンパクト化と不要単語仮説のガーベジコレクション
- 機械翻訳によって生成された追加テキストを使った統計的言語モデルの適応
- 文認識率の向上に向けたFSAとNGRAMの併用モデルによる大語彙連続音声認識
- ROVER法を用いた音声認識結果の統合と誤認識文のリジェクション
- 文クラスタリングによる複数言語モデルを用いた誤認識文の推定
- 話題と文型の違いを同時に考慮した言語モデル適応
- サブワードモデルを用いた未登録語認識の効率的探索手法(音声言語情報処理とその応用)
- 構造化言語モデルとその実装
- 後続仮説数の管理機能を用いた単語グラフの仮説数削減
- 対話者の前発話を利用した統計的言語モデル
- 音声認識過程での発話分割のための統計的言語モデル(21世紀のグループウェア)
- 2つの単語クラスから生じた未登録語のサブワードモデルによる音声認識
- サブワードモデルを用いた未登録語認識における効率的探索手法
- サブワードネットワークに基づく未登録語処理を搭載したデコーダの構築
- 大語彙連続音声認識における未知語のsub-wordモデリング手法
- 複数の編集距離を用いた口語翻訳文の自動評価
- 英語能力測定のための空所補充問題の自動生成手法(言語の学習・教育)
- 音声翻訳技術開発の経験に基づく外国語能力評価法の提案
- 編集距離を使った用例翻訳の高速検索方式と翻訳性能評価(自然言語)
- 大規模用例を用いた音声認識誤り訂正の検討
- 旅行会話基本表現コーパスを用いた認識誤り訂正の検討
- 旅行会話基本表現コーパスを用いた認識誤り訂正の検討
- 旅行会話基本表現コーパスを用いた認識誤り訂正の検討
- 中国語形態素コーパスと言語モデルの評価 : パラレルコーパスにおける日英両言語との比較
- 音声翻訳のための中国語対話コーパスの整備とその評価(マルチモーダル, コーパス・言語モデル)
- 音声翻訳のための中国語対話コーパスの整備とその評価(マルチモーダル, コーパス・言語モデル)
- 異種コーパスの組合せによるトリガー言語モデルの構築
- 異種コーパスの組合せによるトリガー言語モデルの構築
- 異種コーパスの組合せによるトリガー言語モデルの構築(言語モデル)(第6回音声言語シンポジウム)
- 異種コーパスの組合せによるトリガー言語モデルの構築(言語モデル)(第6回音声言語シンポジウム)
- 異種コーパスの組合せによるトリガー言語モデルの構築(言語モデル)(第6回音声言語シンポジウム)
- 信頼度尺度に基づく音声認識誤りの検出および誤り訂正(合成, 韻律, 生成, 一般)
- 単語適合率最大基準に基づく複数システムの統合
- 用例型構文解析による句構造情報を利用した言語モデル
- 木構造ネットワークサーチにおけるbigram factoringテーブルの削減
- 対話者の社会的役割を利用した訳し分け手法
- テキストデ タを使った音声認識誤りの訂正
- 文クラスタリングによる複数言語モデルを用いた誤認識文の推定
- 大語彙連続音声認識における未知語のsub-wordモデリング手法
- 統計翻訳指標を導入した構文トランスファに基づく用例翻訳(機械翻訳)
- 階層的句アラインメントを用いた統計的機械翻訳(自然言語処理)
- 生成方向を考慮した統計的機械翻訳のためのデコーディングアルゴリズム(自然言語)
- パラレルコーパスからの機械翻訳向け同義表現抽出(自然言語)(「インタラクション:理論,技術,応用,評価」)
- SMT指標を用いた複数翻訳エンジンからの最適訳選択
- SMT指標を用いた複数翻訳エンジンからの最適訳選択
- パターンマッチングに基づく発話意図同定のための重要語検出方法
- 句に基づく構文トランスファ方式統計翻訳(自然言語)
- 単語翻訳モデルを用いた翻訳後編集による湧き出し語対策(自然言語,情報処理技術のフロンティア)
- 単語翻訳モデル駆動型の翻訳後編集(言い換えと翻訳)
- 単語翻訳モデル駆動型の翻訳後編集(言い換えと翻訳)
- 機械翻訳のための文簡易化(機械翻訳)
- 発話を対象とした類似文検索と機械翻訳への適用
- 自動評価を用いた機械翻訳規則のフィードバッククリーニング(自然言語)
- スラッシュ・リーディングのためのテキスト分割
- 直訳性を利用した機械翻訳知識の自動構築
- E-52 直訳性に着目した対訳コーパスフィルタリング(機械翻訳(2),E.自然言語・文書)
- 音声翻訳システム : ATR-MATRIXの開発と評価(音声言語情報処理とその応用)
- 解析木データベースを用いた音声認識誤り訂正手法
- 文字連鎖の統計的特徴を利用した音声認識誤り訂正手法
- 決定木を用いた日本語ゼロ代名詞補完
- 類似検索を用いた情報検索システム
- 単語間の意味的類似度に基づく文書検索手法
- 変換主導機械翻訳の超並列化の検討
- 対話音声を対象とした連続音声認識システムの試作と評価
- 発話分割付実時間音声認識
- 旅行会話タスクにおけるTARSPRECの性能評価
- 異種言語知識の併用による文法的単語グラフ生成法
- 異種言語知識の併用による局所的信頼性向上
- 異種言語知識の併用による局所的信頼性向上
- 異種言語知識の併用による局所的信頼性向上
- 異種言語知識の併用による局所的信頼性向上
- 複数決定木を用いた入力誤りに頑健な省略補完手法
- 決定木学習による日本語対話文の格要素省略補完
- 音声対話における頑健な主語補完手法
- 単語と品詞の混合 n-gram を用いた形態素解析
- E-51 パラレルコーパスからの語彙的パラフレーズ獲得(機械翻訳(2),E.自然言語・文書)
- LE-2 用例翻訳のための同義表現同定(E. 自然言語・文書)
- 形態素体系間の情報変換手法
- 大語い連続音声認識のための単語仮説数削減
- Delayed decisionビーム探索の検討
- 単語グラフと可変長N-gramを用いた大語彙自然発話音声認識
- 単語グラフを用いた自由発話音声認識
- 単語グラフを用いた自由発話音声認識
- 単語グラフを用いた連続音声認識法
- 言語情報を用いた教師なしのQuasi-Bayesオンライン話者適応
- 位置依存単語クラスタと頻出単語列を用いた多重クラス複合3-gram言語モデル
- 品詞接続特性と単語接続特性の最大事後確率推定による融合に基づく単語クラス分類
- 多重クラスTrigram構築のための効率的な自動クラスタリング手法
- 多重クラスTrigram構築のための効率的な自動クラスタリング手法
- E-50 用例ベース翻訳D^3のための文分割(機械翻訳(2),E.自然言語・文書)
- 語彙クラスに依存した未登録語モデルに基づく統計的言語モデル
- 対話における相手話者の前発話に対する中間言語表現を利用した言語モデル
- 未登録語のクラス依存サブワードモデルを用いた音声認識
- 母音および無音のHMMを用いた音声始端検出法
- PARALLEL JAPANESE/ENGLISH SPEECH RECOGNITION IN ATRSPREC
- 日英音声翻訳システム「ATR-MATRIX」における音声認識部分の構造と制御方法
- Pitman-Yor過程に基づく可変長n-gram言語モデル(言語モデル・応用)
- 多重クラスTrigram構築のための効率的な自動クラスタリング手法