辞書と統計を用いた対訳アライメント
スポンサーリンク
概要
- 論文の詳細を見る
本稿では構造的に異なる言語間の文対応付けを高精度で行なう方法を提案する. 日英のように構造が大きく異なる言語間では続計的に得られる訳語対の量に限界があり, 統計的手法だけを用いて文対応付けを行なうのは難しい. これは主に機能語の体系が異なることと, 1つの単語が様々な品詞の単語に訳出されることによる. 逆に既存の単語対訳辞書には分野固有のキーワードが含れていないことが多く単語対訳辞書だけを用いて汎用の文対応付けシステムを作ることも難しい. 我々の手法は既存の単語対訳辞書と続計的に得られた訳語対を同時に利用する. そのため十分な量の訳語対を利用でき, 統計的手法を利用することで分野固有のキーワードも得られるため, テキストの分野や長さの変化に対してロバストである. 実験の結果様々な種類の日英対訳コーパスに対して既存の手法を上回る良好な文対応付け精度が得られた.
- 一般社団法人情報処理学会の論文
- 1996-03-14
著者
関連論文
- AIDA:コーパスを利用した適応的辞書環境
- 文対応対訳コーパス構築環境BACCS
- 誤り駆動型学習とシソーラスを用いた文書自動分類
- 誤り駆動型学習とシソーラスを用いた文書自動分類
- 辞書と統計を用いた対訳アライメント
- 辞書と統計を用いた対訳アライメント
- 自動アライメント機能を組み込んだ対訳コーパス構築環境BACCS
- 帰納学習アルゴリズムと階層型クラスタリング手法を用いた概念シソーラスの自動構築及び更新
- 帰納学習アルゴリズムとクラスタリング手法を用いた概念シソーラスの自動構築及び洗練
- AIDA:コーパスを利用した適応的辞書環境
- 辞書と統計を用いた対訳アライメント
- 文脈木を利用した形態素解析
- 最小汎化とオッカムの原理を用いた動詞格フレーム学習
- 最小汎化とオッカムの原理を用いた動詞格フレーム学習
- 並列構文解析における関係節等の痕跡を含む文の処理
- 最小汎化とオッカムの原理を用いた動詞格フレーム学習
- ILPにおける仮説言語の型付き論理プログラムへの拡張