自動アライメント機能を組み込んだ対訳コーパス構築環境BACCS
スポンサーリンク
概要
- 論文の詳細を見る
対訳コーパスは、機械翻訳システム構築において必要な様々な言語知識を取り出す上で、重要な情報源である。実際、対訳コーパスから様々な言語知識を抽出する試みがなされているが、精度の良い知識を抽出するためには、なるべく大量の文対応の取れた対訳コーパスがあることが望ましい。対訳コーパスから文レベルの対応関係を特定する、いわゆる文対応(アライメント)の研究に関しても、様々な試みがされているが、構造の異なる言語族間(例えば日本語と英語)で正しく文対応がとれた対訳コーパスを収集するための方法論やツールについて、あまり研究がなされていない。本稿では、文対応の取れた対訳コーパス収集を容易にするための対訳コーパス構築環境BACCS(Bilingual Aligned Corpus Construction System)について述べる。BACCSは、従来手法とは異なるロバストなアライメントプログラムを有し、プログラムの出力するアライメント結果をグラフィカルなインタフェースを通じて簡単に確認/修正が可能な対訳コーパス構築環境である。以下、BACCSが有するアライメントプログラムの詳細、及びBACCSの持つ機能について述べる。
- 一般社団法人情報処理学会の論文
- 1996-03-06
著者
関連論文
- AIDA:コーパスを利用した適応的辞書環境
- 文対応対訳コーパス構築環境BACCS
- 誤り駆動型学習とシソーラスを用いた文書自動分類
- 誤り駆動型学習とシソーラスを用いた文書自動分類
- 辞書と統計を用いた対訳アライメント
- 辞書と統計を用いた対訳アライメント
- 自動アライメント機能を組み込んだ対訳コーパス構築環境BACCS
- 帰納学習アルゴリズムと階層型クラスタリング手法を用いた概念シソーラスの自動構築及び更新
- 帰納学習アルゴリズムとクラスタリング手法を用いた概念シソーラスの自動構築及び洗練
- AIDA:コーパスを利用した適応的辞書環境
- 辞書と統計を用いた対訳アライメント
- 文脈木を利用した形態素解析
- 最小汎化とオッカムの原理を用いた動詞格フレーム学習
- 最小汎化とオッカムの原理を用いた動詞格フレーム学習
- 並列構文解析における関係節等の痕跡を含む文の処理
- 最小汎化とオッカムの原理を用いた動詞格フレーム学習
- ILPにおける仮説言語の型付き論理プログラムへの拡張