対訳文書からの機械翻訳専門用語辞書作成
スポンサーリンク
概要
- 論文の詳細を見る
機械翻訳システムのカスタマイズ手段であるユーザ専門用語辞書作成を自動化する目的で,日英対訳コーパスから機械翻訳用専門用語辞書を作成する方法を開発し評価した.本方法では,(1)日本語文書と英語文書から対応の単位となるユニットを抽出,(2)日本語ユニットと英語ユニットの対応関係を推定,(3)日本語文書から合成名詞と未知語を専門用語として抽出,(4)専門用語を含む日本語ユニットの対応英語ユニットから訳語候補を生成,(5)複数の訳語候補を評価して最も確かなものを選定することで対訳データを作成する.対訳コーパス中の語句の対応関係の推定には,既存の対訳辞書知識から得られる言語情報とテキスト中の頻度から得られる統計情報を統合して利用した.この2種類の情報を利用することにより,構成語間に直接対訳関係のない合成名詞に対する対訳データや未知語に対する対訳データなど,言語情報のみを利用する方法では得られないデータも抽出できた.日英間で文章構成や表現の大きく異なる特許明細書を対象に専門用語辞書の作成実験を行った結果,300文程度の小規模な文書からでも,合成名詞に対する訳語を70%以上の精度で推定できた.未知語の訳語推定は2,000文程度の文書で50%以上の精度が得られた.これまで人手で行っていたユーザ専門用語辞書の作成作業の半分以上を自動化でき,機械翻訳利用の効率を向上した.
- 一般社団法人情報処理学会の論文
- 1994-11-15
著者
関連論文
- AIプロセサを利用した機械翻訳の高速化
- 概念体系を用いた概念抽象化手法と語義判定におけるその有効性の評価(自然言語)(コラボレーションアートとネットワークエンターテイメント)
- 入力予測機能を組み込んだ仮名漢字変換システム
- 予測に基づく入力支援機能を備えたかな漢字変換システムの開発
- 既存目的言語文書からの訳語の自動学習方式
- 文書全体の情報を利用した翻訳方式
- 機械翻訳システムによる知的活動の推進(自然言語処理技術による情報マネジメントの実際)(自然言語処理の高度化による知的生産性の向上)
- 対訳文書からの専門用語辞書作成
- 概念体系作成支援システムのUser-Interface
- 概念体系作成支援システムのbrowsing方式
- 概念体系作成支援システムのデータ構造
- 概念体系作成支援システムの機能
- 言語処理のアルゴリズム (最近のアルゴリズム特集) -- (情報・システム)
- 産業日本語の構想と特許文の言い換え実験(日本語処理・文法)
- ニュース記事マッチングからの二言語コーパス構築に対する局所的適合フィードバック法の応用
- インターネット翻訳サービスと辞書データ収集
- インターネット翻訳サービスにおけるユーザ辞書構築
- 多言語情報検索技術を用いた二か国語コーパスの自動アラインメント
- 多言語情報検索技術を用いた二か国語コーパスの自動アラインメント
- 対訳特許文書からの機械翻訳辞書自動作成
- 対訳文書からの機械翻訳専門用語辞書作成
- 翻訳パターンによる機械翻訳のカスタマイズの指針とその効果
- 言語情報と統計情報を用いた対訳文書からの機械翻訳辞書作成
- 文書の種類を考慮した機械翻訳システムの構成
- ユーザ協調型日本語生成システム
- 自然な日本語生成のための指針
- キーボード会話文の構文解析文法について
- 情報処理用語における複合語の構成パターンの抽出とその利用について
- 専門用語辞書の試作概要
- ウェブ文書資源からの中日対訳推定における文脈窓幅の役割(機械翻訳)
- 選好依存文法とその圧縮共有データ構造「依存森」について
- 選好意味依存文法(PSDG)とその圧縮共有データ構造について
- 選好意味依存文法(PSDG)とその圧縮共有データ構造について
- COLING '94参加報告
- 対訳文書を用いた訳語の学習
- 自然言語処理技術の高度化はいかにして組織の競争力を生み出すのか(自然言語処理の高度化による知的生産性の向上)
- 海外におけるナレッジマネジメントの実践(「ナレッジマネジメントとその支援技術」)
- 理解容易性を指向した訳語/統語構造選択規範に基づく文生成
- カタカナ異形表記・誤記修正機能の開発・評価
- 機械翻訳システムとその技術の現状
- 科学技術文書のためのテクニカルライティング : 並列表現と修飾表現が存在する場合
- 日本語の数字表現の意味的な分類について
- 日英機械翻訳システムの語彙規則による自然な訳文の生成
- 自然な文章生成における規範 : 機械翻訳への応用
- DTP形式情報を保存する機械翻訳支援システム
- 選好依存文法(PDG)におけるスコアリング方式と評価実験について(単語,文法)
- 特集「コーパスに基づく音声・自然言語処理」にあたって
- 機械翻訳用前編集支援ツールの評価
- 日英機械翻訳前編集における日本語文分割処理について
- 機械翻訳前編集支援ツールの開発 : 指針と概要
- 選好依存文法(PDG)における文解析能力の評価方式について(解析, QA, 言語調査)
- 統語森に対応する圧縮共有型依存構造「依存森」について(解析, QA, 言語調査)
- 統語森に対応する圧縮共有型依存構造「依存森」について(解析, QA, 言語調査)
- コーパス
- 英文スペリングコレクタで正しい単語候補の選び方はどうなっているの?<素朴な疑問>
- メディアラボ(The MIT Media Laboratory),MU(Machine Understanding)グループ紹介
- 選好依存文法(PDG)における文解析能力の評価方式について(自然言語)
- 選好依存文法(PDG)における文解析能力の評価方式について(解析, QA, 言語調査)
- 最適解探索に基づく日本語意味係り受け解析