単語長と出現回数を考慮した対訳文書からの訳語検出(翻訳,対話)
スポンサーリンク
概要
- 論文の詳細を見る
特許などの技術文書を翻訳する場合,専門用語を正しく認定し,適切な訳を付与することが重要である.我々は,既存の対訳文書から,精度の高い専門用語の対訳辞書を自動的に作成する手法を提案する.本手法は,(1)単言語の文書から隣接単語の分散に基づく手法によって専門用語を抽出し,(2)対訳文書から単語長と出現回数を考慮した手法によってその専門用語の訳語を検出する.という二段階から成る.米国特許公報6万件から(1)の手法を用いて抽出した専門用語約12,000語に対して,(2)の手法を検証した結果,一位正解率80.0%,一位以外も含めての正解獲得率96%で専門用語訳が検出できることを確認した.
- 2006-05-19
著者
-
下畑 さより
沖電気工業株式会社ユビキタスサービスプラットフォームカンパニー
-
北村 美穂子
沖電気工業株式会社ユビキタスサービスプラットフォームカンパニー
-
下畑 さより
沖電気工業(株)
-
北村 美穂子
沖電気工業(株)関西総合研究所
関連論文
- 日英特許コーパスからの専門用語対訳辞書の自動獲得
- 単語長と出現回数を考慮した対訳文書からの訳語検出(翻訳,対話)
- 対訳コーパスを利用した対訳表現の自動抽出
- 対訳文書の文・単語対応付け技術を利用した対訳例検索システム
- ラダリング型検索サービスのためのドメイン知識構築,及び,実証実験(対話型情報アクセス(テーマセッション4))
- ラダリング型検索サービスのための対話エンジンの設計・開発(対話型情報アクセス(テーマセッション4))
- ラダリング型検索サービスのためのドメイン知識構築,及び,実証実験(対話型情報アクセス(テーマセッション4))
- ラダリング型検索サービスのための対話エンジンの設計・開発(対話型情報アクセス(テーマセッション4))
- 改版文書翻訳システムにおける文脈を考慮した文対応付け手法(言語理解とコミュニケーション一般)
- 日英機械翻訳における慣用表現の辞書登録方式
- 形態素解析のための知識獲得方式
- 隣接文字情報を用いたn-gram抽出文字列からの名詞句の自動抽出
- 隣接文字情報を用いた n-gram抽出文字列からの名詞句の自動抽出
- 隣接文字の分散値を用いた定型表現の自動抽出
- 日常業務で使う機械翻訳ツール(機械翻訳)
- 第7回機械翻訳サミット参加報告
- n-gram 統計による抽出文字列の品詞推定
- 改版文書の翻訳を支援する差分翻訳システム
- 差分翻訳システムにおける対訳文書の文の対応付け
- 長尾 真(編), 岩波講座ソフトウェア科学15自然言語処理, (株)岩波書店, 601p, 4,800円, 1996, ISBN4-00-010355-5 C3355
- 対訳テキストを用いた分野別翻訳規則の抽出
- 言語資源を活用した実用的な対訳表現抽出
- 対訳コーパス中の共起頻度に基づく対訳表現の自動抽出
- 対訳コーパス中の共起頻度に基づく対訳表現の自動抽出