対訳付慣用表現の収集について(その2)
スポンサーリンク
概要
- 論文の詳細を見る
機械翻訳の基礎的知識(Basic Knowledge)としては単語、複合語、専門用語、概念、概念と概念の関係、慣用表現等が考えられる。個々に研究を進めなければならないが、私の考えでは複合語と慣用表現の対訳付データの大量の収集と研究、体系化がなかなか進んでいないと考える。これは機械翻訳の応用分野がある特殊な分野に限られているためで、広くて一般的な分野に移れば、この分野は重要な問題になると考えている。数量としても数万から数十万の慣用表現データが必要である。また高級な知識とは:「水は摂氏℃0度で凍る」とか「アメリカは原爆を日本の広島と長崎に落とした。」「その結果、数十万の人々を殺した。」というようなものである。高級な知識、又は基礎的な知識の中間に位置するようなものも考えてゆかねばならない。例えば諺等がそれである。
- 1996-09-04
著者
関連論文
- 機械可読辞書の検査 : サ変名詞について
- 対訳付慣用表現の収集について(その2)
- 対訳付慣用表現の収集について
- コンピュータの歴史
- 情報処理と素数について
- 機械翻訳システムの評価と基準
- 機械翻訳システムの評価と基準
- 2000-NL-137-2 機械翻訳システムの今後について
- 3N-3 機械翻訳システムの評価と改善
- 機械翻訳システムの評価と改善
- 3W-1 機械翻訳システムの評価 : 品質向上にむけて
- 機械翻訳用テストデータ
- Knowledge Data that Support Natural Language Processing
- 対訳付慣用表現の収集について (その3)
- 対訳付慣用表現の収集について
- 対訳付慣用表現の収集について
- カタカナ表記について
- 機械可読辞書の見出しについて
- Acquisition of Knowledge Data for Natural Language Automatic Coding of Five Chinese Character Strings
- 大規模コーパスの分析
- 機械可読辞書の更新について
- 大規模コーパスの分析 : 日経新聞5年分をもちいて
- 機械可読辞書の更新について(その3)