中日対訳コーパスの作成状況と今後の課題
スポンサーリンク
概要
- 論文の詳細を見る
筆者らは複数言語の対照研究に利用できる「中日対訳コーパス」を中国社会科学基金助成の共同研究プロジェクトとして作成している。これはコンピュータ技術の飛躍的発展とマルチ言語環境の迅速な改善により実現可能になった。本稿では1300万字の規模をもつその基礎版の内容と多言語処理機能を披露し、現在の進捗状況と今後の課題を紹介するとともに、特にアラインメントの簡易化と効率化、中日両国語の対応表示と検索、情報付与基準の標準化、言語対照研究への応用などの問題を取り上げ、現場からの報告と提言を行う。
- 一般社団法人情報処理学会の論文
- 1999-11-25
著者
-
中野 洋
国立国語研究所言語体系研究部
-
中野 洋
国立国語研究所日本語教育センター
-
中野 洋
国立国語研究所
-
中野 洋
国語研
-
隈井 裕之
(株)日立製作所映像メディア研究所
-
曹 大峰
山東大学
-
徐 一平
北京日本学研究センター
-
隈井 裕之
日立製作所
-
曹 大峰
山東大学:国立国語研究所:北京日本学研究センター
関連論文
- 失語症者の助詞選択に関する計量国語学的検討(2):助詞と動詞の結びつきを中心に
- 失語症者の助詞選択に関する計量国語学的検討(1) : 名詞と助詞の結びつきを中心に
- 辞書先読み方式のかな漢字変換におけるメモリ利用効率に関する考察
- 日本語ワープロにおける入力モード自動変更方式
- ワープロ用英字切り出し処理付き入力モード自動変更機能の開発
- ワードプロセッサにおける地名入力用高精度かな漢字変換方式について
- かな漢字変換における構文意味解析速度の向上
- 情報化社会における多言語解析とインターネット : 日中、日韓における翻訳メールシステム
- 日中・日韓双方向間の機械翻訳メールシステム
- M-006 文書クラスタリングを用いたコミュニティ抽出(M分野:ユビキタス・モバイルコンピューティング)
- 情報処理研究とターミノロジーから見た『分類語彙表』 : 分類の体系と専門語の扱い(シソーラス : 領域知識の体系化)
- 中日対訳コーパスの作成状況と今後の課題
- 『分類語彙表』の現状と将来 (特集 語彙の諸相) -- (基本語彙・シソ-ラス)
- 取り立て助詞「ばかり」と"〓"の意味と用法
- エジプトにおける流行歌の語彙
- 語彙調査用プログラム集MCL
- 『分類語彙表』の増補について
- 中国における流行歌の語彙
- 童謡の作品別語種・品詞分布
- 童謡におけるリフレインと語の度数分布
- 「(て)いただく」文における省略
- UMIST〔University of Manchester Institute of Science and Technology〕のCCL〔Centre of Computational Linguistics〕--イギリスだより
- ロ-マ字つづりのゆれ
- 看板の文字調査
- 流行歌(昭和58年)の語彙
- 「分類語彙表」の語数
- 擬声語・擬態語のイメ-ジ--意味微分法による分析-続-
- 擬声語・擬態語のイメ-ジ--意味微分法による分析
- いわゆるL字型分布からはずれる語彙量の分布について
- 構文自動解析の試み
- 日本語学と日本語情報処理
- 日本語研究用データベースについて
- 日本語の形態素分析(日本語情報処理)
- このごろのコマーシャル(合評)
- 同音類義語間の意味関係
- 人間関係分析技術を活用した有識者検索システムの提案(オフィスインフォメーションシステム,グループウェア及び一般)
- 人間関係分析技術を活用した有識者検索システムの提案(オフィスインフォメーションシステム,グループウェア及び一般)
- 言語情報処理における意味の把握についての一方策
- 読者投稿 ピン音表記を用いた文法解析型複数文節中国語文章入力システム
- 文字連糸とイメ-ジ (言語)