日英機械翻訳に必要な結合価パターン対の数とその収集方法
スポンサーリンク
概要
- 論文の詳細を見る
機械翻訳における意味解析には,動詞と名詞の意味的な共起関係に着目した結合価が有効であることが知られている。最近,用例から自動学習によって結合価パターンを自動生成する方法が研究されている。しかし,どれだけの数のパターン対を用意すればよいかが不明であること,また,それを作成するに必要な用例を現実の文書から網羅的に収集するのは困難であること等の問題があった。これらの問題を解決するため,本論文では,人用の辞書の知識と人の知識を内省する方法で作成した用例を使用して,和語動詞の一部を対象にパターン対の作成実験を行った。具体的には,(1)和英辞書から収集する方法,(2)和英辞書に加え日本語動詞の語義対応の用例を使用する方法,(3)それらを参考に人の知識に基づいて用例を作成する方法,の3種の方法を取り上げ,30種の和語動詞に対するパターン対の数を比較した。その結果,(2)の方法は(1)の方法の約2倍,(3)の方法はさらにその2倍のパターン対が収集できることが分かった。また,日英機械翻訳において訳し分けの必要な約1,000種の和語動詞に対し約7,500件のパターン対が必要であり,それを作成するには15,000件の用例収集が必要であることなどが分かった。これらの結果,漢語動詞や用言性慣用表現を含む日本語述語全体では約25,000件のパターン対が必要であること,また,人手でパターン対を作成する場合は,辞書情報などを参考に人の知識を内省して用例を作成する方法によって,パターン対作成に必要な用例をほぼ網羅的に収集できることが分かった。
- 一般社団法人情報処理学会の論文
- 1995-11-17
著者
-
井上 浩子
Nttアドバンステクノロジ(株)
-
白井 諭
Ntt-アドバンステクノロジ株式会社
-
白井 諭
Nttコミュニケーション科学研究所
-
横尾 昭男
Nttコミュニケーション科学基礎研究所
-
池原 悟
NTTコミュニケーション科学研究所
関連論文
- 日本語語彙大系について
- 意味類型構築のための文接続表現の体系化
- 機械翻訳のための日英文型パターン記述言語
- 機械翻訳のための日英文型パターン記述言語
- 等価的類推思考の原理による機械翻訳方式
- 市況速報文を対象とする用例利用型日英機械翻訳
- 日英新聞記事の自動記事対応付け
- 日英新聞記事の自動記事対応付け
- DBから抽出した日英新聞記事の自動対応付け
- 重要語句抽出による新聞記事自動要約
- 重要語句抽出による新聞記事自動要約
- 1D-1 新聞記事の自動要約によるニュース速報配信
- カタカナ表記述語の日英機械翻訳
- 日英翻訳のための日本語解析技術 (特集論文 日英機械翻訳技術)
- 発音情報を用いた訳語対の自動抽出
- 広域直接翻訳における品詞変換処理
- 大規模日本語コーパスからの連鎖型および離散型の共起表現の自動抽出法
- 大規模日本語コーパスからの連鎖型および離散型共起表現の自動抽出法
- 日英機械翻訳における原文自動書き替え型翻訳方式とその効果
- 日本文書き替え処理における制御ルールの機能別構成
- 日英機械翻訳における原文自動書き替え型翻訳方式とその効果
- 日英機械翻訳における原文自動書き替え型翻訳方式とその効果
- 「の」型名詞句における品詞情報と意味情報を併用した係り受け規則の自動生成
- 名詞間係り受け解析に必要な単語意味属性の組の最適化
- 「の」型名詞句における係り受け規則の自動生成法
- 市況速報記事を対象とした日英翻訳システムの構成
- IPAL動詞辞書の用例文に基づく日英翻訳用結合価パターン対の収集
- 専門分野対応の日英機械翻訳用構文意味辞書の構築
- 日英機械翻訳に必要な結合価パターン対の数とその収集方法
- IPAL動詞辞書との対比による日英翻訳用構文意味辞書の充足性の検討
- 日英機械翻訳用構文意味辞書の記述精度の向上と作成支援
- 日英機械翻訳のための単語辞書
- 日英機械翻訳のための単語辞書
- 市況速報記事に対するテンプレート型日英翻訳の効果
- 速報型日英翻訳システムALTFLASH
- バイリンガル旅行会話コーパスに見られる話し言葉の特徴分析
- 3N-4 ナ型形容詞に対する日英対訳用例文の収集について
- 決定木を用いた日本語係受け解析
- 複合和語動詞に対する日英対訳用例文の収集について
- 日本文新聞記事からの英文ヘッドライン生成法について
- 英単語に対する述語性の連語的日本語訳語の分析
- 日英機械翻訳システムALT-J/Eの研究開発 (特集論文 日英機械翻訳技術)
- 新聞記事文における括弧書き表現の分析とその処理について
- マルコフモデルによる言い直し対象の文字列の検出について
- FAXを入出力に用いた翻訳通信システムの検討
- SP2000-21 音声翻訳システム(ATR-MATRIX)の評価
- 結合価パターン対作成のための日英対訳用例文の収集
- 日本語文音声出力からの読み情報を用いた漢字かな混じり文 : 節候補の絞り込み
- 和語動詞に対する日英対訳用例文の収集について
- 置換えを用いたn-gramによる言語表現の抽出
- 日本文意味検索に必要な最小単語意味属性の組の決定
- 日英翻訳システムの改良とタグ付きコーパスの作成
- 経験則とその限界
- 日英機械翻訳における語用論的・意味論的制約を用いたゼロ代名詞の文章外照応解析
- 新聞記事日本文における修飾句と被修飾複合語の関係
- 日英機械翻訳のための構文辞書
- 日英機械翻訳のための構文辞書
- 日英機械翻訳のための意味属性体系
- 日英機械翻訳のための意味属性体系
- 日英変換技術と意味辞書 (特集論文 日英機械翻訳技術)
- 日英機械翻訳のための結合価パターン対の作成支援処理
- 従属節の階層構造に基づく日本語長文の自動分割とその効果
- 新聞記事日本文における書き替え対象表現の分布
- 階層的認識構造に着目した日本語従属節間の係り受け解析の方法とその精度
- 階層的認識構造に着目した日本語従属節間の係り受け解析の方法とその精度
- 日英機械翻訳用スケルトン-フレッシュ型構文意味辞書の構成
- 日英機械翻訳における利用者登録語の意味属性の自動推定
- 言語における話者の認識と多段翻訳方式
- 日英翻訳システムALT-J/Eにおける日本語解析技術
- マルコフモデルによる音節文ラテイスからのキーワード候補の絞り込み
- 3重マルコフモデルによるべた書きかな文の仮文節境界の推定法
- マルコフモデルを用いたOCRからの誤り文字列の訂正効果
- 翻訳テンプレートの自動抽出 : 緩やかに対応付けされたデータからの対訳抽出
- 弱抑制による連鎖共起表現の抽出とそれに基づく離散共起表現の抽出
- 対訳コーパスから対応する表現対の自動抽出
- 語用論的・意味論的制約を用いた日本語ゼロ代名詞の文内照応解析
- 語用論的・意味論的制約を用いた日本語ゼロ代名詞の文内照応解析
- 対訳データの階層的なグループ化に基づく英日翻訳
- シソ-ラスで調べる--『日本語語彙大系』の概要と用法 (特集 ことばを調べる)
- 言語過程説に基づく日本語品詞の体系化とその効用
- 多段解析法による日本語形態素解析の精度
- 日英機械翻訳における利用者登録語の意味属性の自動推定
- 日英機械翻訳における利用者登録語の意味属性の自動推定
- 言語表現体系の違いに着目した日英機械翻訳機能試験項目の構成
- 従属節の依存関係を考慮した日本語係り受け解析の精度
- 日本語従属節の依存構造に着目した係り受け解析
- 日本語従属節の依存構造に着目した係り受け解析
- 用言意味属性を用いた日本語ゼロ代名詞の文章外照応解析
- 単語解析プログラムによる日本文誤字の自動検出と二次マルコフモデルによる訂正候補の抽出
- 機械翻訳の現状 : 日英及びその他の言語 (コンピュータ・コミュニケーションの現在)
- 近接単語の並びに着目した形態素解析多義の絞り込み
- 日本文書き替え処理における制御ルールの類型情報の抽出
- 日英機械翻訳における原文前編集の内容と効果について
- キ-ワ-ド自動抽出システム(INDEXER) (知能処理技術の応用)