表層的な文脈情報を用いた自然な文生成の試み
スポンサーリンク
概要
- 論文の詳細を見る
英日機械翻訳において、代名詞の翻訳は解決が非常に困難なものの一つである。ゼロ代名詞の補完や代名詞の照応、あるいは特定分野における代名詞の訳語選択などは言及されることが多いが、自然な日本語を生成するために、英語で代名詞になっているものをそのまま代名詞で翻訳するか、あるいは照応先の名詞で置き換えるかなどの翻訳方法の差異の要因は、まだ明らかでない。代名詞処理は補完あるいは照応解析に主眼が置かれており、特に生成の際の省略に関しては、「日本語は省略が可能な言語だから重複する情報はどんどん省略すればよい」などと言われることがある割には、その妥当性についてはあまり触れられることがない。また、一般の機械翻訳システムでは、省略による誤解や誤った情報欠落を防ぐために、重複する情報であっても重複したまま出力することが多い。人間の翻訳者による翻訳はある程度自然な文生成の一例と言える。本稿では、自然な日本語文を生成するための一つの試みとして、代名詞の翻訳方法に着目し、英文と人間の翻訳者によるその日本語への翻訳文を対象に代名詞翻訳方法を分類して、自然な日本語を生成する際の代名詞の生成処理方法について考察する。また、その生成処理の中で、表層の文脈情報をどれだけ適用することができるかを調査し、代名詞訳出における表層的な文脈情報の有効性を検証する。
- 一般社団法人情報処理学会の論文
- 1996-03-06
著者
-
荻野 紫穂
日本アイ・ビー・エム(株)東京基礎研究所
-
荻野 紫穂
日本アイ・ビー・エム株式会社東京基礎研究所
-
那須川 哲哉
日本アイ・ビー・エム株式会社東京基礎研究所
-
荻野 紫穂
日本ibm株式会社東京基礎研究所
-
荻野 紫穂
日本アイ・ビー・エム
-
那須川 哲哉
日本アイ・ビー・エム 東京基礎研
関連論文
- 剖検記録の音声認識のための言語モデル作成
- 構造を仮定しない文解釈の一手法
- 形態素係り受けモデルによる構文解析
- 単語単位による日本語言語モデルの検討
- 単語を認識単位とした日本語の大語彙連続音声認識
- 岩波国語辞典を利用した語義タグ付きテキストデータベースの作成
- テキストマイニング技術を用いた企業評価分析 : 倒産企業の実証分析
- テキストマイニングの普及に向けて : 研究を実用化につなぐ課題への取組み
- 開発者の視点からの機械翻訳システムの技術的評価 : テストセットを用いた晶質評価法
- コールセンターにおける目的を持ったビジネス会話のモデリングと会話マイニングへの応用
- 木構造変換を利用した評判分析手法
- パターンベース翻訳システムPalmTreeの文脈処理
- 正規文法に基づく日本語形態素解析
- IBM電話音声自動応答システム(音声処理技術のデモの紹介)
- リストのラベルとして使われる丸括弧とリストの範囲
- 形式的でない表現における"ん""ちゃ""じゃ""きゃ"の接続上の性質
- "「」"で括られた表現の接続と係り受けの性質
- テキストマイニングのための情報抽出
- テキストマイニングのための情報抽出
- 大量のテキストからの知識マイニング
- 知識発見のためのテキストマイニング技術
- 4N-6 知識発見のためのテキストマイニング技術
- テキストマイニングのための情報抽出手法
- 翻訳精度評価手法BLEUの日英翻訳への適用
- 重要文と要約の差異に基づく要約手法の調査
- 単語を認識単位とした日本語大語彙連続音声認識
- 単語を認識単位とした日本語ディクテーションシステム
- 人の発声単位を考慮した日本語言語モデルの検討 : 日本語における単語とは
- 表層的な文脈情報を用いた自然な文生成の試み
- 知識ベースを利用した機械翻訳システムShalt2 ( 自然言語処理の実動システム)
- 日本語における付属語の現れ方と規則
- 英日機械翻訳システムShalt2の日本語生成文法
- 英日機械翻訳システムShalt2における並列句の取り扱い
- 日本語形態素解析用文法規則の使用状況
- 編集にあたって(使いやすくなった自然言語処理のフリーソフト : 知っておきたいツールの中身)
- 読点を伴う連体修飾の係り先
- 文脈制約と文脈選好を利用した文脈処理システムDIANA
- 漸進的学習機能を備えた日本語形態素解析
- 日本語における文節間係り受け関係の統計的性質
- 2 テキストマイニング : 膨大な文書データの自動分析による知識発見 (フィールドを広げる自然言語処理)
- テキストマイニング : 膨大な文書データからの知識獲得 : 概要
- テキストマイニング : 膨大な文書データからの知識獲得 : 意図の認識
- 編集にあたって (フィールドを広げる自然言語処理)
- コールセンターにおけるテキストマイニング(「テキストマイニング」)
- テキストマイニング基盤技術(「テキストマイニング」)
- 頑健な文脈処理のパラダイム : 文脈依存性を考慮した自然言語処理
- 文や句による日本語テキストの検索 : 語と語の係り受けを用いた検索の試み
- 文脈情報を利用した自然言語文における構造的曖昧性の解消
- テキスト分析技術を用いた開発関連文書の文書品質の定量化(テーマセッション)
- 情報科学・工学, 私はこう考える : 自然言語処理, 私はこう考える
- 形態的情報を使った日本語辞書情報の整備
- ACL'95会議報告
- 文脈情報を利用した不適格文の構文解析
- 自然言語解析における複数文一括処理手法
- 自然言語処理システムにおける出力信頼度の自動評価
- 文脈制約を利用した曖昧性解消
- ソフトウェア開発における文書成果物の分析技術とその活用