非線形な表現構造に着目した日英文型パターン化(機械翻訳・言い換え)
スポンサーリンク
概要
- 論文の詳細を見る
要素合成法を基本とした従来の機械翻訳方式の限界を突破する方法として,非線形な言語表現の構造を意味のまとまる単位にパターン化した文型パターン翻訳方式が期待される.本論文では,重文と複文を対象に,この方式の実現に必要な文型パターン辞書を試件した.具体的には,100万件の日英対訳コーパスから2つ又は3つの述部を持つ重文と複文合計15万件を抽出し,単語レベル(12.8万件),句レベル(10.5万件),節レベル(1.3万件)の3種類のグループからなる文型パターン辞書(合計24.6万件,異なり22.1万件収録)を作成した.各文型パターンは,いずれも形態素解析によって得られる文法情報を用いて記述することとし,対訳標本文に含まれる線形な表現要素を半自動的に変数化,関数化することなどにより件成したものである.従来,大規模な文型パターン辞書の開発は,文型パターン間の意味的排他性実現の困難性と膨大な開発コストが問題となるため,適用対象を限定するなど小規模な実現例しか見られなかった.しかし,今回の試作によって,ほぼすべての標本文(99%)が多くの線形要素(平均4〜5ヵ所)を持つことが分かった.また,それらの要素を半自動的に関数化,変数化を行うことにより,文型パターンの開発コストは人手に頼る方法の約1/10に削減できた、これにより,実験的検討に必要な規模の文型パターン辞書を構築することができた.
- 2004-03-04
著者
-
村上 仁一
鳥取大学工学部
-
池原 悟
鳥取大学工学部
-
徳久 雅人
鳥取大学工学部知能情報工学科
-
阿部 さつき
NTTアドバンステクノロジ(株)
-
阿部 さつき
Nttアドバンステクノロジ株式会社
-
徳久 雅人
鳥取大学工学部
関連論文
- 音節波形接続型音声合成の文節への適用(一般, 一般, チュートリアルレクチャー)
- Tree Based Clusteringを利用した音節波形接続型音声合成法に関する検討(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 対話行為と情緒を解析するための文末表現パターンの作成(「主観表現処理の最前線」シンポジウム)
- 言語情報のみを用いた音節クラスタリングの音節波形接続型音声合成法への適用
- 意味的用法に着目した日本語名詞の英訳語選択について
- 日本語語彙大系について
- 結合価パターンを用いた日中機械翻訳システムの構築(翻訳・応用)
- 漫画における表情に着目した情緒タグ付きテキスト対話コーパスの構築
- 音節波形接続による単語音声合成
- Tree Based Clusteringを利用した音節波形接続型音声合成法に関する検討(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- Tree Based Clusteringを利用した音節波形接続型音声合成法に関する検討(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 想起型情報検索方式の提案
- 「の」型名詞句に対する形容詞の係り先解析
- E_036 情緒タグ付き日記コーパスの作成と評価(E分野:自然言語)
- 非線形な重文複文の表現に対する文型パターン辞書の開発(機械翻訳)
- 意味類型構築のための文接続表現の体系化
- 機械翻訳のための日英文型パターン記述言語
- 機械翻訳のための日英文型パターン記述言語
- 等価的類推思考の原理による機械翻訳方式
- 大規模録音音声データーベースにおけるピッチ正規化の検討
- 日英新聞記事の自動記事対応付け
- 日英新聞記事の自動記事対応付け
- 英語辞書と英文法を用いたカタカナ表記語の翻訳
- 広域直接翻訳における品詞変換処理
- 音節波形接続型音声合成の文節への適用
- 多義解消のための構造規則の生成方法と日本語名詞句への適用
- 「の」型名詞句における係り受け規則の自動生成法
- 統計翻訳における,単文と重文複文の翻訳精度の評価(機械翻訳・言語識別)
- A-13-2 情緒的な意味理解による省略解析への接近(A-13. 思考と言語,一般セッション)
- A-13-1 情緒生起原因を表す結合価パターン辞書への判断条件の補強(A-13. 思考と言語,一般セッション)
- Web検索エンジンを用いたWhy型質問応答システムに関する研究(特許分類)
- 結合価パターンを用いた日中機械翻訳システムの構築(翻訳・応用)
- Web検索エンジンを用いたWhy型質問応答システムに関する研究(特許分類)
- 話者適応における学習データ内の音素数と認識精度の考察(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 日英機械翻訳のための単語辞書
- 日英機械翻訳のための単語辞書
- 音節連鎖特性に着目した対話文の言い直し表現の抽出法
- 音節連鎖特性に着目した対話文の言い直し表現の抽出法
- 「AのB」型名詞句の日英翻訳規則について
- FBANKを用いた孤立単語音声認識
- モーラ情報を用いたフィルタバンクによる孤立単語認識
- モーラ情報を用いたフィルタバンクによる孤立単語認識
- モーラ情報を用いたフィルタバンクによる孤立単語認識
- 結合価パターン対作成のための日英対訳用例文の収集
- 読みの情報を用いた仮名漢字変換の精度向上効果の推定
- 心的状態を表す対話行為タグ付きテキスト対話コーパスの構築(思考と知識検索・獲得,一般)
- AS-5-4 重文・複文文型パターン辞書による意訳の可能性(AS-5.言語の意味と思考過程,シンポジウム)
- AS-5-3 情緒を表す文末表現の書き換えの試行(AS-5.言語の意味と思考過程,シンポジウム)
- 置換えを用いたn-gramによる言語表現の抽出
- 置換えを用いたn-gramによる言語表現の抽出
- マルコフ連鎖モデルを用いた日本語文誤り検出法の改善
- 音声対話文に含まれる離散的な言い直し表現の抽出法
- 単語辞書引きを用いたべた書きかな文の仮文節境界の補正方法
- 日本語文の複合誤り文字列の検出訂正法
- N-gramを用いた対話文の言い直し表現の検出法
- 日本語文の相互干渉誤り文字列の検出・訂正方法
- N-gramを用いた対話文の言い直し表現の検出法
- 2重マルコフモデルを用いたべた書きかな文の仮文節境界の推定方法
- 日本文意味検索に必要な最小単語意味属性の組の決定
- 日英機械翻訳における語用論的・意味論的制約を用いたゼロ代名詞の文章外照応解析
- 新聞記事日本文における修飾句と被修飾複合語の関係
- 日本文書き替え処理における制御機能の構成について
- 第15回年次大会を終えて
- 単語意味属性を使用したベクトル空間法
- てくのえつせい 技術とロマン Part III, 中山勝矢著, ISBN4-88517-304-3 : 私のすすめるこの一冊
- A-13-4 Webを知識源とする質問応答システムにおけるパターン方式とキーワード方式の比較(A-13.思考と言語,一般講演)
- 音節波形接続型音声合成の普通名詞への応用
- 統計翻訳における人手で作成された大規模フレーズテーブルの効果
- 意味属性を基底とするベクトル空間法の検索精度
- 話者適応における学習データ内の音素数と認識精度の考察(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 話者適応における学習データ内の音素数と認識精度の考察(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 音節波形接続による単語音声合成
- 非線形な表現構造に着目した日英文型パターン化(機械翻訳・言い換え)
- 意味的等価変換方式のための重文複文の統語的意味的分類体系について(文の解析)
- モーラ情報を用いた音素ラベリング方式の検討(第5回音声言語シンポジウム : ポスターセッション)
- モーラ情報を用いた音素ラベリング方式の検討(第5回音声言語シンポジウム : ポスターセッション)
- モーラ情報を用いた音素ラベリング方式の検討
- モーラ情報を用いた単語音声認識の研究
- 日英機械翻訳のための文型パターン辞書の圧縮に関する検討(インターフェース・ツール)
- 音節波形接続型音声合成における自動セグメンテーションの影響(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 音節波形接続型音声合成における自動セグメンテーションの影響(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 音節波形接続型音声合成における自動セグメンテーションの影響(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 音節波形接続型音声合成における自動セグメンテーションの影響
- 日英対訳パターンの自動抽出に向けて
- AS-5-2 情緒状態と直結した情緒反応を表す用言の結合価パターン辞書の構築(AS-5.言語の意味と思考過程,シンポジウム)
- AS-5-1 非線形言語モデルに基づく文型パターン型言語知識べースの開発(AS-5.言語の意味と思考過程,シンポジウム)
- AS-7-3 日記文における情緒生起の原因に着目した情緒推定の実験(AS-7.円滑なコミュニケーションと感情,シンポジウム)
- アクセントを用いた同音異義語の不特定話者音声認識(聴覚・音声・言語とその障害,一般)
- 日本語重文・複文を対象とした文法レベル文型パターンの被覆率特性
- 動詞節に修飾された名詞句の係り受け解析(文構造解析)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- 動詞節に修飾された名詞句の係り受け解析(文構造解析)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- 結合価文法による動詞と名詞の訳語選択能力の評価
- 非線形な表現構造に着目した重文と複文の日英文型パターン化
- 結合価文法による動詞と名詞の訳語選択能力の評価
- モーラ情報を用いた単語音声認識の検討
- モーラ情報を用いた単語音声認識の検討
- モーラ情報を用いた単語音声認識の検討
- 動詞と名詞の意味的共起関係を用いた同音異義語のかな漢字変換
- A-13-5 機械翻訳における文認識率による評価手法の提案(A-13.思考と言語,一般セッション)
- PB電話機を用いた自動電話番号案内システムの開発と評価(データ工学,Web情報システム,システム開発論文)