統計手法と言語特徴を用いたテキストアライメント
スポンサーリンク
概要
- 論文の詳細を見る
機械翻駅などの研究で用いられる対訳テキストは,テキスト全体としては対応付けられているが,文ごとまたは単語ごとについては対応付けられていない.そこで本研究では,この対訳テキストの文の対応付け(テキストアライメント)を統計情報(対応組パターンの生起確率と文字数比)と言語特徴を用いて行う手法について述べる.各対応組の評価値を対応組パターンの生起確率と文字数比で求め,動的計画法を用いて最も良い対応組列を求めることにより文の対応付けを行う.日本語と英語,日本語と中国語を対象とする.言語特徴としては,日本語と英語の場合は,日本語の各種表記を用い,また,日本語と中国語の場合は,漢字の一致数を考慮する.文対応付けの実験を行い,日本語と英語の場合には,全体として75%程度,日本語と中国語の場合には,60%弱の精度が得られた.
- 社団法人電子情報通信学会の論文
- 2001-03-16
著者
関連論文
- 形態素解析情報に基づく長い日本語ニュース文の分割
- 統計手法と言語特徴を用いたテキストアライメント
- 自然言語記述からプログラムへの生成を支援するシステムの提案
- E-015 複合語翻訳による異言語で記述された書誌情報の同定(E.自然言語・文書・ゲーム)
- 対訳コーパスから細粒度翻訳知識の自動獲得手法
- 関連語を用いた文の分解に基づく中日機械翻訳システム
- 中日機械翻訳における離合詞の処理手法
- 中国語表層構造の特徴を利用した中日機械翻訳手法
- 日中機械翻訳における係り受け構造の可保留曖昧関係について
- 中日機械翻訳における中国語複合語の自動合成について
- 構文構造に基づく中日機械翻訳システム
- 意味属性による中国語補助語の推定アルゴリズム
- 家族モデルを用いた文の分解に基づく日中機械翻訳システム
- 日中常用文型機械翻訳システム
- 論文データベースからのイディオム用例検索(検索)
- 文書横断文間関係を考慮した動向情報の抽出と可視化(情報抽出・可視化)
- 特許, 論文データベースを統合した検索環境の構築(重要語抽出・検索・文書分類)
- 文書横断文間関係を考慮した動向情報の抽出と可視化(情報抽出・可視化)
- 特許, 論文データベースを統合した検索環境の構築(重要語抽出・検索・文書分類)
- 嗜好を考慮した評判情報検索手法(Web情報処理)
- 嗜好を考慮した評判情報検索手法(Web情報処理)
- 語の好感度に基づく自然言語発話からの情緒生起手法
- 真偽疑問文における返答発話の肯定/否定意図の解析とWebインタフェースへの応用
- 肯定/否定意図を検出するチャットシステムのための肯定値計算手法の改良
- 肯定/否定意図を検出するチャットシステムのためのあいづち生成手法
- 感情表現発話からの嗜好情報学習手法
- 対話の知識構造からの嗜好情報学習手法
- 配列アラインメントを用いた形態素レベルでの逸脱解消
- AP電経済ニュースからの定型パターンの抽出
- 統計手法と言語特徴を用いたテキストアライメント
- TSPO特徴を利用した中日機械翻訳
- 中日言語のTSPO特徴及びCJMTへの応用について
- 衛星放送ワールドニュースの英日機械翻訳
- 学習可能性の理論 (情報科学の数学的理論)
- シナリオを対象とした構文解析規則記述法
- 基本動詞と動作名詞の組み合わせ表現の英日機械翻訳手法
- 外電経済ニュースの英日機械翻訳
- 外電経済ニュースの英日機械翻訳
- 心象の変化を考慮した指示詞の照応解析
- 日本語ゼロ代名詞補完のためのグローバルトピックの役割
- 自由展開タイプの対話のための対話処理システムに関する考察
- 英語ニュースデータベースの構築
- 英日機械翻訳における固有名詞処理
- 静止画検索システム FORKS の試作
- 統計情報と文章構造特徴に基づく重要文の自動抽出
- 中国語機械翻訳における敏感語概念