係り受け木における機械翻訳のための品詞の教師なし学習
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,統語情報に基づく機械翻訳の翻訳性能を向上させるため,ノンパラメトリックベイズ法により,単語間の係り受け構造から各単語の品詞を推定する手法を提案する.提案手法は,単言語における無限ツリーモデル(Infinite Tree Model)を,原言語と目的言語の両言語を考慮するバイリンガルなシナリオに拡張した手法である.提案モデルでは,原言語の係り受け木における各品詞を隠れ状態とし,各隠れ状態は,原言語の単語とともに,対応する目的言語の単語をシンボルとして出力する.本稿では,原言語の単語と目的言語の単語を結合させて出力する「結合モデル」と,別々に出力する「独立モデル」を提案する.NTCIR-9の日英特許翻訳タスクにおける評価実験を通じて,提案手法により推定した日本語の品詞タグを使うことにより,forest-to-string翻訳システムの性能を改善できることを示す.また,独立モデルは,結合モデルが抱えるシンボルのスパースネス問題を解決し,既存の品詞を使う従来の翻訳よりもBLEUで1%以上性能を改善できることを示す.
- 2014-07-15
著者
関連論文
- 大域的な文章構造の類似性を利用したクローズドキャプション中の定型的な文章区間の抽出(自然言語処理)
- 半教師有りクラスタリングを用いた Web 検索結果における人名の曖昧性解消
- スピンモデルによる単語の感情極性抽出(自然言語)
- 新語義の発見 : 意味解析における新しいタスク(編集委員今年の抱負2009:経糸から横糸まで)
- iPhoneとiPod touchを使った英語語彙学習教材の開発(言語と学習,場の共創)
- NICTにおける音声・言語研究拠点MASTARプロジェクトについて(「ユニバーサルコミュニケーションを実現するための言語処理技術」シンポジウム)
- 機械翻訳の研究・開発における翻訳自動評価技術とその応用(テキストの自動評価)
- 放送番組を素材としたマルチメディア百科事典の自動構築
- 元会長 田中穂積先生を偲んで
- 特許,論文間の引用関係を用いた論文用語の特許用語への変換(語彙・文書書類)
- 2 ここまできた音声翻訳技術(多言語自動通訳技術の実現に向けて)
- イベントの生起時間帯判定(分類, ブログ)
- 1.テキスト評価分析の技術とその応用(ユーザ作成のコンテンツに着目した嗜好・評判抽出, 利用者の好みをとらえ活かす-嗜好抽出技術の最前線-)
- 抜粋による複数文書要約を評価するためのコーパスと評価指標
- C11 特許,論文データベースを統合した検索環境および動向分析ツールの構築(セッションC1(情報処理技術),一般発表概要:各セッション報告,INFOPRO2006)
- 文書横断文間関係を考慮した動向情報の抽出と可視化(情報抽出・可視化)
- 特許, 論文データベースを統合した検索環境の構築(重要語抽出・検索・文書分類)
- 文書横断文間関係を考慮した動向情報の抽出と可視化(情報抽出・可視化)
- 特許, 論文データベースを統合した検索環境の構築(重要語抽出・検索・文書分類)
- ブログマイニング技術の最新動向
- 代表性のあるコーパスを利用した日本語意味解析(日本語コーパス)
- WEB上の画像の分類とメタデータ付与による携帯電話向けWEB表示(セッション1:メタデータと自動分類、知識支援)
- WEB上の画像の分類とメタデータ付与による携帯電話向けWEB表示(セッション1:メタデータと自動分類、知識支援)
- 重要文抽出と文圧縮を組み合わせた新たな抽出的要約手法(翻訳・要約・抽出)
- テキストの結束性判定のためのentity gridモデルの素性の検討(意味・談話)
- 重要文抽出と文圧縮を組み合わせた新たな抽出的要約手法(翻訳・要約・抽出)
- テキストの結束性判定のためのentity gridモデルの素性の検討(意味・談話)
- 新たなパラダイムシフトの可能性
- ブログにおける偏り補正のための書き手のプロファイリング(情報の信頼性評価)
- 文書要約の最大充足化問題によるモデル化(翻訳・要約)
- 文書要約の最大充足化問題によるモデル化(翻訳・要約)
- 複数の分類スコアを用いたクラス所属確率の推定
- 文の感情極性判定における事例重み付けによるドメイン適応(情報抽出・評判分析)
- 単語の用例の半教師有りクラスタリング(単語・語彙(I))
- LG_003 統計翻訳のための言語モデルのオンラインタスク適応(G分野:音声・音楽)
- 言い換えを用いたテキスト要約の自動評価
- 言い換えを用いたテキストの自動評価
- 語義曖昧性解消のための領域適応手法の自動選択
- 言い換えを用いたテキストの自動評価
- AdaBoostを利用した字幕テキストからの定型表現文章区間抽出(テキストの類似性・文処理モデル)
- AdaBoostを利用した字幕テキストからの定型表現文章区間抽出(テキストの類似性・文処理モデル)
- 投票型回帰モデルによる要約の自動評価法
- 拡張ストリングカーネルを用いた要約システムの自動評価法(自然言語,情報処理技術のフロンティア)
- 文書要約の自動評価手法の提案と評価(セグメンテーション・要約)
- 国語辞典に「古い」と注記される語の現代書き言葉における使用傾向の調査
- 機械翻訳最新事情 : (下)評価型ワークショップの動向と日本からの貢献
- テキストの断片に対する局所的一貫性モデル
- 事象の認識による発話生成に向けて(特別セッション「言語理解と行動」(3))
- 情報量の異なる複数の視点を考慮した実況解説の自動生成
- 事象の認識による発話生成に向けて(特別セッション : 言語理解と行動(3))
- 繰り返し構造を用いたWebページの構造化に関する研究
- Web上のテキストコーパスを利用したオノマトペ概念辞書の自動構築
- AAAI90
- D-5-12 EMアルゴリズムを利用した属性名抽出の検討(D-5.言語理解とコミュニケーション,一般講演)
- E_017 クローズドキャプションを対象とした被写体の動作推定(E分野:自然言語)
- 論文用語の特許用語への自動変換
- 特集「実践的多人数インタラクションの動向と展望」にあたって
- blogからの比較関係抽出(web情報抽出)
- テキスト中のイベントの生起時間帯判定(自然言語)
- 外国人ための科学技術日本語読解支援システム「あすなろ」の開発
- 外国人ための科学技術日本語読解支援システム「あすなろ」の開発
- 大規模オープンソース日英対訳コーパスの構築
- 大規模オープンソース日英対訳コーパスの構築
- 3D-6 レストランレビュー文章群からの評判とその対象の抽出(自然言語処理,一般セッション,人工知能と認知科学)
- 格変換による単文の言い換え
- 技術成果を効果的に伝える表題作成支援手法 : 開発と評価(自然言語)
- タイトルの文型が読者の関心に及ぼす影響の分析
- 表題の表現が読者の関心に与える影響分析
- 隠れ変数モデルによる複数語表現の感情極性分類(自然言語)
- テキストを対象とした評価情報の分析に関する研究動向
- 極性反転に対応した評価表現モデル(言語の統計モデル)
- 極性反転に対応した評価表現モデル(言語の統計モデル)
- 文書内に現れる因果関係の出現特性調査(解析, QA, 言語調査)
- 文書内に現れる因果関係の出現特性調査(解析, QA, 言語調査)
- スピンモデルによる単語の感情極性判定(シソーラス・辞書)
- 分類スコアに基づいたクラス事後確率の推定(コーパス, 学習, 対話, 要約)
- 機械学習とルールベースの組み合わせによる自動職業コーディング
- ルールベース手法と機械学習による自由回答の分類 : 職業コーディング自動化の方法(非定型データ分析の可能性)
- 機械学習とルールベースによる職業コーディング(テキスト検索,分類)
- 英語ディクテーション学習支援システムの構築
- 符号化問題として解く日本語係り受け解析(文の解析)
- blog分類のための半教師有り学習(Web情報アクセス)
- blog分類のための半教師有り学習(Web情報アクセス)
- 単語極性反転モデルによる評価文分類
- 単語極性反転モデルによる評価文分類(感情・評価)
- 2 Text Summarization Challenge : 自動要約の評価型ワークショップ(テキスト自動要約 : 知的活動支援の基本技術として)
- テキスト処理研究の動向 : 情報抽出・自動要約・質問応答における評価ワークショップの重要性(NTCIR : 情報アクセスに関わるテキスト処理技術の評価ワークショップ)
- TSC2(Text Summarization Challenge 2)の目指すもの
- 情報検索と要約の評価 : 第2回NTCIRワークショップ概要
- NTCIR Workshop 2の新しいタスクの紹介 : テキスト自動要約タスク(情報検索システムの力くらべ : テストコレクションによる評価)
- 手がかり句を用いた特許請求項の構造解析(自然言語)
- ローカルアラインメントを用いたテキスト間の柔軟な対応付け
- 手がかり句を用いた特許請求項の修辞構造解析
- 手がかり句を用いた特許請求項の修辞構造解析
- 語彙的結束性に基づく語彙的連鎖の計算
- 複数の動作を伴うアニメーテッドエージェントの自然言語による制御
- Discrimination Network上での増進的曖昧性解消について
- 特集「情報の信頼性評価」にあたって
- テキスト結束性を考慮した entity grid に基づく局所的一貫性モデル
- 係り受け木における機械翻訳のための品詞の教師なし学習