アイヌ語-日本語対訳コーパスを対象とした局所着目型学習による対訳語の自動抽出
スポンサーリンク
概要
- 論文の詳細を見る
対訳辞書の品質向上のために対訳コーパスから対訳語を抽出することは、より自然な訳語や新たな表現の訳語を得るために非常に有効である。しかし、これまでの対訳コーパスから対訳語を自動抽出する研究では、大規模な対訳コーパスが不可欠となる。様々な言語を対象とした場合、常に大規模な対訳コーパスが得られるとは限らないため、この問題は深刻である。我々は、この問題点を解決するために新たな手法として、局所着目型学習を用いた対訳語の自動抽出手法を提案する。本手法は、対訳文中の局所部分を対象に語の対応関係を決定するため探索範囲を限定できる。さらに、言語間のコロケーションを利用することで、抽出対象の対訳語そのものの出現頻度が低い場合でも対訳語を効率よく自動抽出することが可能である。性能評価実験では、名詞および動詞対訳語の平均出現頻度が1.96である小規模なアイヌ語-日本語対訳コーパスを対象に名詞対訳語と動詞対訳語の自動抽出を試みた。実験の結果、再現率として54.0%、適合率として60.8%が得られた。この結果は、統計的手法の再現率に比べ10%以上高い値であり、本手法の有効性を示すものである。さらに、既存の辞書には存在しない、より自然な訳語や新たな表現の訳語の抽出も確認された。
- 北海学園大学の論文
- 2005-02-21
著者
-
荒木 健治
北海道大学情報科学研究科
-
越前谷 博
北海学園大学工学部
-
桃内 佳雄
北海学園大学工学部電子情報工学科
-
桃内 佳雄
北海道大学大学院工学研究科情報工学専攻
-
荒木 健治
北海道大学大学院情報科学研究科
-
桃内 佳雄
北海学園大学大学院工学研究科電子情報工学専攻
-
荒木 健治
北海道大学大学院工学研究科
関連論文
- 対訳コーパスに基づく学習型機械翻訳における省略可能情報を用いた部分対応学習の有効性(自然言語処理)
- 反対語を利用した文脈依存評価表現の感情極性判定 (画像符号化・映像メディア処理レター特集)
- 認識信頼度と対話履歴を用いた音声言語理解手法(音声,聴覚)
- 英語およびブルガリア語におけるコモンセンス表現収集のための文脈的アプローチの応用(マイニング・知識獲得・固有表現)
- 反対語を利用した文脈依存評価表現の感情極性判定(自然言語処理)
- TF・AoIを用いた類似性による発話予測(対話(2))(第6回音声言語シンポジウム)
- 画像に対する発話からの名詞概念の獲得(語彙・概念の獲得と同義語)
- 学習型機械翻訳手法における省略可能性を用いた翻訳ルールの自動獲得とその有効性(翻訳・応用)
- 隣接情報学習を用いた多言語対訳コーパスからの対訳語の自動抽出(自然言語処理)
- アイヌ語-日本語対訳コーパスを対象とした局所着目型学習による対訳語の自動抽出
- 隣接情報に基づく対訳語の自動抽出手法(情報抽出・翻訳知識獲得)
- 局所着目方式によるアイヌ語 : 日本語名詞対訳語の抽出について(抽出,マイニング)
- 再帰チェーンリンク型学習を用いた帰納的学習による対話処理手法の複数被験者による性能評価(インタフェース,対話)
- 局所着目方式によるアイヌ語ー日本語名詞対訳語の抽出について(抽出, マイニング)(言語理解とコミュニケーション)
- 局所着目方式によるアイヌ語-日本語名詞対訳語の抽出について
- 再帰チェーンリンク型学習を用いた帰納的学習による対話処理手法の複数被験者による性能評価(インタフェース, 対話)(言語理解とコミュニケーション)
- 再帰チェーンリンク型学習を用いた帰納的学習による対話処理手法の複数被験者による性能評価
- 翻訳例に基づく再帰チェーンリンク型学習による機械翻訳手法
- E-56 対訳コーパスからの辞書未登録語抽出における再帰チェーンリンク型学習の有効性について(機械翻訳(2),E.自然言語・文書)
- E-49 再帰チェーンリンク型学習を用いたアイヌ語-日本語間の対訳辞書の自動構築について(機械翻訳(1),E.自然言語・文書)
- 局所部分の着目により再帰的に翻訳ルールを獲得する学習型機械翻訳手法GA-ILMT2
- 学習型機械翻訳手法GA-ILMTにおける状態遷移の導入について
- 3N-1 GA-ILMTにおける状態遷移を用いた翻訳ルールの階層化とその有効性
- GA-ILMTにおける状態遷移を用いた翻訳ルールの自動階層化
- 旅行用英会話文におけるGA-ILMTの有効性について
- 遺伝的アルゴリズムにおける解析的知識を用いた制約の有効性
- 対訳コーパスに基づく学習型機械翻訳における省略可能情報を用いた部分対応学習の有効性
- N-gram を用いた再帰差異共通部分抽出法によるユーザの行動予測手法
- 市議会会議録を対象とした概念体系構築へ向けた分析(単語・事象・オントロジー)
- E-031 複数語句から象徴語句への換言可能性に関する考察(E分野:自然言語・音声・音楽)
- E_022 二分依存関係に基づく深層格推測手法(E分野:自然言語)
- 単語概念の深層格選好に基づく深層格推測手法(自然言語処理)
- E-004 ネットワークの活性値に基づく深層格解析手法(E分野:自然言語)
- ネットワークの活性値に基づく深層格解析手法の提案(文脈・照応解析)
- LF-002 深層格の推測手法における自動クラスタリングの利用(F. 人工知能)
- 一文一格の原理と深層格選好に基づいた日本語深層格規則の自動獲得手法(抽出・言語獲得)
- D-5-6 意味解析規則の教師なし学習における深層範疇の基礎的検討
- 音声認識・言語理解性能や状況の違いによるタスク指向音声対話の言語的・音響的特徴の比較
- 運転時における発話の音響的特徴を利用した対システム発話の推定
- 対話相手の音声の品質を考慮した対話状況での言語的・音響的特徴の分析および様々な観点からの考察(Session-3 対話・コミュニケーション, 第7回音声言語シンポジウム)
- 対話相手の音声の品質を考慮した対話状況での言語的・音響的特徴の分析および様々な観点からの考察
- 音声認識率や状況の違いによる音声対話の言語的・音響的特徴の比較(合同セッション「対話」)
- 比喩解釈を目的とするWorld Wide Webを利用した属性値の適合性判定手法とそのフィードバック(自然言語処理)
- D-8-19 RoboCupサッカーエージェントに対する人手による静的な規則を用いた強化学習による行動選択手法の評価(D-8. 人工知能と知識処理, 情報・システム1)
- 単語情報及びフレーズによる大局的情報を用いた機械翻訳自動評価手法
- 単語情報及びフレーズによる大局的情報を用いた機械翻訳自動評価手法
- 実例を用いた類推による対応関係推定手法
- 類推によるコーパス中の対応関係の推定
- 対話に関するリズムや同調作用を考慮した音声対話システム
- 対話システムにおける対話履歴要約の有効性について
- 対話システムにおける対話履歴要約の有効性について
- 画像に対する発話を対象とした名詞概念獲得システムSINCA(言語,テキストの知能情報処理)
- 単語情報及びフレーズによる大局的情報を用いた機械翻訳自動評価手法
- ネットワークの活性値に基づく深層格解析手法の提案(文脈・照応解析)
- 対話相手の音声の品質を考慮した対話状況での言語的・音響的特徴の分析および様々な観点からの考察(Session-3 対話・コミュニケーション, 第7回音声言語シンポジウム)
- 対話相手の音声の品質を考慮した対話状況での言語的・音響的特徴の分析および様々な観点からの考察(Session-3 対話・コミュニケーション, 第7回音声言語シンポジウム)
- 音声認識率や状況の違いによる音声対話の言語的・音響的特徴の比較(合同セッション「対話」)
- オンラインゲームにおけるコミュニケーション支援のためのWebを用いた情報抽出
- オンラインゲームにおけるコミュニケーション支援のためのWebを用いた情報抽出
- 電気発声音声の健常者音声への音声変換手法の性能評価(福祉工学)
- 遺伝的アルゴリズムを用いた帰納的学習による言語と行動の自動対応付け手法(自然言語)
- E-037 入力予測手法における候補の尤度評価について(E.自然言語・文書・ゲーム)
- tf・AoIの重み付けに基づく類似性を用いた話し言葉における質問文の同定法(自然言語処理)
- D-5-8 電子メイルを対象とした帰納的学習を用いたSubjectの自動生成手法における品詞情報の利用について(D-5. 言語理解とコミュニケーション)
- D-5-1 帰納的学習による入力予測を用いた中国語ピンイン入力システムの評価(D-5. 言語理解とコミュニケーション)
- 音声ラウドネス時間マーカ間隔を用いた発話速度制御について
- F0・パワー・フォルマントを用いた合成音声の明瞭性制御に関する検討(ポスターセッション)(第5回音声言語シンポジウム)
- F0・パワー・フォルマントを用いた合成音声の明瞭性制御に関する検討(第5回音声言語シンポジウム : ポスターセッション)
- 複数の対話システムからの応答候補文を用いた最適応答文選択手法の性能評価
- 複数の対話システムからの応答候補文を用いた最適応答文選択手法の性能評価
- 筋電位信号を用いた携帯端末向けの日本語文入力手法における文脈情報を用いた誤認識の修正(携帯端末・ユビキタスネットワーク)
- 対話文生成のためのWebを用いた話題語の抽出(検索・対話)
- 対話文生成のためのWebを用いた話題語の抽出(検索・対話)
- 感情表現要素認識とウェブマイニングを用いたユーザ発話感情の推測(感情と言語/思考と言語一般)
- E-056 ウェブ上の因果関係を用いたユーザ入力文からの感情情報の推測(自然言語・音声・音楽,一般論文)
- 反対語を用いた極性不定評価表現の極性判定(語彙知識)
- 反対語を用いた極性不定評価表現の極性判定(語彙知識)
- E-005 曖昧な情報要求に対する提案型応答の検討(E分野:自然言語・音声・音楽)
- 質問応答システムにおける知識源選択規則の自動獲得の有効性について(言語モデル・応用)
- E-022 質問の関連性を考慮したクエリ生成手法の提案(E分野:自然言語)
- TF・AoIを用いた類似性による発話予測(対話(2))(第6回音声言語シンポジウム)
- TF・AoIを用いた類似性による発話予測(対話(2))(第6回音声言語シンポジウム)
- キーワード方式べた書き文かな漢字変換システムにおける付属語情報を用いた単語のあてはめ
- べた書き文の単語分割におけるエラーの抽出法と自動訂正
- 日本語文の誤り検出に関する研究
- E-027 幼児の日常生活を収録したビデオデータの分析と名詞概念獲得システムSINCAの評価(E分野:自然言語・音声・音楽,一般論文)
- E-24 未知文の意味解析における類推と規則の融合解析手法(自然言語解析・対話,E.自然言語・文書)
- 帰納的学習を用いた括弧つきコーパスからの意味解析規則の自動獲得手法の性能評価
- 帰納的学習を用いたタグなしコーパスからの統語規則の自動獲得手法
- 平文を用いた統語規則の自動獲得
- D-5-7 情報量に基づく帰納的学習を用いた音声翻訳規則獲得手法
- F0・パワー・フォルマントを用いた合成音声の明瞭性制御に関する検討(第5回音声言語シンポジウム : ポスターセッション)
- F0・パワー・フォルマントを用いた合成音声の明暸性制御に関する検討
- 発話速度推定のためのHMMに基づくパワー変化箇所検出(合成, 韻律, 生成, 一般)
- 発話速度推定ための多次元音響特徴量について(合成, 韻律, 生成, 一般)
- 音声波形からの帰納的学習を用いた音声翻訳手法おける変換ルールの獲得
- 学習型機械翻訳手法に適用された遺伝的アルゴリズムにおける知識による制約の有効性について
- A-13-10 World Wide Webを利用した比喩解釈用知識の洗練(A-13.思考と言語,基礎・境界)
- 多段階分割法によるべた書き日本語文のかな漢字変換
- 単語情報及びフレーズによる大局的情報を用いた機械翻訳自動評価手法