複合語内外の言語情報を統合的に利用した低出現頻度・辞書未登録訳語対の抽出(抽出(2))
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,機械翻訳システムの辞書に登録されおらず,かつ(対応付け誤りを含む)対訳コーパスにおいて出現頻度が低い複合語を対象として,その訳語を抽出する方法を提案する.提案方法は,複合語あるいはその訳語候補の内部の情報と,複合語あるいはその訳語候補の外部の情報とを統合的に利用して訳語対候補に全体スコアを付ける.全体スコアは,複合語あるいはその訳語候補の内部情報と外部情報に基づく各スコアの加重和を計算することによって求めるが,各スコアに対する重みを回帰分析によって決定する.読売新聞とThe Daily Yomiuri の対訳コーパスを用いた実験では,全体スコアが最も高い訳語対(のうちの一つ)が正解である割合が86.36%,上位二位までに正解が含まれる割合が95.089%という結果が得られ,提案手法の有効性が示された.
- 一般社団法人情報処理学会の論文
- 2004-01-13
著者
-
井佐原 均
通信総合研究所けいはんな情報通信融合研究センター
-
吉見 毅彦
龍谷大学理工学部
-
井佐原 均
シャープ株式会社
-
九津見 毅
シャープ(株)
-
佐田 いち子
シャープ(株)
-
井佐原 均
通信総合研究所
-
小谷 克則
関西外国語大学
-
井佐原 均
豊橋技術科学大学
-
吉見 毅彦
龍谷大学
関連論文
- E-021 大規模単言語コーパスの利用による機械翻訳用対訳辞書の新規連語獲得性能の向上(E分野:自然言語・音声・音楽)
- LN-003 英語学習者の英文読解能力推定のための読解時間予測法(教育・人文科学)
- LN-002 英語学習者の英文読解時間に統語的要因が及ぼす影響(教育・人文科学)
- 岩波国語辞典を利用した語義タグ付きテキストデータベースの作成
- 言語音を解読する神経機構 : 音のどこに解読の手がかりは書き込まれるか?
- 失語症例の語音理解障害の原因について語音の弁別障害と周波数変化の弁別障害の関連性
- 語音弁別の神経機構 : 失語症患者の研究から得られたもの
- 講演 失語症患者の言語音の弁別、および認知能力について (特集 ろう教育科学会第41回大会)
- 失語症例の音の分離能力(クリック音融合閾)と聴覚的言語理解の関係について
- 音声理解を指向した音声認識のための単語重要度の自動推定(学生セッション II)
- 自然言語処理技術を用いた大会プログラム作成支援について
- 複数尺度の統計的統合法とその専門用語抽出への応用(オントロジ・抽出(2))(セマンティックウェブと自然言語処理その他一般)
- 複数尺度の統計的統合法とその専門用語抽出への応用
- 日英新聞の記事および文を対応付けるための高信頼性尺度
- WWW検索における複数検索結果の統合処理とその評価(データベースと感性,デザイン,バイオインフォマティクス,音楽,環境,医学,建築分野との連携)
- 外国語学習・教育支援を目的とした学習者発話動画の自動字幕付与システムの検討(音声・言語・音響教育,一般)
- SENSEVAL2J 辞書タスクでのCRLの取り組み : 日本語単語の多義性解消における種々の機械学習手法と素性の比較
- 機械翻訳へのユーザの適応と書き換えへの教示効果に関する分析(自然言語)
- 機械翻訳システムに対する利用者適応の分析 : 異文化コラボレーションを目指して(一般 : データマイニングI)
- 統計的前編集のための対訳コーパスからの学習データの自動生成
- 日本語講演音声ドキュメント検索における索引付けの検討
- 自己組織型意味マップにおける形容詞と抽象名詞の分布 : 客観的なシソーラスをめざして(言語理解とコミュニケーション一般)
- 日本語講演音声ドキュメント検索における索引付けの検討
- 機械翻訳システムに対する利用者適応の分析 : 異文化コラボレーションを目指して(一般(データマイニングI))(「社会システムにおける知能」及び一般)
- 英日機械翻訳における速読支援のための日本語生成
- 広域文書類似度と局所文書類似度を用いた講演音声ドキュメント検索
- 広域文書類似度と局所文書類似度を用いた講演音声ドキュメント検索
- 広域文書類似度と局所文書類似度を用いた講演音声ドキュメント検索
- 5U-4 会議の情報保障における吹き出し型字幕の有用性の調査(音声インタフェース・システム,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- E_029 関係節の英日翻訳法に関する統計的特徴抽出の試み(E分野:自然言語)
- 1-4 自然言語処理と言語教育の融合にみる言語教育支援に向けて : 通信総合研究所の取組み(1.グローバル化時代の新教育形態)(グローバル化時代の教育と研究)
- 拡張モダリティの提案 : 自由回答から回答者の意図を判定するために
- 表層表現に着目した自由回答アンケートの意図に基づく自動分類
- 土俵と取り組み
- 科学技術振興調整費開放的融合研究推進制度 : (小特集:) : 大規模コーパスに基づく『話し言葉工学』の構築
- 共通日本語話し言葉コーパスの設計
- 科学技術振興調整費開放的融合研究推進制度による「話し言葉の言語的・パラ言語的構造の解明に基づく『話し言葉工学』の構築」プロジェクト
- 語構成論に基づいたサ変動詞の分類
- RWCにおける分類コード付きテキストデータベースの開発
- RWCにおける分類コード付きテキストデータベースの開発
- 新聞記事中の事故・事件名の自動抽出(抽出(2))
- 新聞記事中の事故・事件名の自動抽出(抽出(2))
- 日本におけるテストコレクションと評価の動向(情報検索システムの力くらべ : テストコレクションによる評価)
- 招待講演:情報検索・抽出技術の評価を巡る諸問題--第1回のNTCIR/IREXを終えて (2000年情報学シンポジウム--ネットワーク型情報メディアの活用と情報を活かす新技術) -- (セッション5:情報検索・情報抽出)
- IREX :情報検索、情報抽出コンテスト
- 英文読解効率テストの有効性の検証(言語の学習・教育)
- LN_005 英文読解速度テストの有効性の検証(N分野:教育・人文科学)
- 二言語コーパスからの語彙知識獲得のための対訳辞書登録候補の選別
- LN-001 読解支援システムの統一的評価法(N分野:教育・人文科学)
- LE-003 サポートベクターマシンを用いた対訳辞書登録候補の自動選別(E分野:自然言語)
- 前置詞句・等位構造を含む英語固有表現とその対訳表現の獲得(対訳表現獲得)
- 複合語の内部情報・外部情報を統合的に利用した訳語対の抽出
- LK-005 読解過程検定ツールOPERATION2の評価(K. ヒューマンコミュニケーション&インタラクション)
- 複合語内外の言語情報を統合的に利用した低出現頻度・辞書未登録訳語対の抽出(抽出(2))
- 予期的認知と形容表現:不安に基づく状況把握
- 統計的前編集のための対訳コーパスからの学習データの自動生成 (音声)
- 統計的前編集のための対訳コーパスからの学習データの自動生成 (言語理解とコミュニケーション)
- 4W-5 複数の機械翻訳器による学習データの自動生成とそれに基づく統計的前編集(機械翻訳,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 討論型ニュースグループを対象とする知的ニュースリーダの開発
- 討論型ニュースグループを対象とする知的ニュースリーダの開発
- 機械翻訳のための統計的手法に基づく前編集
- 機械翻訳のための統計的手法に基づく前編集
- 機械翻訳のための統計的手法に基づく前編集
- 日英新聞記事の対応付けと精度評価
- 統計的手法による分野非依存のテキスト分割
- 情報検索パッケージの実装
- 待遇表現選択ストラテジの数値モデル
- 敬語表現の誤用 : 実験心理学的手法によるアプローチ
- 統計的手法に基づく敬語表現選択ストラテジのモデル
- 統計的手法に基づく敬語表現選択ストラテジのモデル
- 待遇表現に関するブラウン・レビンソンの理論の実験心理学的検証
- 待遇表現の丁寧さの計算モデル
- 待遇表現におけるモーラ数と丁寧さとの関係
- A-13-1 簡単な日本語会話文における敬語の誤用を指摘するシステムの試作(A-13. 思考と言語)
- 単語アライメントを用いた英日機械翻訳文の流暢さの自動評価
- モジュール型ニューラルネットによる品詞タグ付け
- NLP2000-23 / NC2000-17 モジュール型ニューラルネットによる品詞の曖昧性解消
- NLP2000-23 / NC2000-17 モジュール型ニューラルネットによる品詞の曖昧性解消
- 人間による翻訳文と機械翻訳文の語彙的差異の計量分析
- 読解効率に基づく英文読解能力測定テストの開発とその信頼性・妥当性の検証
- 会議の情報保障を目的とした吹き出し型字幕提示方式の検討(システム)
- 音声理解を指向した音声認識のための単語重要度の自動推定(学生セッション II)
- 国際会議・ニュースのアーカイブのための統計的機械翻訳を利用した音声認識の検討
- 逐語訳に着目した日本語学習者作文の自動評価
- 単語対応付けに基づく日本語学習者による作文の自動識別
- テキスト言語的特徴と英語学習者の英文読解能力に基づく英文読解時間予測モデル
- 構文的曖昧性を持つ英語固有表現とその対訳表現の獲得
- 敬語表現に対する印象の統計的分析 : 敬語の形式への依存性
- A-13-1 敬語の自然さの印象に関する統計的分析
- 人間による翻訳文と機械翻訳文における動詞の馴染み度の比較分析
- ストラテジとしての待遇表現 : ブラウン・レビンソンの理論の実験心理学的検証
- 敬語表現に対する印象の統計的分析 : 敬語の形式への依存性
- 頑健な英日機械翻訳システム実現のための原文自動前編集
- A-13-7 敬語表現に対する自然さの印象の数量化
- 英字新聞記事見出し翻訳の自動前編集による改良
- ドキュメント翻訳のための統計的手法に基づく原言語文の自動変換
- 機械翻訳の品質向上のための対訳コーパスからの統計的前編集システムの自動構築
- 広域文書類似度と局所文書類似度を用いた講演音声ドキュメント検索
- K-051 英文読解能力測定モデルへの熟語難易度の導入(教育工学(3),K分野:教育工学・福祉工学・マルチメディア応用)
- K-052 英語学習支援のための聴解コーパスの有効性の検証(教育工学(3),K分野:教育工学・福祉工学・マルチメディア応用)