対訳辞書作成のための英訳辞書の照合
スポンサーリンク
概要
- 論文の詳細を見る
機械翻訳システムを開発する上で対象とする言語間の対訳辞書を実現することが必須である。通常これを人手に頼るため,時間的人的コストが問題となる。そこで我々は,既存の言語資源の再構成による対訳辞書の構築を試みた。具体的には,韓日対訳辞書の生成を目的として,韓国語単語に対する英訳語の集合を韓英辞書から取り出し,これと類似度の高い英訳語の集合を持つ日本語単語を日英辞書に見出し,この韓国語単語と日本語単語を対訳語として結び付けた。ここで,類似度はそれぞれの英訳語集合の一致する割合に基いて定義した。韓英辞書から無作為に抽出した韓国語単語1,000語を用いた試行実験によると,うち365語に対し日英辞書の日本語単語への結び付けに成功し,類似度が0.8以上のものでは72%の対訳の正解率が得られた。
- 社団法人電子情報通信学会の論文
- 2001-03-15
著者
-
山本 和英
Atr音声言語コミュニケーション研究所
-
山本 和英
Atr音声翻訳通信研究所:(現)atr音声言語通信研究所
-
白井 諭
Nttアドバンステクノロジ
-
白井 諭
ATR音声翻訳通信研究所
-
山本 和英
長岡技科大 電気系
-
白 京姫
ATR音声言語通信研究所
-
白 京姫
Atr音声言語コミュニケーション研究所
関連論文
- Webコーパスの提案(コーパス構築)(セマンティックウェブと自然言語処理その他一般)
- 6ZF-8 多言語医療受付支援システムM^3の医療機関への導入(テキストマイニングの応用,学生セッション,コンピュータと人間社会)
- 日本語語彙大系について
- Wikipediaからの大規模な人オントロジー構築
- 日本語用言を見つめ直す
- 対訳辞書作成のための英訳辞書の照合
- 対訳辞書作成のための英訳辞書の照合
- 計算機処理のための韓国語言語体系と形態素処理
- 日本語語彙大系を用いたWikipediaからの汎用オントロジー構築
- サポートベクトルマシンを用いた中国語解析実験
- 中国語形態素解析に対するSVMとコスト最小法の比較実験
- 中国語形態素解析に対するSVMとコスト最小法の比較実験
- ニュース文の音声要約のための韻律情報の利用
- 語順を考慮した格フレームの提案と獲得手法
- 非対訳コーパスを用いた日本語複合名詞の英訳語推定
- 重複部・冗長部削除による複数記事要約手法
- 名詞の連接情報を用いた関連文書検索手法
- 名詞を中心とした連接に着目した新聞の関連記事検索手法
- 日本語新聞記事を対象とした関連記事検索の一手法
- 機械翻訳のための日英文型パターン記述言語
- 機械翻訳のための日英文型パターン記述言語
- 構文片を用いた分野の同定を必要としない意見・評判情報抽出(「主観表現処理の最前線」シンポジウム)
- 重要語句抽出による新聞記事自動要約
- 1D-1 新聞記事の自動要約によるニュース速報配信
- 決定木を用いた日本語ゼロ代名詞補完
- 1N-7 異なる辞書を利用した意味コードの自動付与
- 係り受け関係を用いた重複表現削除
- 動詞型連体修飾表現の"N_1のN_2"への言い換え
- 要約のための連体修飾節の"AのB"への言い換え
- コーパスを利用した効率的な翻訳規則の拡充
- 速報型日英翻訳システムALTFLASH
- バイリンガル旅行会話コーパスに見られる話し言葉の特徴分析
- 3N-4 ナ型形容詞に対する日英対訳用例文の収集について
- 英文記事ヘッドラインの特徴について
- 大規模オープンソース日英対訳コーパスの構築
- 大規模オープンソース日英対訳コーパスの構築
- 複数決定木を用いた入力誤りに頑健な省略補完手法
- 決定木学習による日本語対話文の格要素省略補完
- 音声対話における頑健な主語補完手法
- 単語と品詞の混合 n-gram を用いた形態素解析
- 要約技術と検索技術 (特集 インターネット検索技術と日本語研究)
- 要約事例を用例として模倣利用したニュース記事要約
- 用例利用型による文間接続関係の同定
- 文書に対する大衆の興味の強さの推定
- LE-003 講義スライドへの書き起こしデータの対応付け(自然言語・音声・音楽)
- LE-002 要約事例を用例として利用したニュース記事要約(自然言語・音声・音楽)
- 濃縮還元型文要約モデルの検討(談話・要約)
- 文間接続関係の自動同定のための人間による同定分析(談話・要約)
- 濃縮還元型文要約モデルの検討(談話・要約)
- 文間接続関係の自動同定のための人間による同定分析(談話・要約)
- 類似用例文の部分的置換による文短縮(解析,分析)
- 「新幹線要約」のための文末の整形
- 「サ変動詞+名詞」の複合名詞への換言
- 国会会議録を対象とする話し言葉要約
- 繰り返し学習を用いた話題に順応する意見文抽出 (情報処理学会 情報学基礎研究会(FI)第77回)
- 繰り返し学習を用いた話題に順応する意見文抽出
- 順位付け文書からの影響因子マイニング(マイニング、要約)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- 中国語のコンピュータ処理について--コンピュータによる中国語処理の発展と課題 (特集2 人文科学研究と自然言語処理)
- 冗長度削減による関連新聞記事の要約
- 冗長度削減による関連新聞記事の要約
- 言語的類似性を最大利用した直接翻訳方式(言語理解とコミュニケーション一般)
- 5 テキスト自動要約における新たな展開と展望 : 統計的方法,換言処理,そして…(テキスト自動要約 : 知的活動支援の基本技術として)
- 連用修飾表現の省略可能性に関する知識の獲得
- 類似文の比較による省略可能な格要素の認定
- 関連テキストを利用した重複表現削減による要約
- 分類体系相互の関係を利用したテキストの自動分類
- 用例に基づく日韓の対話翻訳処理機構
- 「新幹線要約」のための文末の整形(マイニング、要約)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- 「新幹線要約」のための文末の整形(マイニング、要約)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- 順位付け文書からの影響因子マイニング(マイニング、要約)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- 順位付け文書からの影響因子マイニング
- 「コ」「ソ」系指示語の用法に関する仮説とその検証
- 文章内構造を複合的に利用した論説文要約システムGREEN
- 段落分けを用いた日本語文章における結束構造の検討
- 文章内構造を複合的に利用した論説文要約システムGREEN
- グラフ節点のある種の線形配列問題について
- グラフ節点のある種の線形配列問題について(計算機構とアルゴリズム)
- グラフ節点の隣接枝のみを考慮した線形配列問題について(グラフ・ネットワーク)
- 頑健な多言語音声翻訳のための不適格入力の分割処理 (コンピュータグラフィクスの新展開)
- 構成素境界解析を用いた多言語話し言葉翻訳
- 特徴的冗長表現に着目した国会会議録要約(コーパス分析・言い換え)(セマンティックウェブと自然言語処理その他一般)
- 説明文と記述要素の関係要因の調査 : そこにクエリの「何」が書かれているのか(検索,第1回テキストマイニング・シンポジウム)
- クエリと説明文の関係を表す記述要素辞書の構築 (言語理解とコミュニケーション)
- 段落分けた関わる諸要素の評価について
- 語の類縁性を用いた日本語文章の段落分けの試み
- カテゴリ名と記事名の意味属性分類に基づくWikipediaからの上位下位関係オントロジーの構築
- 保険関連文書間の自動対応付け (産業日本語関連)
- 特徴的冗長表現に着目した国会会議録要約