対訳関係のないコーパスからの複合名詞対訳表現の獲得
スポンサーリンク
概要
- 論文の詳細を見る
機械翻訳や多言語検索用の辞書構築を目的として対訳コーパスから対訳語を獲得する研究が数多く行われているが, 実際には対象分野の対訳コーパスが存在するという条件は制約が強く, 必ずしも対訳獲得に必要な量のコーパスが利用できるとは限らない.本論文では, 辞書とシソーラスを使って対訳関係のない2言語のコーパスから複合名詞の対訳表現を獲得する方法を提案する.提案手法は対訳関係をもたない言語コーパスを組み合わせて知識の獲得元とできるだけでなく, コーパス中に低頻度でしか現れない表現も獲得することができる.日本語と英語の経済新聞記事1年分に手法を適用したところ58.2%の精度で日英の対訳表現が獲得できることを確認した.
- 社団法人電子情報通信学会の論文
- 2001-12-01
著者
関連論文
- 特徴的部分文字列と共起情報を用いた固有表現の詳細ラベル付与 (言語理解とコミュニケーション)
- 音声認識を用いたマルチメディアコンテンツのインデクシング
- 精細な文法に基づいたツリーバンク「檜」の構築(辞書,コーパス)
- 日本語ツリーバンク「檜」 : 言語理解のためのコーパス(辞書,コーパス)
- 「基本語意味データベース:Lexeed」の構築(辞書,コーパス)
- 特徴的部分文字列と共起情報を用いた固有表現の詳細ラベル付与
- 意味的等価性検証に基づく記述式解答文の採点法(テキストの類似性・文処理モデル)
- 意味的等価性検証に基づく記述式解答文の採点法(テキストの類似性・文処理モデル)
- 英和辞書からの日英翻訳ルールの自動獲得
- 順序保存ダイジェスト法によるWebページ間の部分複製検出
- 文脈的素性を用いた固有表現間の関係性判定
- リッチアノテーション : 固有表現に焦点をあてた知識抽出の試み(情報抽出(テーマセッション2))
- リッチアノテーション : 固有表現に焦点をあてた知識抽出の試み(情報抽出(テーマセッション2))
- 3D-7 地理的距離と有名度を用いた地名の曖昧性解消(自然言語処理,一般セッション,人工知能と認知科学)
- Web2.0時代の名寄せを実現する国有表現グラウンデイング技術 (特集 ポータルサービスを支える自然言語処理技術)
- テキストからの知識抽出による新しいWeb情報アクセスに向けて (特集 ポータルサービスを支える自然言語処理技術)
- D-12-67 「領域抽出不要型文字認識」に基づく景観中単語認識(D-12. パターン認識・メディア理解, 情報・システム2)
- 大語彙連続音声認識を用いた音声・映像コンテンツのインデクシング
- クロス言語情報検索と多言語情報アクセスシステム (特集論文1 高度検索技術)
- 対訳関係のないコーパスからの複合名詞対訳表現の獲得
- 音声認識・言語処理の適用によるコンテンツ内容記述メタデータの生成 (特集 メタデータ応用サービスおよび関連技術の動向)
- TMI99参加報告
- 転移学習による抽出型要約の精度向上
- 転移学習による抽出型要約の精度向上
- 大規模データを対象とした文書情報集約データベースと評判分析サービスにおける検証(データ工学,Web情報システム)
- トピック情報を用いたブートストラップ法に基づく語彙獲得
- 語彙と文脈情報を用いた反義の詳細クラス分類
- Evaluative Text Summarization Model with Sentence Extraction and Ordering