固有表現抽出器を用いた、非直訳文書対からの固有表現翻訳対獲得(対訳表現獲得)
スポンサーリンク
概要
- 論文の詳細を見る
対訳ニュース原稿のようなcontent-alignedな対訳文書から固有表現等の対訳を網羅的に獲得するための手法として先に提案した手法の改良として、統計翻訳における翻訳モデルを参考に構築した新たな統計的固有表現対応づけモデルを提案する。本手法は、各言語の文書中の固有表現を単言語固有表現抽出器を用いて網羅的に発見した後、同一対象を指すものどうしを各言語内でグループ化し、最後に今回提案する手法でグループ間に対応づけを行う。学習コーパスから獲得した固有表現翻訳確率を組み込んだ対応づけモデルを用いることで、グループ対応性能F=0.82を達成した。
- 一般社団法人情報処理学会の論文
- 2005-01-11
著者
-
熊野 正
日本放送協会放送技術研究所
-
柏岡 秀紀
独立行政法人情報通信研究機構
-
柏岡 秀紀
情報通信研究機構音声言語グループ:atr音声言語コミュニケーション研究所
-
柏岡 秀紀
Atr音声言語通信研究所
-
柏岡 秀紀
Atr音声言語コミュニケーション研究所
-
福島 孝博
追手門学院大学
-
田中 英輝
NHK放送技術研究所
-
熊野 正
NHK放送技術研究所
-
熊野 正
ATR 音声言語コミュニケーション研究所
-
田中 英輝
ATR 音声言語コミュニケーション研究所
関連論文
- 単語格子とマルコフモデルによる日本語機能表現の解析 : 日本語機能表現辞書「つつじ」を用いて(解析)
- 京都観光案内対話コーパスにおける対話行為タグの設計と分析(理解)
- 同調的対話システム構築のための音声対話コーパスの構築(「ユニバーサルコミュニケーションを実現するための言語処理技術」シンポジウム)
- 部分文字列への最適な分割と文脈を考慮した変換による翻字処理(自然言語処理)
- 統計的特徴を利用した機能語の自動認定実験(多言語処理・質問応答)
- 言語獲得ロボットによる発話理解確率の推定に基づく物体操作対話 (第27回日本ロボット学会学術講演会論文特集号(2))
- 統計的対話モデルを用いたWFSTに基づく音声対話システム
- 同調的対話を実現するプロトタイプシステムの開発(対話・インタフェース・インタラクション)
- 聴覚障害者向け字幕番組の制作技術
- 聴覚障害者向け字幕付きテレビ番組の自動制作システム
- 8-1 聴覚障害者のための字幕放送制作技術の研究状況 (第四報)
- 抜粋による複数文書要約を評価するためのコーパスと評価指標
- 節の始境界検出に基づく独話文の係り受け解析
- DiaLeague : 自然言語処理システムの総合評価
- 音声認識の信頼度・複数候補を利用したWFST対話システムの評価
- 相談型対話のモデル化と対話戦略の最適化
- やさしい日本語によるニュースの書き換え実験
- 科学技術コミュニケーションにおける対話のデザイン : 自律型対話の実践に向けて(実践的多人数インタラクションの動向と展望)
- 発話連鎖からみた情報要求発話の機能(分析、生成と評価)(音声とコミュニケーション及び一般)
- 発話連鎖からみた情報要求発話の機能
- 音声認職の信頼度・複数候補を利用したWFST対話システムの評価
- 用例ベース翻訳の確率的モデル化
- 多言語パラレルコーパスを利用した言い換え表現グループの構築と分析
- 対話者の社会的役割を利用した訳し分け手法
- 「地震」 に関する新聞記事からの情報の調査と分類
- 文融合法に基づいた放送ニュースリード文の具体化
- ニュース要約のための簡易文脈解析(情報抽出・ラベル付与)
- E-011 長さ制限のない未知語形態素候補の自動生成(E分野:自然言語・音声・音楽)
- World Wide Webを用いた外国人名の英訳自動獲得(自然言語)
- World Wide Webからの外国人名の英訳自動獲得 (放送サービスに応用される翻訳・要約技術 特集号)
- 最ゆう単語列逐次比較による音声認識結果の早期確定
- 翻訳用例提示システムの設計・開発・運用
- 音声認識を利用した放送用ニュース字幕制作システム
- 混合正規分布型HMMにおける混合数の増加法の検討
- 固有表現抽出器を用いた、非直訳文書対からの固有表現翻訳対獲得(対訳表現獲得)
- 階層分割型クラスタリングを使った文書ブラウザ
- 日英放送原稿翻訳者のための類似用例提示型翻訳支援システム
- 講演の同時通訳データ作成と分析
- 1N-7 異なる辞書を利用した意味コードの自動付与
- 詳細な文法を用いた統計的構文解析法
- 決定木学習による形態素解析 (言語・音声理解と対話処理研究会(第17回))
- Probabilistic Decision-Tree Tagging Without A Dictionary
- 対話システムの評価における一般的推論能力の要請
- The ATR/Lancaster General-American-English Treebank
- A New Approach To Treebank Creation
- 相互情報量を用いた単語の分類における出現頻度の低い単語の処理手法
- 構文木コーバスの再構成手法
- 構文木データべース作成用ツール
- 音声言語処理のためのコ-パスとタギング(チュ-トリアル講演)
- 4.ライフログに基づく実世界でのコンテンツ利活用(ライフログ)
- 聴覚障害者向け字幕番組の制作技術
- 独話データのポーズ単位を利用した節境界判定(言語解析, 対話)
- 文脈素性のベクタ空間モデルを用いた日英翻訳選択 : SENSEVAL-2 日本語翻訳タスク参加システムの開発
- 節の始端検出に基づく独話文の係り受け解析(一般(ポスターセッション),第9回音声言語シンポジウム)
- 節の始端検出に基づく独話文の係り受け解析(一般(ポスターセッション),第9回音声言語シンポジウム)
- 節の始端検出に基づく独話文の係り受け解析(一般(ポスターセッション),第9回音声言語シンポジウム)
- 節境界に基づく独話の漸進的係り受け解析(自然言語処理)
- 同時的な独話音声要約に基づくリアルタイム字幕生成(要約・分割)
- 節境界単位での漸進的な独話係り受け解析
- 節境界に基づく独話文係り受け解析の効率化(仮名漢字変換・形態素構文解析)
- 日本語節境界検出プログラムCBAPの開発と評価
- 用例ベース翻訳のための日英アライメント確信度語類似度を用いた訳語選択
- 単語類似度の尺度比較支援ツールの作成(言語知識・解析・言い換え)
- ATR-SLTシステム-SENSEVAL-2日本語翻訳タスク
- 放送ニュース文を対象とした効果的類似用例検索法
- 日英ニュース原稿の対訳コーパス化に関する基礎調査
- ニュース要約の実態調査と要約モデルの検討(コーパス, 学習, 対話, 要約)
- ニュース記事の日英翻訳支援システム--容易に翻訳例がさがしだせる (平成13年度 技研公開 特集号)
- 統計的手法を用いた日英放送原稿の単語対応づけ
- 手書き要約筆記における要約の特徴(福祉と言語処理/一般)
- 手書き要約筆記における要約の特徴(福祉と言語処理/一般)
- 要約筆記における要約手法と基礎データベースの構築
- 2 Text Summarization Challenge : 自動要約の評価型ワークショップ(テキスト自動要約 : 知的活動支援の基本技術として)
- テキスト処理研究の動向 : 情報抽出・自動要約・質問応答における評価ワークショップの重要性(NTCIR : 情報アクセスに関わるテキスト処理技術の評価ワークショップ)
- TSC2(Text Summarization Challenge 2)の目指すもの
- 情報検索と要約の評価 : 第2回NTCIRワークショップ概要
- NTCIR Workshop 2の新しいタスクの紹介 : テキスト自動要約タスク(情報検索システムの力くらべ : テストコレクションによる評価)
- 4 聴覚障害者向け字幕放送における自動要約(テキスト自動要約 : 知的活動支援の基本技術として)
- 講演の要約筆記における要約の手法
- 2000-NL-138-3 聴覚障害者向け字幕放送のためのニュース文自動短文分割
- NLC2000-12 聴覚障害者向け字幕放送のためのニュース文自動短文分割
- 招待講演 情報抽出研究のこれまでと今後 (テーマ:社会的相互行為研究と対話理解研究の接点を探る)
- 意志決定を支援する音声対話システムの構築と評価
- 音声対話型観光案内システムにおける誤応答リカバリー効果の評価
- 英語入試問題の語彙からみた分析
- 言語獲得ロボットによる発話理解確率の推定に基づく物体操作対話
- Network-based spoken dialog system development platform: WFSTDM builder (音声)
- Web時代の音声・言語技術
- テレビ生放送番組に付与された字幕に関する調査
- テレビ生放送番組の字幕の評価に向けての基本調査(「コミュニケーションと気づき」及び一般)
- ネットワーク型音声対話システム開発ツール : WFSTDMビルダー(音声対話,認識,理解,対話,一般)
- リアルタイム要約である要約筆記に見られる要約の手法
- 東日本大震災に関するテレビ報道番組のリアルタイム字幕の分析
- 1-4 外部知識を用いたニュースオントロジー構築手法の検討(第1部門 メディア処理1)
- 11-3 放送ニュース翻訳を支援する自発的な情報提示へ向けて(第11部門 放送現業の今を見る)
- 観光案内への音声対話システムの活用
- テレビの緊急報道番組に付与されたリアルタイム字幕および字幕中の地名に関する調査
- 多言語音声翻訳システム"VoiceTra"の構築と実運用による大規模実証実験(音声,聴覚,システム開発論文)
- 「地震」に関する新聞記事からの情報の調査と分類
- 要約筆記への招待 : コンピュータによる要約を考える一視点として