衛星放送用機械翻訳の辞書の改修 (慣用表現を中心に)
スポンサーリンク
概要
- 論文の詳細を見る
機械翻訳において, 訳語選択は構文解析と並ふ重要な要素技術である。筆者らはこれまで, 辞書の改良という形で訳語選択の精度を向上させてきた。今回は「慣用表現」を利用した辞書の改良を行ったので報告する。慣用表現を利用することで, 適切な日本語訳を出力することが可能である。慣用表現の収集には, BBI英和連語活用辞典(丸善発行, 以下BBI共起辞書と呼ふ)の使用権を得て利用した。BBI共起辞書から, 見出し語と用例を含めて抽出し, 抽出した名詞句, 前置詞句, 動詞句を分析して, 新規に登録できるもののみを用いた。改修の結果, 基本辞書の語彙数は99850語(新規登録20850語)になり, ニュース専門辞書, 翻訳者用辞書を合わせると約15万語になった。改修した辞書を用いて翻訳評価テストを行なった結果, 全体の約5%の文が新規登録語を用いていた。その中で, 翻訳結果が良くなったのが, 64%, ほとんど同じものが33%, 悪くなったものが4%であった。これより, 全体では3%の文の翻訳の質が向上したことになり, 慣用表現の登録が有効であることを確認した。本稿ではその概要を報告する。
- 一般社団法人情報処理学会の論文
- 1997-09-24
著者
-
浦谷 則好
NHK放送技術研究所
-
浦谷 則好
Nhk放送技術研究所:(現)東京工芸大学
-
江原 暉将
NHK放送技術研究所
-
畑田 のぶ子
NHK 放送技術研究所
-
畑田 のぶ子
NHK放送技術研究所
-
江原 暉将
Nhk放送技術研究所:(現)諏訪東京理科大学
-
江原 暉将
日本放送協会放送技術研究所
-
江原 暉将
Japan Broadcasting Corp. (nhk)
-
畑田 のぶ子
Nhk 放送技研
関連論文
- 部分文字列への最適な分割と文脈を考慮した変換による翻字処理(自然言語処理)
- K-074 知識を統合しユーザの疑問に答えるTVエージェント(K分野:ヒューマンコミュニケーション&インタラクション)
- A-15-22 番組に関するユーザの疑問に答えるTVエージェントシステム(A-15. ヒューマン情報処理, 基礎・境界)
- B-024 番組情報獲得システムにおけるラッパエージェント構築法(B.ソフトウェア)
- 障害者向けオフライン字幕制作実用化モデルの開発
- 新しい字幕制作実用化モデルシステムの設計・開発(デジタル放送技術, デジタル設備および一般)
- 音声認識・文字認識を用いた電子化原稿作成支援システムの概要(感性情報処理とマルチメディア技術および一般)
- 9-8 字幕番組制作技術の研究開発フェーズ2における計画の概要
- 字幕制作技術研究開発フェーズ2に関する計画の概要
- 聴覚障害者向けニュースの字幕提示方法に関する主観評価(人間の視覚・聴覚情報)
- 意味分類番号を用いた主語・述語の整合度の計算方法
- 形態素解析情報に基づく長い日本語ニュース文の分割
- テレビ受信ナビシステムにおける番組選択用リモコンに関する評価実験 : 様々な視聴者が視たい番組を簡単に選択受信できるテレビを目指して(映像メディア処理,感性情報工学及び一般)
- 2チャネル音声集音系における楕円積分を乗算係数に用いたスペクトル減算法(音声, 聴覚)
- 視線情報を利用した番組選択インタフェースの開発(セッション5 : マルチモーダルデザイン(2))
- K-074 視線情報を利用したテレビ用ユーザインタフェースの開発(K.ヒューマンコミュニケーション&インタラクション)
- 高齢者におけるデータ放送コンテンツのユーザーインターフェース評価 : 2種類のリモコンを比較して
- 7-4 高齢者によるデータ放送コンテンツのユーザーインターフェース評価
- プロトコル分析を用いたデータ放送コンテンツのユーザーインターフェース評価
- プロトコル分析を用いたデータ放送コンテンツのユーザーインターフェース評価
- 話し言葉の日英翻訳システムの評価法
- World Wide Webを用いた外国人名の英訳自動獲得(自然言語)
- 翻訳用例提示システムの設計・開発・運用
- オブジェクト連動データ放送システムに適したユーザインターフェースの開発とその評価実験
- オブジェクト連動データ放送システムに適したユーザインターフェースの開発とその評価実験(放送・サービス, ITS画像処理, 映像メディア及び一般)
- オブジェクト連動データ放送システムに適したユーザインターフェースの開発とその評価実験(放送・サービス, ITS画像処理, 映像メディア及び一般)
- 指さしポインターの開発とその性能評価実験
- 指さしポインターの開発とその性能評価実験(画像技術・視覚・その他一般)
- 4. エージェント技術から見たテレビの未来像(未来への手紙)
- ATRの新音声言語データベース
- 日英放送原稿翻訳者のための類似用例提示型翻訳支援システム
- ニュース音声認識のための(n≥4)-gramを併用する言語モデル
- ニュース音声認識のための(n≧4)-gramを併用する言語モデル
- ニュース音声認識のための(n≧4)-gramを併用する言語モデル
- 局所的要約知識の自動獲得手法
- デモ19 ニュース文の局所的要約システム : 文字数の削減による要約
- 5N-1 文字数削減によるニュース文の要約システム
- 音声翻訳実験システム(ASURA)のシステム構成と性能評価
- 通信・放送機構 渋谷上原リサーチセンターの研究紹介 : 視聴覚障害者向け放送ソフト制作技術の研究開発プロジェクト
- ユーザモデルエージェントによる番組選択システム
- 8-3 ニュース原稿のクラスタリングを用いたトピック抽出
- 確率モデルによるゼロ主語の補完
- 固有ベクトル分析を用いた主語特徴の評価
- 人にやさしい放送と自然言語処理
- ニュース音声認識のための(n≧4)-gramを併用する言語モデル
- 放送ニュース文を対象とした効果的類似用例検索法
- 衛星放送用機械翻訳の辞書の改修 (慣用表現を中心に)
- ニュ-ス用英日機械翻訳システムの課題と改善--辞書,文法とその改修を中心に
- 日英ニュース原稿の対訳コーパス化に関する基礎調査
- 4.1 音声処理と翻訳(4.応用技術)(最近の音声処理技術)
- 定型パターンを含むニュース文の抽出とその英日機械翻訳
- AP電経済ニュースからの定型パターンの抽出
- 統計的手法を用いた日英放送原稿の単語対応づけ
- デジタル放送受信機用ユーザ・インタフェースの試作と評価(ヒューマンインタフェース基礎,インタラクション技術の原理と応用)
- デジタル放送用受信機の少ボタン型ユーザ・インタフェースの試作と評価
- パーソナル化するTV受信ナビシステムの開発
- パーソナルTVナビシステムの開発と評価結果
- パーソナルTVナビシステムの開発と評価結果(画像符号化・通信・ストリーム技術,及び一般)
- パーソナルTVナビシステムの開発と評価結果(画像符号化・通信・ストリーム技術,及び一般)
- パーソナルTVナビシステムの開発と評価結果(画像符号化・通信・ストリーム技術,及び一般)
- 視聴態様に適合するテレビ受信ナビシステムの開発(映像メディア処理,感性情報工学及び一般)
- 高背景音放送音声を対象とする字幕・音声自動同期の検討
- 番組推奨を含むテレビ受信ナビシステムの開発と主観評価結果(ハイビジョンおよび一般)
- 3-1 多様な視聴者にやさしい高度放送受信ナビゲーションシステムの検討課題
- 短文分割の自動要約への効果
- K-075 頭部の自由な動きを許容する視線測定システム(K.ヒューマンコミュニケーション&インタラクション)
- 研究開発中の情報バリアフリー技術(人にやさしい放送,人にやさしい映像情報メディア)
- 衛星放送ワールドニュースの英日機械翻訳
- 高速な依存構造解析アルゴリズム
- 実験用字幕つきテレビニュースの制作と字幕表示法に関する予備評価
- 字幕作成のための翻訳ワークベンチ
- 対訳データからの「訳し分け情報」の自動学習
- 衛星放送ニュース文の英語解析文法
- 自然言語による映像シーケンサ(新映像メディアとその応用)
- 特集「情報化社会への視聴覚障害者の参加を考える」の編集にあたって
- 依存関係整合度の計算法(その2)
- 形態素調整規則の半自動的獲得手法
- 英語ニュースデータベースの構築
- 英日機械翻訳における固有名詞処理
- 英語ニュース文におけるハイフンを含む語の局所解析
- 学会活動について
- 15-4 静止画像連想検索方式の検討
- 自然言語処理「構文解析」特集号 巻頭言
- 編集にあたって(文科系大学・学部における情報教育)
- 係り受け整合度を計算するいくつかの統計的手法の比較
- 係り受け整合度を計算するいくつかの統計的手法の比較
- 最大エントロピー法を用いてバイグラム確率からnグラム確率を求める
- 日本語ニュース文の表現パターンの分析
- 日本語「が」格の係り受け整合度の一計算法 : 基準名詞の個数に関する考察
- 音声翻訳システムASURAの開発
- 後置詞句における助詞の実現と非実現の比較分析
- 放送用静止画検索システムFORKS
- 検索システムFORKSの操作性改善
- 結合価パターンを用いた : 深層格抽出法の一検討
- 12-7 オントロジを利用した番組関連情報獲得手法(第12部門 映像検索)
- 21-6 SD法によるデジタル放送受信機用試作リモコンの評価(第21部門 ヒューマンインフォメーション)
- 6-1 Q&Aシステムのための野球オントロジーの設計に関する検討(第6部門 インターフェース,画像・動画処理,その他)
- 20-6 番組選択行動における視線と興味の関係(第20部門 視覚の心理・生理)
- ニュース原稿データベースからの表現パターンの抽出
- 2次元パターン高速探索アルゴリズム