部分文字列への最適な分割と文脈を考慮した変換による翻字処理(自然言語処理)
スポンサーリンク
概要
- 論文の詳細を見る
英語の専門用語や固有名詞は多くの場合,日本語では発音が類似したカタカナに翻字されて表現される.これらの単語は新出語が多く,辞書に登録されていない場合が多いので,自動的に翻字できると言語横断情報検索や機械翻訳などに有用である.我々は,英語の単語をカタカナの文字列へ自動的に翻字する手法を提案する.提案手法は,発音を考慮した部分文字列へ英単語を分割する確率と,その部分文字列からカタカナへ変換する確率を文脈を利用して計算する.それらの確率を同時に用いて英語の単語を条件とするカタカナの単語の条件付き確率を計算する.分割と変換は,この確率を最大化する最適なものに決定する.日英の対訳辞書を用いて評価実験を行い,本手法の有効性を確認した.
- 2009-06-01
著者
-
浦谷 則好
NHK放送技術研究所
-
浦谷 則好
Nhk放送技術研究所:(現)東京工芸大学
-
浦谷 則好
(財)nhkエンジニアリングサービス
-
加藤 直人
Nhk放送技術研究所
-
加藤 直人
株式会社エイ・ティ・アール音声翻訳通信研究所
-
江原 暉将
NHK放送技術研究所
-
加藤 直人
Nhk 放送技研
-
田中 英輝
NHK放送技術研究所
-
後藤 功雄
NHK放送技術研究所
-
田中 英輝
Nhk放送技術研究所:(現在)atr音声翻訳通信研究所
-
江原 暉将
Nhk放送技術研究所:(現)諏訪東京理科大学
-
江原 暉将
日本放送協会放送技術研究所
-
江原 暉将
Japan Broadcasting Corp. (nhk)
-
加藤 直人
Atr音声言語コミュニケーション研究所
関連論文
- 単語格子とマルコフモデルによる日本語機能表現の解析 : 日本語機能表現辞書「つつじ」を用いて(解析)
- 定型パターンを含む文の機械翻訳手法
- 部分文字列への最適な分割と文脈を考慮した変換による翻字処理(自然言語処理)
- K-074 知識を統合しユーザの疑問に答えるTVエージェント(K分野:ヒューマンコミュニケーション&インタラクション)
- A-15-22 番組に関するユーザの疑問に答えるTVエージェントシステム(A-15. ヒューマン情報処理, 基礎・境界)
- B-024 番組情報獲得システムにおけるラッパエージェント構築法(B.ソフトウェア)
- 統計的特徴を利用した機能語の自動認定実験(多言語処理・質問応答)
- 障害者向けオフライン字幕制作実用化モデルの開発
- 新しい字幕制作実用化モデルシステムの設計・開発(デジタル放送技術, デジタル設備および一般)
- 音声認識・文字認識を用いた電子化原稿作成支援システムの概要(感性情報処理とマルチメディア技術および一般)
- 9-8 字幕番組制作技術の研究開発フェーズ2における計画の概要
- 字幕制作技術研究開発フェーズ2に関する計画の概要
- ポーズ単位に基づく音声言語統合処理と発話状況管理の統合 : 音声対話システムの試作
- テレビ受信ナビシステムにおける番組選択用リモコンに関する評価実験 : 様々な視聴者が視たい番組を簡単に選択受信できるテレビを目指して(映像メディア処理,感性情報工学及び一般)
- A-19-6 動作合成による手話文CGアニメーション生成(A-19.福祉情報工学,一般セッション)
- 2チャネル音声集音系における楕円積分を乗算係数に用いたスペクトル減算法(音声, 聴覚)
- 視線情報を利用した番組選択インタフェースの開発(セッション5 : マルチモーダルデザイン(2))
- K-074 視線情報を利用したテレビ用ユーザインタフェースの開発(K.ヒューマンコミュニケーション&インタラクション)
- 高齢者におけるデータ放送コンテンツのユーザーインターフェース評価 : 2種類のリモコンを比較して
- A-14-10 音声対話によるテレビ操作インタフェース実験システム
- 7-4 高齢者によるデータ放送コンテンツのユーザーインターフェース評価
- プロトコル分析を用いたデータ放送コンテンツのユーザーインターフェース評価
- プロトコル分析を用いたデータ放送コンテンツのユーザーインターフェース評価
- 用例ベース翻訳の確率的モデル化
- 文融合法に基づいた放送ニュースリード文の具体化
- 話し言葉の日英翻訳システムの評価法
- ニュース要約のための簡易文脈解析(情報抽出・ラベル付与)
- World Wide Webを用いた外国人名の英訳自動獲得(自然言語)
- 翻訳用例提示システムの設計・開発・運用
- オブジェクト連動データ放送システムに適したユーザインターフェースの開発とその評価実験
- オブジェクト連動データ放送システムに適したユーザインターフェースの開発とその評価実験(放送・サービス, ITS画像処理, 映像メディア及び一般)
- オブジェクト連動データ放送システムに適したユーザインターフェースの開発とその評価実験(放送・サービス, ITS画像処理, 映像メディア及び一般)
- 指さしポインターの開発とその性能評価実験
- 指さしポインターの開発とその性能評価実験(画像技術・視覚・その他一般)
- 4. エージェント技術から見たテレビの未来像(未来への手紙)
- OE2-4 視聴者の視聴タイプを利用した番組選択システム(動き出したエージェントシステム,学術系企画)
- ATRの新音声言語データベース
- 日英放送原稿翻訳者のための類似用例提示型翻訳支援システム
- ニュース音声認識のための(n≥4)-gramを併用する言語モデル
- ニュース音声認識のための(n≧4)-gramを併用する言語モデル
- ニュース音声認識のための(n≧4)-gramを併用する言語モデル
- 局所的要約知識の自動獲得手法
- デモ19 ニュース文の局所的要約システム : 文字数の削減による要約
- 5N-1 文字数削減によるニュース文の要約システム
- 文字列探索アルゴリズムを拡張した複数2次元パターンの高速探索アルゴリズム
- 高速な複数文字列照合アルゴリズム
- 音声翻訳実験システム(ASURA)のシステム構成と性能評価
- 通信・放送機構 渋谷上原リサーチセンターの研究紹介 : 視聴覚障害者向け放送ソフト制作技術の研究開発プロジェクト
- エージェントの基礎技術 (放送におけるエージェント技術 特集号)
- エージェント技術の動向と放送への応用 (放送におけるエージェント技術 特集号)
- ユーザモデルエージェントによる番組選択システム
- 4D-4 野球番組ダイジェストのためのアナウンス文の自動生成
- 8-3 ニュース原稿のクラスタリングを用いたトピック抽出
- 人にやさしい放送と自然言語処理
- ニュース音声認識のための(n≧4)-gramを併用する言語モデル
- 放送ニュース文を対象とした効果的類似用例検索法
- 衛星放送用機械翻訳の辞書の改修 (慣用表現を中心に)
- ニュ-ス用英日機械翻訳システムの課題と改善--辞書,文法とその改修を中心に
- 日英ニュース原稿の対訳コーパス化に関する基礎調査
- 4.1 音声処理と翻訳(4.応用技術)(最近の音声処理技術)
- 定型パターンを含むニュース文の抽出とその英日機械翻訳
- AP電経済ニュースからの定型パターンの抽出
- デジタル放送受信機用ユーザ・インタフェースの試作と評価(ヒューマンインタフェース基礎,インタラクション技術の原理と応用)
- デジタル放送用受信機の少ボタン型ユーザ・インタフェースの試作と評価
- パーソナル化するTV受信ナビシステムの開発
- パーソナルTVナビシステムの開発と評価結果
- パーソナルTVナビシステムの開発と評価結果(画像符号化・通信・ストリーム技術,及び一般)
- パーソナルTVナビシステムの開発と評価結果(画像符号化・通信・ストリーム技術,及び一般)
- パーソナルTVナビシステムの開発と評価結果(画像符号化・通信・ストリーム技術,及び一般)
- 視聴態様に適合するテレビ受信ナビシステムの開発(映像メディア処理,感性情報工学及び一般)
- 高背景音放送音声を対象とする字幕・音声自動同期の検討
- 番組推奨を含むテレビ受信ナビシステムの開発と主観評価結果(ハイビジョンおよび一般)
- テレビ受信ナビシステムの開発と評価結果
- 3-1 多様な視聴者にやさしい高度放送受信ナビゲーションシステムの検討課題
- K-075 頭部の自由な動きを許容する視線測定システム(K.ヒューマンコミュニケーション&インタラクション)
- 研究開発中の情報バリアフリー技術(人にやさしい放送,人にやさしい映像情報メディア)
- 衛星放送ワールドニュースの英日機械翻訳
- 形態素調整規則の半自動的獲得手法
- 英語ニュースデータベースの構築
- 英日機械翻訳における固有名詞処理
- 静止画検索システム FORKS の試作
- 英語ニュース文におけるハイフンを含む語の局所解析
- 日本語ニュース文の表現パターンの分析
- 日本語ニュース文の慣用パターンの分析
- 音声翻訳システムASURAの開発
- 後置詞句における助詞の実現と非実現の比較分析
- 2)放送用静止画検索システムFORKS(光・フィルム技術研究会)
- 放送用静止画検索システムFORKS
- 検索システムFORKSの操作性改善
- 結合価パターンを用いた : 深層格抽出法の一検討
- 12-7 オントロジを利用した番組関連情報獲得手法(第12部門 映像検索)
- 21-6 SD法によるデジタル放送受信機用試作リモコンの評価(第21部門 ヒューマンインフォメーション)
- 6-1 Q&Aシステムのための野球オントロジーの設計に関する検討(第6部門 インターフェース,画像・動画処理,その他)
- 9-2 テレビ受信ナビシステムにおける望ましい番組選択用リモコンに関する考察(第9部門 ヒューマンインフォメーションII)
- 20-6 番組選択行動における視線と興味の関係(第20部門 視覚の心理・生理)
- ニュース原稿データベースからの表現パターンの抽出
- FAST 法の効率の推定と長パターン時のふるまい
- 高速な複数文字列照合アルゴリズム : FAST
- 2次元パターン高速探索アルゴリズム
- 15-7 ランドサット画像における判別手法の検討