改行・改頁点付与の自動化を実現する字幕制作要素技術
スポンサーリンク
概要
- 論文の詳細を見る
今日, テレビ番組における聴覚障害者向けの字幕付与の拡充は社会的課題である.我々は自動字幕画面制作・自動要約・自動同期の技術を統合化し, 効率的かつ迅速に字幕制作を実現するためのシステムを研究開発している.本発表では, 自動字幕制作を実現する要素技術として, 書き起こし原稿あるいは自動要約されたテキストに対して自動的に改行・改頁点を付与し, 字幕放送の画面に適合した字幕文を制作する「自動字幕画面制作」の処理手法について報告する.
- 社団法人映像情報メディア学会の論文
- 2001-05-25
著者
-
門馬 隆雄
通信・放送機構渋谷上原リサーチセンター
-
沢村 英治
通信・放送機構渋谷上原リサーチセンター
-
白井 克彦
通信・放送機構渋谷上原リサーチセンター
-
白井 克彦
早稲田大学理工学部コンピュータ・ネットワーク工学部
-
門馬 孝雄
通信・放送機構渋谷上原リサーチセンター
-
江原 暉将
通信・放送機構:nhk放送技術研究所
-
沢村 英治
通信・放送機構(TAO):渋谷上原リサーチセンター
関連論文
- 正弦波トラジェクトリに基づく楽器音中の音声強調
- J-028 音声対話システム利用時における感情表出誘因性に関する考察(ヒューマンコミュニケーション&インタラクション,一般論文)
- 検索語の共起情報を利用した単語クラスタリングとWeb検索への応用
- 検索語の共起情報を利用した単語クラスタリングとWeb検索への応用(QA・Web検索)
- 多次元心的状態を扱う音声対話システムの構築
- A-10-2 べき級数展開によるフォルマント表現(A-10.応用音響,一般セッション)
- A-10-7 べき級数展開によるスペクトル予測推定(A-10. 応用音響,一般セッション)
- 録画番組を対象とした,効率的な字幕番組制作システムの開発(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- 障害者向けオフライン字幕制作実用化モデルの開発
- 新しい字幕制作実用化モデルシステムの設計・開発(デジタル放送技術, デジタル設備および一般)
- 音声認識・文字認識を用いた電子化原稿作成支援システムの概要(感性情報処理とマルチメディア技術および一般)
- 多様な字幕表示形式を選択可能な字幕放送受信システム
- 9-8 字幕番組制作技術の研究開発フェーズ2における計画の概要
- 17-6 オフライン自動字幕番組制作システムの評価
- 字幕制作技術研究開発フェーズ2に関する計画の概要
- 聴覚障害者向け字幕番組の制作技術
- 聴覚障害者向け字幕付きテレビ番組の自動制作システム
- 8-5 字幕番組データを自動制作する新しい字幕制作システムの開発
- 聴覚障害者向けニュースの字幕提示方法に関する主観評価(人間の視覚・聴覚情報)
- 8-1 聴覚障害者のための字幕放送制作技術の研究状況 (第四報)
- 多様な提示法の字幕番組評価実験結果と実験用字幕番組の制作概要(人間とマルチメディア及び一般)
- 多様な提示法の字幕番組評価実験結果と実験用字幕番組の制作概要
- 8-3 聴覚障害者のための字幕放送制作技術の研究状況 (第三報)
- 多様な提示方法の実験字幕番組の自動制作手法と字幕評価実験概要 : 聴覚障害者向け自動字幕制作システムの研究開発
- E-073 適応的言語処理を用いた音声認識利用による楽曲検索システムの検討(E分野:自然言語・音声・音楽)
- 中国語読解支援システムCHIDAOの設計
- 人間形会話ロボット : パラ言語の生成・理解機能を持つマルチモーダルインタフェース
- D-14-14 品詞情報を用いた操作要求発話判別(D-14. 音声,一般セッション)
- D-5-7 相手にあわせた発話調整機能のための言語情報からのユーザモデル生成手法の検討(D-5. 言語理解とコミュニケーション,一般セッション)
- D-5-6 再利用可能情報収集のための構造化データベースの提案(D-5. 言語理解とコミュニケーション,一般セッション)
- ユーザの発話を利用した聞き取りやすい英語への音声変換手法 (音声)
- ユーザの発話を利用した聞き取りやすい英語への音声変換手法 (言語理解とコミュニケーション)
- D-14-11 韻律条件付言語モデルを用いた音声認識のリスコアリング(D-14. 音声,一般セッション)
- D-14-2 文頭・文末の音韻情報を加味した単文に有効な言語識別手法(D-14. 音声,一般セッション)
- D-14-1 対話支援システムのための雑談判別(D-14. 音声,一般セッション)
- 音声対話システムにおける発話意図推定
- ユーザの嗜好に適応させた選曲システムの提案
- D-14-3 質問者の発話による発表スライド特定提示法(D-14.音声,一般セッション)
- A-15-24 PC操作情報とソーシャルタグに基づいた楽曲推薦手法(A-15.ヒューマン情報処理,一般セッション)
- AMとFMの長時間分析に基づく音声認識
- 狭帯域解析信号と非線形識別分析を用いた音声認識(認識,理解,対話,一般)
- 可変長セグメントパタンマッチングに基づく楽音の音高・楽器推定
- 音声・楽器音・歌声が混在した音響信号中の音カテゴリ検出
- 音声母音スペクトルのべき級数展開とその零点分布(研究速報)
- 箏曲の歌の旋律型とリズム型
- 筝曲の歌の旋律型とリズム型
- 楽譜情報に基づいた箏曲の音律と音階の分析
- 箏曲の歌におけるメリスマの表現
- 予測や予備運動が指運動の反応時間に与える影響
- Sinusoidal trajectoryを利用した音楽中の音声検出法
- 音声・楽器音・歌声が重畳した音響信号中のカテゴリ識別
- 音声・楽器音・歌声が重畳した音響信号中のカテゴリ識別
- HMMを用いた音声・音楽識別(信号処理・符号化・一般)
- HMMを用いた音声・音楽識別(信号処理・符号化・一般)
- HMMを用いた音声・音楽自動識別の検討
- 音声/音楽信号の識別とセグメンテーション手法の検討
- 音声・音楽識別を目的とした特徴量の検討
- 音声・音楽識別を目的とした特徴量の検討
- 音声・音楽識別を目的とした特徴量の検討
- 放送音源における音声・音楽区間セグメンテーション手法の検討
- 音声認識から音声対話へ
- D-5-5 子どもの質問に対するわかりやすい回答提示システム(D-5.言語理解とコミュニケーション,一般セッション)
- ユーザの発話を利用した聞き取りやすい英語への音声変換手法(一般(ポスターセッション),第11回音声言語シンポジウム)
- J-006 時空を越えたコミュニケーションを実現する音声インタフェースの提案(ヒューマンコミュニケーション&インタラクション,一般論文)
- J-040 子供を対象とする音声対話インタフェースの検討(J分野:ヒューマンコミュニケーション&インタラクション)
- 音声認識のためのダイナミック非線形手法
- 発話スタイル並列コーパスを用いた発音変形の分析
- I-046 音響信号処理に基づくサッカー映像のインデクシング手法(I.画像認識・メディア理解)
- 聴覚障害者向け字幕番組の制作技術
- 多様な字幕表示形式を選択可能な字幕放送受信システム
- 多様な字幕表示形式を選択可能な字幕放送受信システム
- 音声対話に基づく知的情報検索システム
- ワードスポッティングと動的計画法を用いたテレビ番組に対する字幕提示タイミング検出法
- 通信・放送機構 渋谷上原リサーチセンターの研究紹介 : 視聴覚障害者向け放送ソフト制作技術の研究開発プロジェクト
- Labeled Graph Matching を用いた動画像に対する人物頭部及び表情変化を伴う部位の抽出
- K_005 ロボットの状況判断モデル構築のための人物動作分析(K分野:ヒューマンコミュニケーション&インタラクション)
- D-12-12 能動的情報収集対話における対話開始判断モデルの構築(D-12.パターン認識・メディア理解,一般セッション)
- A-15-17 ロボットを用いた情報収集対話における対話終了判断方法の検討(A-15. ヒューマン情報処理,一般セッション)
- A-15-16 ロボットを用いた情報収集対話における対話継続方法の検討(A-15. ヒューマン情報処理,一般セッション)
- J-049 ロボットから人に話しかける判断モデルの構築(J分野:ヒューマンコミュニケーション&インタラクション)
- D-12-70 人物の姿勢推定を目的とした距離画像と3次元モデルとのフィッティング(D-12.パターン認識・メディア理解,一般講演)
- D-5-16 ロボットを用いたインタビュー形式の対話における非言語情報の分析(D-5.言語理解とコミュニケーション,一般講演)
- J_020 ディジタルアクタシステム実現のための感情表出モデルの構築(J分野:グラフィクス・画像)
- I_055 デジタルカメラワークによるサッカー映像生成(I分野:画像認識・メディア理解)
- K-078 モーションキャプチャデータを用いた多様な歩行動作制御手法の検討(K.ヒューマンコミュニケーション&インタラクション)
- K-073 サッカー映像における近景切替の要因分析(K.ヒューマンコミュニケーション&インタラクション)
- 高背景音放送音声を対象とする字幕・音声自動同期の検討
- 3U-4 音声対話システムにおける発話意図推定(音声言語情報処理,学生セッション,人工知能と認知科学)
- ニュース字幕の提示タイミングずれに対する許容特性
- A-14-22 字幕提示タイミングずれに対する許容の主観評価
- 15-10 聴覚障害者のための字幕放送制作技術の研究状況(第二報)
- ワード列ペアモデルによる字幕送出タイミング検出の検討
- NLC2000-12 聴覚障害者向け字幕放送のためのニュース文自動短文分割
- 実験用字幕つきテレビニュースの制作と字幕表示法に関する予備評価
- 多様な提示法の実験用字幕番組制作と字幕表示法の予備評価実験
- 多様な提示法の実験用字幕番組制作と字幕表示法の予備評価実験
- 実験用字幕つきTVニュースの制作と字幕表示法に関する予備評価について
- 15-8 聴覚障害者のための字幕つきテレビ放送制作への自然言語処理の応用
- 改行・改頁点付与の自動化を実現する字幕制作要素技術
- 4)実験用字幕つきTVニュースの制作と字幕表示法に関する予備評価について(マルチメディア情報処理研究会)