ワープロ型と行単位型融合によるハイブリッド字幕編集システム(聴覚補助,<特集>情報福祉論文)
スポンサーリンク
概要
- 論文の詳細を見る
字幕が付与されていないディジタルアーカイブコンテンツが数多く存在する.アクセシビリティの重要性をかんがみて,こういったコンテンツに対して,音声をもとに字幕を付与することは極めて重要である.ただし,字幕の付与は人手による長時間の編集作業を要求する.我々は先に,音声認識を利用した字幕編集方式として,従来のワープロ型編集に比べ,認識誤りを含む字幕編集における一連の作業の効率化を意図した機能追加が容易な,行単位型を提案した.ところが,行単位型は高い認識率に対する有効性が認められるものの,認識率の低い部分の操作性に課題があることが分かってきた.本論文では,まずディジタルコンテンツにおける認識率のばらつきに着目し,実際のコンテンツにおける認識率のばらつきを調査する予備実験を行った.その結果,コンテンツ間の認識率のばらつきは大きく,更に,同一のコンテンツ内においても認識率のばらつきは予想以上に大きいことが分かった.これらの点を踏まえ,本論文では,音声認識率の変動にも処理効率が影響されにくいような,ワープロ型と行単位型を融合したハイブリッド字幕編集システムを提案する.編集効率に対する実験の結果,本システムによって従来の編集方式を上回る効果が見られた.
- 2007-03-01
著者
-
斉藤 隆
日本アイ・ビー・エム株式会社 東京基礎研究所
-
荒川 健一
日本アイ・ビー・エム株式会社アクセシビリティセンターasia Pacific
-
宮本 晃太郎
日本アイ・ビー・エム株式会社アクセシビリティセンターAsia Pacific
-
宮本 晃太郎
日本アイ・ビー・エム(株)
-
斉藤 隆
日本アイ・ビー・エム(株)
関連論文
- 3.放送・教育における音声を利用した障害者支援(バリアフリー社会に向けた音声情報処理)
- インターネット環境におけるアクセシビリティ
- ワープロ型と行単位型融合によるハイブリッド字幕編集システム(聴覚補助,情報福祉論文)
- 高品質な感情音声を合成する手法と顔型ロボットへの実装例
- F0形状の統計的操作に基づくイントネーション生成法に関する検討 : 話者・発話スタイルの比較検討
- ボイスフォントに基づく話者性を有する音声の合成
- ボイスフォントの話者性の評価
- シームレス音声合成におけるイントネーションの生成に関する検討
- F0形状の統計的操作に基づくイントネーションの生成
- ボイスフォント・ビルダー : テキスト音声合成における音声辞書作成ツール
- テキスト音声合成を利用した音素・韻律統合ラベリングシステム
- 話者特徴を反映した音声合成のための音声特徴抽出
- ウェーブレット変換を用いた自動ピッチマーキング手法
- ボイス・フォント登録システムにおける音素セグメンテーション方式の検討
- 参照辞書を用いた合成単位辞書自動生成法の検討
- 新規話者音声登録機能を有するテキスト音声合成システム
- 日本語テキスト音声合成のための言語処理の検討
- 環境依存性を考慮した音節を合成単位とする音声合成 -音素クラスターを用いた音節合成単位の生成-
- 環境依存性を考慮した音節を合成単位とする音声合成 -環境依存クラスタリングによる音素クラスターの生成-
- 波形重畳法を用いた日本語テキスト音声合成システムについて
- 日本語テキスト音声合成のためのN文節構造解析とそれに基づく韻律制御
- 音声合成にどこまで使えるか?--テキストから抑揚をもった音声へ変換 (ウェ-ブレットの産業応用)
- 圧縮した残差を用いた規則音声合成法