合成音声を用いたオンライン動画音声ガイド提供の実現に向けて
スポンサーリンク
概要
- 論文の詳細を見る
合成音声による動画音声ガイド提供のための共通プラットフォーム構築の試みについて述べる.音声合成技術により録音作業が不要となるため,音声ガイド制作が大幅に省力化され,音声ガイド対応の遅れているWeb上の動画コンテンツに対しても容易に音声ガイドを提供できるようになるものと期待される.本稿では,視覚障害者ユーザを対象として実施した合成音声による音声ガイド評価実験について報告するとともに,実験を通して明らかになった音声ガイド記述フォーマットおよび編集・再生ソフトウェアの要件,オンライン動画向け音声ガイド制作の指針について述べる.
- 2010-03-05
著者
-
立花 隆輝
日本アイ・ビー・エム東京基礎研究所
-
長野 徹
日本アイ・ビー・エム東京基礎研究所
-
小林 正朋
日本アイ・ビー・エム(株)
-
長妻 令子
日本アイ・ビー・エム株式会社東京基礎研究所
-
高木 啓伸
日本アイ・ビー・エム株式会社東京基礎研究所
-
小林 正朋
日本アイ・ビー・エム株式会社東京基礎研究所
-
小林 正朋
東京大学
-
長野 徹
日本アイ・ビー・エム株式会社東京基礎研究所
-
長野 徹
日本アイ・ビー・エム
-
高木 啓伸
日本アイ・ビー・エム 東京基礎研
-
立花 隆輝
日本アイ・ビー・エム株式会社東京基礎研究所
-
高木 啓伸
日本アイ・ビー・エム
-
立花 隆輝
日本アイ・ビー・エム(株)
-
長妻 令子
日本アイ・ビー・エム株式会社
関連論文
- みんなでつくるアクセシビリティ : コラボレーションで実現するWebのバリアフリー
- IBMプロフェッショナル論文 作業効率の高いテキスト合成音声チューニング環境
- コーパスベース日本語音声合成フロントエンド (システム開発論文特集)
- 波形重畳型音声合成の韻律と音質のためのF0傾きモデルの利用(音声合成・韻律,第9回音声言語シンポジウム)
- コーパスベース日本語音声合成フロントエンド(音声システム,システム開発論文)
- 音声Webアクセス : 受賞業績 音声ブラウザの開発とWebアクセシビリティ技術普及への貢献(平成20年度喜安記念業績賞紹介)
- Webアクセシビリティ向上支援ツール : aDesigner(インタラクティブソフトウェア)
- K_065 プレゼンテーションドキュメントのアクセシビリティ評価手法(K分野:ヒューマンコミュニケーション&インタラクション)
- 合成音声を用いたオンライン動画音声ガイド提供の実現に向けて
- 波形重畳型音声合成の韻律と音質のためのF0傾きモデルの利用(音声合成・韻律,第9回音声言語シンポジウム)
- 波形重畳型音声合成の韻律と音質のためのF0傾きモデルの利用(音声合成・韻律,第9回音声言語シンポジウム)
- ユーザフィードバックに基づいて発展する仮想的な生態系を介した対話的なデータ探索環境(一般セッション, インタラクション・メディアおよび一般)
- ライフサイエンス向けテキストマイニングツールMedTAKMI(テキストマイニングの応用(2))
- K_064 自動生成されたメタデータに基づく視覚障害者のためのプレゼンテーション文書アクセスインタフェース(K分野:ヒューマンコミュニケーション&インタラクション)
- プレゼンテーション文書の構造化のためのメタ情報の自動付加手法(福祉と音声処理, 一般)
- プレゼンテーション文書の構造化のためのメタ情報の自動付加手法(福祉と音声処理, 一般)
- プレゼンテーション文書の構造化のためのメタ情報の自動付加手法
- 複数文献の重要語を構造化する概念ネットワークの自動生成とインタラクティブな可視化
- 文献からの概念ネットワークの自動生成と問題構造の理解に与える効果
- 音声合成を用いたインターネット動画用音声ガイド
- 視覚障害者のための Web ページ構造提示手法
- 表示ベースでウェブページのアクセシビリティを評価するシステム(福祉と音声処理及び一般)(音声)
- 表示ベースでウェブページのアクセシビリティを評価するシステム(福祉と音声処理及び一般)
- ウェブページのダイジェスト手法の評価
- ウェブページのダイジェスト手法の評価
- アクセシビリティ向上のためのWebコンテンツトランスコーディングシステム
- アノテーションに基づくウェブページのダイジェスト手法
- Webコンテンツ間の共通レイアウト自動解析
- S1-5 テキストからの意図抽出(特別セッション(S1) : テキストマイニング)(第30回日本行動計量学会大会発表一覧)
- 多重ベータ混合モデルを用いた調波時間構造のモデル化による音声合成の検討(一般(ポスターセッション),第11回音声言語シンポジウム)
- 多重ベータ混合モデルを用いた調波時間構造のモデル化による音声合成の検討(一般(ポスターセッション),第11回音声言語シンポジウム)
- 音声合成のための自動アクセントラベリング(セッション5 : 音声認識+音声合成)
- 音声合成のための自動アクセントラベリング(セッション5 : 音声認識+音声合成)
- N-gramモデルを用いた音声合成のための読みおよびアクセントの同時推定(音声言語,情報処理技術のフロンティア)
- 確率モデルを用いた読み及びアクセント推定(言語解析, 対話)
- 読み上げ韻律との差分を使った強調韻律の学習
- テキストマイニングのための情報抽出
- テキストマイニングのための情報抽出
- 大量のテキストからの知識マイニング
- テキストからの意図抽出(テキストマイニング)
- 知識発見のためのテキストマイニング技術
- 4N-7 テキストマイニングのための情報抽出 : 情報レベルの最適化
- 4N-6 知識発見のためのテキストマイニング技術
- テキストマイニングのための情報抽出手法
- (第3回)宣言型コンテンツフォーマット(2) : XHTML/スタイルシート(CSS)(マルチメディアコンテンツフォーマットの実際〜放送・通信サービスを実現させた各種フォーマット〜)
- (第4回)宣言型コンテンツフォーマット(3) : DOM/スクリプト言語(マルチメディアコンテンツフォーマットの実際〜放送・通信サービスを実現させた各種フォーマット〜)
- 紙に埋め込まれたプログラムによる紙インタフェース
- 視覚障害者への音声提示における最適・最高速度
- 対数振幅を用いた音楽電子透かしの雑音付加に対する通信容量(情報セキュリティ基礎)
- J-48 リアルタイム埋め込みのための音楽電子透かし(電子透かし,J.グラフィクス・画像)
- A-19-2 シナリオ情報の共有を考慮した音声ガイド台本エディターの開発(A-19.福祉情報工学,一般セッション)
- 2 テキストマイニング : 膨大な文書データの自動分析による知識発見 (フィールドを広げる自然言語処理)
- テキストマイニング : 膨大な文書データからの知識獲得 : 概要
- テキストマイニング : 膨大な文書データからの知識獲得 : 意図の認識
- D-21-9 音響電子透かし技術の評価基準と評価コンテスト(D-21.マルチメディア情報ハイディング・エンリッチメント,一般セッション)
- 音声データの隠れ属性を利用した異種音響モデル群の構築
- 音響信号に対する情報ハイディング及びその評価基準の検討(異種メディア融合,コンテンツ処理,メディア検索,電子透かし,一般)
- 音響信号に対する情報ハイディング及びその評価基準の検討(異種メディア融合,コンテンツ処理,メディア検索,電子透かし,一般)
- 音響信号に対する情報ハイディング及びその評価基準の検討
- HTML5標準案に基づく音声ガイド提供の現状と課題 : 合成音声を活用した音声ガイドの普及に向けて(視覚障害)
- 音響信号に対する情報ハイディング及びその評価基準の検討
- 高齢者の履歴書からの特徴語抽出によるスキルの発見とマッチング(情報の整理,第2回テキストマイニング・シンポジウム)
- クラウドソーシングを活用した効率良い字幕作成手法
- 大語彙連続音声認識と音節N-best音声認識を用いたSpoken Term Detectionの高精度化
- クラウドアクセシビリティ : クラウドソーシングによる障害者支援(ヒューマンコンピュテーションとクラウドソーシング)
- HTML5標準案に基づく音声ガイド提供の現状と課題 : 合成音声を活用した音声ガイドの普及に向けて