音声合成のためのサブバンド符号化技術を用いた高速な波形生成(音声合成・音声再生,電気音響,信号処理,音声一般)
スポンサーリンク
概要
- 論文の詳細を見る
HMM音声合成における波形生成処理を高速化するため、MPEGオーディオ符号化で用いられるサブバンド符号化技術を応用した音声波形の生成方法を提案する。提案方法は音源波形に対してフィルタバンクで帯域分割を行い、帯域分割波形の振幅をそれぞれ変更して組み合わせて音声のスペクトルを合成する方法が基となっているが、帯域分割波形を予めサブバンド符号化しておき、サブバンド符号領域で帯域分割波形を組み合わせることで、処理量を削減する。また、特に低域のスペクトル再現性を改善するための正弦波合成も併せて導入するが、この処理もサブバンド符号領域で行う。このような構成とすることで、音声合成システム上でのサブバンド符号化処理が不要となる。また提案手法では、従来のメルケプストラムからスペクトルを求める必要が生じるが、サブバンド符号の復号処理で用いられる離散コサイン変換(DCT)処理を利用したスペクトルの計算方法についても説明する。自然音声の分析結果から再合成した音声に対する主観評価実験の結果、提案手法はメル対数スペクトル近似(MLSA)フィルタを従来の波形生成方法よりも高いスコアが得られた。
- 2013-05-09
著者
関連論文
- 多数の携帯電話とデジタルサイネージ間のインタラクションを可能にするクライアントサーバー型Bluetooth通信方式 (ディペンダブルコンピューティング)
- 多数の携帯電話とデジタルサイネージ間のインタラクションを可能にするクライアントサーバー型Bluetooth通信方式 (コンピュータシステム)
- 音楽情報検索向け類似テキスト検索システムの試作(音楽情報検索)
- 携帯電話音声に対する主観評価の精度及び客観評価尺度PESQの有効性の検証(一般)
- 背景雑音を含む携帯電話音声に対するMOS評価の精度推定とPESQの有効性検証
- 携帯インターネットサービスのための音声認証システムの試作と評価
- B-20-60 パッシブ型超音波ポインティングシステムにおける追従性能の評価(B-20.ユビキタス・センサネットワーク,一般セッション)
- 2 携帯電話における分散型音声認識システムの実用化(音声認識技術の実用化への取り組み)
- 分散型音声認識の商用システム構築(特別企画「音声認識デベロッパーズフォーラム」)
- B-15-16 統合PDA端末の開発(6) : 分散型音声認証システムの実装(B-15. モバイルマルチメディア通信, 通信1)
- キーワードと音響的に類似したアンチキーワードを用いたキーワードスポッティングのリジェクション性能の改善
- 連続数字のパタン指定方式による時期差データに対する話者照合精度の改善
- 携帯インターネットサービスのための音声認証システムの試作と評価
- 携帯電話音声に含まれる雑音のモデル化による音声区間検出誤りの削減
- 混合分布HMMにおけるTree-basedクラスタリング(音声情報処理 : 現状と将来技術論文特集)
- D-14-9 電話音声認識を用いた株価情報案内システム
- SP2000-10 多数話者電話音声データベースを用いた話者クラスタリング
- 大語彙汎用音声認識エンジンの評価
- 大語彙汎用音声認識エンジンの開発
- 多数話者電話音声データベースを用いた話者クラスタリングの検討
- 不特定話者混合分布HMMにおけるTree-Basedクラスタリングの検討
- 不特定話者混合分布HMMにおけるTree-Basedクラスタリングの検討
- 不特定話者混合分布HMMにおけるTree-Basedクラスタリングの検討
- 音声信号の途切れ・オーバーフローへのMissing Feature Theoryの適用
- 多数の携帯電話とデジタルサイネージ間のインタラクションを可能にするクライアントサーバー型Bluetooth通信方式
- 多数の携帯電話とデジタルサイネージ間のインタラクションを可能にするクライアントサーバー型Bluetooth通信方式
- 多数の携帯電話とデジタルサイネージ間のインタラクションを可能にするクライアントサーバー型Bluetooth通信方式
- 多数の携帯電話とデジタルサイネージ間のインタラクションを可能にするクライアントサーバー型Bluetooth通信方式
- A-10-1 3次元位置推定に基づくパッシブ型超音波ポインティングシステムの構築(A-10. 応用音響,一般セッション)
- 不特定話者混合分布HMMにおけるTree-Basedクラスタリングの検討
- 最ゆう状態系列を用いた実時間ケプストラム平均値正規化の検討
- リジェクションを用いた音声始端検出法の改良
- 電話音声認識におけるケプストラム平均値算出法の改良
- 最尤状態系列を用いた実時間ケプストラム平均値正規化の検討
- 時差・エリアコード案内システムの試作
- 発声内容を考慮した実時間ケプストラム平均値正規化の検討
- RJ-006 注視行動の予測に向けた動画像コンテンツの視覚的特徴と実測した注視点の正準相関分析(J分野:ヒューマンコミュニケーション&インタラクション,査読付き論文)
- 2010年度喜安記念業績賞紹介 : 第3世代携帯電話向けの分散型音声認識システムの実用化
- 4-1 CGM動画像検索のための動き特徴の分散に基づいたハイライト区間抽出手法に関する考察(第4部門 メディア処理1)
- 5-7 ライトの反射光を利用した携帯電話向けユーザインタフェース(第5部門 メディア処理2)
- 18-1 テレビ番組の探しやすさと選局の操作しやすさを特徴とする簡単リモコンGUIの試作と評価(第18部門[テーマ講演]人にやさしい情報メディア技術)
- J-056 加速度およびタッチパネルへの入力情報を用いた携帯端末の持ち手・打ち手判別(HCI(4),J分野:ヒューマンコミュニケーション&インタラクション)
- J-039 HMMに基づくフリックキーボード入力方式(インタフェース,J分野:ヒューマンコミュニケーション&インタラクション)
- BP-5-4 「ぺらたま」〜音声合成を利用した育成ゲームの開発〜(BP-5.モバイルアプリケーション最前線,パネルセッション,ソサイエティ企画)
- Robust and Fast Search Algorithm for Lyric Search Covering Erroneous Queries due to Mishearing
- 音声合成のためのサブバンド符号化技術を用いた高速な波形生成(音声合成・音声再生,電気音響,信号処理,音声一般)
- 音声合成のためのサブバンド符号化技術を用いた高速な波形生成(音声合成・音声再生,電気音響,信号処理,音声一般)
- 音声合成のためのサブバンド符号化技術を用いた高速な波形生成(音声合成・音声再生,電気音響,信号処理,音声一般)
- タブレットデバイスにおける音声対話エージェントを用いたインタラクティブなレシピ検索インターフェイス(コミュニケーション支援及びヒューマン情報処理一般)
- タブレットデバイスにおける音声対話エージェントを用いたインタラクティブなレシピ検索インターフェイス(コミュニケーション支援及びヒューマン情報処理一般)
- 線形予測残差の尖度に基づく近端/遠端話者判別の提案(一般,時系列パターン認識,一般)