音声セグメントを考慮したSTRAIGHTスペクトログラムの非負値行列因子分解(一般(ポスターセッション),第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,STRAIGHTにおけるスペクトログラムの圧縮のための音声のセグメントに着目した非負値行列因子分解の新しい枠組みを提案する.非負値行列因子分解は,非負値制約を用いて行列を分解する手法であり,初期値の設定手法や制約条件により分解された行列に特徴を持たせることができる.しかし,非負値行列因子分解を例えば一文の音声のスペクトログラム全体に適用した場合,スペクトログラム全体での因子分解の誤差最小化を行うため,音素によってスペクトルのレベルが高い場合,その音素に重みが偏ってしまう.レベルが高いスペクトルはよく近似できるが,レベルが低いスペクトルは重みが偏ってしまうことで最適な値に近似できない可能性がある.そこで,音声セグメントの特徴に基づいてクラスタ化し,クラスタごとに最適な基底スペクトルを定めスペクトログラムをモデル化する.
- 社団法人電子情報通信学会の論文
- 2010-12-13
著者
-
間野 一則
Nttサイバースペース研究所
-
間野 一則
Nttサイバースペース研
-
Mano Kazunori
Ntt Cyber Space Laboratories Ntt Corporation
-
小関 真
芝浦工業大学システム理工学部
-
間野 一則
芝浦工業大学システム理工学部
関連論文
- SG会合報告 ITU-T SG16(マルチメディアサービス、システムおよび端末)第8回全体会合報告
- SG会合報告 ITU-T SG16(マルチメディアサービスとシステム)第6回全体会合報告
- 2. 音声符号化技術 (<特集>「音声処理技術とその応用」)
- CELP 符号化における励振符号帳の学習法
- ピッチ同期雑音励振源をもつ CELP 符号化 (PSI-CELP)
- 移動平均型フレーム間予測を用いる LSP パラメータのベクトル量子化
- D-14-3 ITU-T標準化向け24,32kbit/s広帯域コーデックの検討
- メディア処理(メディア情報,映像情報メディア年報)
- マルチメディア情報処理(画像情報工学)(映像情報メディア年報)
- インパルス応答の極端な打ち切りによる4.6kbit/s低演算量音声符号化
- 顧客へのリアルな音声応答を実現するテキスト音声合成技術「Cralinet」 (特集 コンタクトセンタ業務に革新をもたらす音声処理技術)
- 波形接続型音声合成のためのアクセント評価に基づく素片再選択法(合成,生成,韻律,一般)
- 音声符号化のテクニック
- D-14-18 ForwarD-Backward Recover Sub-Codec(FB-RSC)に基づくパケット消失補償
- D-14-24 定常雑音生成器に基づく雑音後処理
- D-14-23 高能率MA予測LSPパラメータ量子化の検討
- ピッチ波形に基づく線形予測ボコーダ
- ITU-Tにおける音声符号化の標準化動向
- ピッチ波形に基づく低ビットレート音声符号化法における励振源に関する検討
- ピッチ波形に基づく2kbit/s音声符号化法
- スパース符号帳を用いたPSI-CELP音声符号化
- 高品質音声圧縮技術を用いた視覚障害者のための朗読配信システム
- DualSpeechの応用ソフトウェア:DualSpeech/DATA,DualSpeech/MAIL (特集論文 音声圧縮ソフトDualSpeechとその応用)
- 5kHz帯域低ビットレート音声符号化 : 帯域感, ノイズ感と主観品質の関係(音声情報処理 : 現状と将来技術論文特集)
- 高速パルス探索型4kbit/s音声符号化
- 低ビットレート音声符号化における背景雑音付加音声の品質向上
- 低ビットレート音声符号化における背景雑音付加音声の品質向上
- 雑音下での音声符号化 -実用における課題-
- DualSpeech音声符号化ソフトウェア (特集論文 音声圧縮ソフトDualSpeechとその応用)
- 木符号化を用いたディレ-ドデシジョンCELP符号化
- PSI-CELPの主観品質向上技術と評価結果 (移動通信用PSI-CELP音声符号化方式)
- 音声の高能率符号化 (音声信号処理特集号)
- Noise Post-Processing for Low Bit-Rate CELP Coders(Speech and Hearing)
- Design of a Robust LSP Quantizer for a High-Quality 4-kbit/s CELP Speech Coder(Speech and Hearing)
- Coding of LSP Parameters Using Interframe Moving Average Prediction and Multi-Stage Vector Quantization (Special Section of Letters Selected from the 1993 IEICE Spring Conference)
- Pitch Synchronous Innovation CELP (PSI-CELP) (Special Section of Letters Selected from the 1993 IEICE Spring Conference)
- 音声セグメントを考慮したSTRAIGHTスペクトログラムの非負値行列因子分解(一般(ポスターセッション),第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- 音声セグメントを考慮したSTRAIGHTスペクトログラムの非負値行列因子分解(一般(ポスターセッション),第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- Special Invited Survey and Special Issue on the 2001 IEICE Excellent Paper Award
- 低ビットレ-トの音声符号化インタ-ネットでも適用始まる
- ベクトル量子化スペクトルの頻度分布による話者識別
- フレ-ム単位の特徴系列による音韻性情報の抽出
- フレ-ム単位の特徴系列による音韻性情報の抽出
- セグメンタルNMFによる音声分析合成における基底行列圧縮の検討(ポスターセッション,第13回音声言語シンポジウム)
- セグメンタルNMFによる音声分析合成における基底行列圧縮の検討(ポスターセッション,第13回音声言語シンポジウム)
- D-14-7 発話ログ分析におけるシーン推定のための特徴量抽出(D-14.音声,一般セッション)
- セグメンタルNMFによる音声分析合成における基底行列圧縮の検討
- 2-222 グローバルPBLのアウトカムとアセスメント(オーガナイズドセッション:プロジェクトマネジメントとPBL-II)
- 2-221 システム思考の工学に基づいた国際+世代+領域間混成によるGlobal Project Based Learning(オーガナイズドセッション:プロジェクトマネジメントとPBL-II)
- PCM量子化雑音低減のための事例ベース音声強調(スピーチエンハンスメント,電気音響,信号処理,音声一般)
- PCM量子化雑音低減のための事例ベース音声強調(スピーチエンハンスメント,電気音響,信号処理,音声一般)
- PCM量子化雑音低減のための事例ベース音声強調(スピーチエンハンスメント,電気音響,信号処理,音声一般)