対数スペクトルの任意基底関数による展開に基づいた音声のスペクトル推定とその応用
スポンサーリンク
概要
- 論文の詳細を見る
メルケプストラムをパラメータとして音声スペクトルを表現した場合, 1次オールパス関数のm段縦続接続を基底関数として対数スペクトルを表現することになる.本文では, より効率的に音声スペクトルを表現するために, 基底関数を任意の関数系から選ぶことのできるスペクトル推定法を提案し, そのための分析アルゴリズムを示す.本文では特に, 2次のオールパス関数に基づいて定義された基底関数を用いる場合について考える.このとき, 周波数目盛りの伸縮の度合いに加えて, 伸縮の中心となる周波数を設定することができるため, より自由度の高い周波数分解能の設定が可能となる.本研究では, このスペクトル推定法を用いた分析合成音声の主観評価実験, およびHMMを用いた認識実験により, 提案手法の有効性を示す.
- 1998-09-10
著者
-
北村 正
名古屋工業大学
-
益子 貴史
東京工業大学大学院総合理工学研究科
-
徳田 恵一
名古屋工業大学
-
小林 隆夫
東京工業大学
-
若子 武士
名古屋工業大学知能情報システム学科;(現)松下電器産業(株)avc社
関連論文
- A-15-1 コード進行を用いた楽曲のモデル化と楽曲間の類似度に関する研究(A-15.ヒューマン情報処理,一般セッション)
- 声質と歌唱スタイルを自動学習可能な歌声合成システム(スペシャルセッション・歌情報処理2)
- カラー成分間の相関を利用したカラー画像符号化手法の一検討
- 色変換によるカラー画像の符号化効率改善に関する一検討
- A-15-2 クラシック音楽を対象としたGMMに基づく感性モデルに関する研究(A-15.ヒューマン情報処理,一般セッション)
- HMM音声合成に基づく音声認識率予測手法
- HMMに基づく人物や動作の多様性を考慮した手話認識手法(聴覚障害者支援ほか,福祉情報工学一般,地域におけるITサポート(シンポジウムテーマ))
- MSD-HMMによる隠れ領域を考慮した手話動作のモデル化
- HMMを用いた手話単語を構成するサブユニットの自動生成手法
- A-4-18 Total Variationフィルタを用いた異常環境電磁波の検出(A-4.信号処理,一般セッション)
- A-10-3 相互相関関数を用いた混合音の音高・楽器推定(A-10.応用音響,一般セッション)
- A-1-14 高次ΔΣ変調 A-D 変換器に用いるループフィルタの一設計法
- A-4-28 HMMに基づく日本手話認識のための特徴の統合に関する検討(A-4.信号処理,基礎・境界)
- D-12-121 日本手話認識に用いる特徴量の検討(D-12. パターン認識・メディア理解, 情報・システム2)
- D-12-29 アクティブ画像探索法を用いたHMMジェスチャー認識の特徴量抽出の検討(D-12. パターン認識・メディア理解, 情報・システム2)
- D-12-117 情報量基準に基づいたHMMジェスチャー認識の状態数の検討(D-12. パターン認識・メディア理解B)
- HMMに基づくテキスト音声合成への混合励振源モデルとポストフィルタの導入(音声,聴覚)
- HMM音声合成におけるスペクトル・ピッチへの固有声手法の適用
- HMMに基づく音声合成への混合励振源モデルとポストフィルタの導入
- HMM音声合成におけるスペクトル・ピッチへの固有声手法の適用
- HMMに基づく音声合成への混合励振源モデルとポストフィルタの導入
- HMMに基づく音声合成におけるスペクトル・ピッチ・継続長の同時モデル化(音声情報処理 : 現状と将来技術論文特集)
- 隣接ブロックを用いたDCT領域での高解像度化手法の高速化に関する一検討
- 高圧縮静止画像の高画質化に関する研究(研究速報,圧縮画像の画質改善,画像符号化・映像メディア処理)
- A-4-24 環境電磁波観測回路に用いるタイミング同期回路の開発(A-4.信号処理,一般講演)
- 逆ウェーブレット変換を用いた動画像高画質化に関する一検討
- 隣接ブロックを用いたDCT領域での解像度変換の高速化
- ケプストラム分析による大域・局所モデルを用いた異常環境電磁波の検出に関する一検討
- A-4-16 ケプストラム分析を用いた異常環境電磁波の検出(A-4.信号処理,一般講演)
- A-4-5 基本動作HMMに基づく手話単語認識手法(A-4.信号処理,一般講演)
- J_010 ウェーブレット変換を用いた動画像のブロックひずみ低減手法(J分野:グラフィクス・画像)
- A-4-6 隣接ブロックを用いたDCT係数上での解像度変換の有理数倍率への拡張に関する一検討(A-4.信号処理,一般講演)
- 逆ウェーブレット変換によるブロックひずみ低減手法
- 隣接ブロックを用いたDCT係数上での解像度変換
- JPEG・MPEGにおけるブロックひずみ低減手法の一検討
- ケプストラムに基づく雑音下のピッチ抽出法の改善
- 音声の動的特徴と付加雑音を用いる雑音下での単語音声認識
- ケプストラム合成音声の品質改善の一方法
- 混合因子分析に基づく話者識別モデルのパラメータ共有構造(ポスターセッション)(第5回音声言語シンポジウム)
- 混合因子分析に基づく話者識別モデルのパラメータ共有構造(第5回音声言語シンポジウム : ポスターセッション)
- 混合因子分析に基づく話者識別モデルのパラメータ共有構造(第5回音声言語シンポジウム : ポスターセッション)
- 混合因子分析に基づく話者識別モデルのパラメータ共有構造
- パラメータ共有HMMに基づく音響信号からの自動和音認識の検討
- 視聴覚情報を用いた意図推定の為の決定木に基づく意図境界推定
- 楽譜を考慮した演奏者の統計的モデル化手法の改善と演奏者識別による評価
- 単旋律のパート分配によるアンサンブルのための自動編曲手法
- ウェーブレットパケット交換による適応信号処理
- 楽譜情報のコンテキストクラスタリングに基づく演奏者のモデリング手法
- 声質と歌唱スタイルを自動学習可能な歌声合成システム(スペシャルセッション・歌情報処理2)
- HMMを用いた日変動パターンに基づく環境電磁波のモデル化と異常検出(信号処理,知的マルチメディアシステム,一般)
- HMMを用いた日変動パターンに基づく環境電磁波のモデル化と異常検出(信号処理,知的マルチメディアシステム,一般)
- 変分ベイズ法に基づく声質変換(音声合成・韻律,第9回音声言語シンポジウム)
- 変分ベイズ法に基づく声質変換(音声合成・韻律,第9回音声言語シンポジウム)
- 変分ベイズ法に基づく声質変換(音声合成・韻律,第9回音声言語シンポジウム)
- D-14-4 骨導音声を用いたGMMに基づく話者識別(D-14.音声,一般セッション)
- 視聴覚情報を用いた意図推定の為の決定木に基づく意図境界推定 (音声)
- 視聴覚情報を用いた意図推定の為の決定木に基づく意図境界推定 (言語理解とコミュニケーション)
- A-4-29 HMMを用いた日平均情報に基づく環境電磁波の異常放射検出(A-4.信号処理,一般セッション)
- A-4-30 GMMを用いたケプストラムの日平均情報に基づく環境電磁波の分析(A-4.信号処理,一般セッション)
- A-10-3 GMMに基づく演奏者の音楽的逸脱のモデル化(A-10.応用音響,一般セッション)
- D-12-51 雑音の影響による音声と画像のずれをモデル化したバイモーダル大語彙連続音声認識(D-12.パターン認識・メディア理解A(パターンメディアの認識・理解・生成),一般セッション)
- ベイズ的アプローチに基づくHMM音声合成(合成, 韻律, 生成, 一般)
- 日本手話の音韻構造を考慮したHMMに基づく手話認識(一般セッション,福祉と見守りのための画像・音声処理)
- 日本手話の音韻構造を考慮したHMMに基づく手話認識(一般セッション,福祉と見守りのための画像・音声処理)
- 日本手話の音韻構造を考慮したHMMに基づく手話認識(一般セッション,福祉と見守りのための画像・音声処理)
- H-028 GMMを用いた環境電磁波の異常検出と地震のエネルギーとの相関(画像認識・メディア理解,一般論文)
- AS-2-10 SOM上の環境電磁波の特徴(AS-2.電磁波地震予知における信号処理の新展開、評価技術,シンポジウム)
- 認識時に非観測な変動要因を考慮可能な音響モデリング(ポスターセッション)(第5回音声言語シンポジウム)
- 認識時に非観測な変動要因を考慮可能な音響モデリング(第5回音声言語シンポジウム : ポスターセッション)
- 認識時に非観測な変動要因を考慮可能な音響モデリング(第5回音声言語シンポジウム : ポスターセッション)
- 認識時に非観測な変動要因を考慮可能な音響モデリング
- 2次元メルケプストラムとCombNET-IIを用いる話者認識 : StemNETによる認識
- 決定木に基づく音素コンテクスト・次元・状態位置の同時クラスタリングによる音響モデリング(音声,聴覚)
- D-12-119 手の動作と形状を用いたHMM手話認識(D-12. パターン認識・メディア理解B)
- A-4-23 手座標追跡によるジェスチャー認識
- I-21 ジェスチャーを用いた個人識別におけるPCAの次元数の検討(人物姿勢推定・ジェスチャ認識,I.画像認識・メディア理解)
- CombNET-IIによる中国語1000単語音声認識
- E-037 コード進行クラスタリングによる楽曲のモデル化と楽曲間類似度の評価(自然言語・音声・音楽,一般論文)
- D-12-124 手話単語認識のためのサブユニットHMMの自動生成(D-12.パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス),一般セッション)
- A-10-4 環境電磁波のケプストラムを用いたベクトル量子化 : コードワードの解析(A-10.応用音響,一般セッション)
- K-019 手話単語を構成するためのサブユニットHMMの自動生成(教育工学・福祉工学・マルチメディア応用,一般論文)
- A-4-19 周波数成分を考慮した Wavelet-DCT 符号化
- K-092 隠れマルコフモデルに基づく指文字動画像生成(K分野:ヒューマンコミュニケーション&インタラクション)
- A-10-8 混合音の調波構造パターンとの相関による楽器・音高推定(A-10.応用音響,一般セッション)
- A-1-42 電力関係式を用いたバンドパスΔΣ変調A-D変換器の一検討(A-1.回路とシステム,一般講演)
- HMM音声合成におけるガンマ分布状態継続長モデルの検討
- HMM音声合成におけるガンマ分布状態継続長モデルの検討
- A-6-4 メル一般化ケプストラム分析に基づくMELP音声符号化
- K-057 HMMに基づく手の動きと形状特徴のストリーム別クラスタリングを用いた手話認識手法(K分野:教育工学・福祉工学・マルチメディア応用,一般論文)
- D-12-37 音声と唇情報を用いたバイモーダル個人識別
- I-60 音声と顔画像を用いた個人認識(顔認識,I.画像認識・メディア理解)
- I-009 分離型2次元格子HMMに基づく顔画像認識(I分野:画像認識・メディア理解)
- A-10-15 ベクトル量子化手法に基づくELF環境電磁波の分類
- A-10-8 ケプストラム表現に基づくELF帯環境電磁波の標準パターン
- A-10-5 ELF帯環境電磁波のケプストラム分析
- F-22 HMM歌声合成における音韻・音高の同時モデル化(音楽情報科学(1),F.音声・音楽)
- 識別的特徴抽出に基づく話者認識 : メルケプストラム特徴の最適化
- E-029 状態共有型HMMに基づく音楽音響信号からの自動和音認識の検討(E分野:自然言語・音声・音楽,一般論文)
- A-1-12 スイッチトキャパシタΔΣ変調器の非理想要素の解析法(A-1.回路とシステム,一般講演)
- A-1-11 高次ΔΣ変調A-D変換器の重み係数設計法に関する研究(A-1.回路とシステム,一般講演)