聴覚特性を利用した正弦波重畳による低ビット音声符号化
スポンサーリンク
概要
- 論文の詳細を見る
1.2kbpsでの極低ビット音声符号化方式を新たに提案する。提案方式はLPCボコーダと類似な方法であるが、その音質を改善するために、音声信号をピッチ周波数の整数倍の周波数を有する正弦波によって合成する、いわゆるharmonic codingの手法を採用し、その振幅成分を聴覚特性を用いて適応的に変調する。本報告では正弦波による音声合成の原理について述べ、次に聴覚特性に基づいて正弦波を変調する方法について述べる。ここでは、聴覚特性を模擬するためにGammatoneフィルタを用いた。また、ビットレートを1.2kbpsに削減するためにスペクトル情報(LSP係数)をDPマッチングを用いてセグメント量子化する方法もあわせて提案する。試聴の結果、提案方法による合成音声の音質は、LPCボコーダのそれと比較してかなり改善されることが確認された。
- 社団法人電子情報通信学会の論文
- 1997-09-11
著者
-
木幡 稔
千葉工業大学情報ネットワーク学科
-
佐藤 純生
シャープ株式会社先端映像技術研究所
-
佐藤 純生
東北大学大学院工学研究科
-
木幡 稔
東北大学 大学院 工学研究科
-
松本 文明
東北大学大学院 工学研究科
-
木幡 稔
東北大学大学院 工学研究科
-
松本 文明
東北大学工学部
関連論文
- 時間冗長性圧縮によるボコーダ型音声符号化の低ビットレート化(音声,聴覚)
- 時間冗長性圧縮によるボコーダ型音声符号化の低ビット化(言語獲得・学習,合成,生成,韻律,一般)
- 3Q-7 大画面ディスプレイにおける鉛直方向の腹話術効果に関する考察(音声の分析・合成,学生セッション,人工知能と認知科学)
- 鉛直方向の腹話術効果に及ぼす音響再生系の影響
- 時間冗長性圧縮によるボコーダ型音声符号化の低ビットレート化
- 木構造HMMによるLSP係数の符号化
- セグメント末端処理を用いたErgodic HMMによるLSP係数の符号化
- セグメント末端処理を用いたErgodic HMMによるLSP係数の符号化
- セグメント末端処理を用いたErgodic HMMによるLSP係数の符号化
- Ergodic HMMを用いた音声符号化に関する検討
- 聴覚特性を利用した正弦波重畳による低ビット音声符号化
- 聴覚特性を利用した正弦波重畳による低ビット音声符号化
- 聴感特性を用いた連続正弦波(CSW)モデルによる音声符号化
- 連続正弦波(CSW)モデルによる線形予測残差信号の表現に関する一検討
- WI処理による残差信号の圧縮に関する一検討
- 1.ケータイの昨今(ケータイの科学)
- Lempel-Ziv符号化を用いたLSP係数のセグメント量子化(音声,聴覚)
- Lempel-Ziv符号化を用いたLSP係数のセグメント量子化(聴覚・音声及び一般)
- KL展開を用いたオーディオ信号の次元圧縮に関する検討
- LZ符号化を利用した音声符号化
- LZ符号化を利用した音声符号化
- 自己相似性を用いたセグメント量子化による音声符号化
- LZ符号化方式を用いた音声符号化に関する検討
- LZ符号化方式を用いた音源情報符号化に関する検討
- 自己相似性を用いたLSP係数のセグメント量子化
- 正弦波重畳型ボコーダによる1.2kbit/s音声符号化方式
- リカレントニューラルネットワークを用いた補間法とその音声符号化への応用
- RNN補間器を用いたLSP係数の符号化
- リカレントニューラルネットワーク補間器を用いたLSP係数の符号化
- リカレントニューラルネットワークを用いたLSP係数の補間
- 音声合成を用いた秘話通信方式(画質・音質評価,知覚・認知メトリクス,人間視聴覚システム,一般)