音声の群遅延特性に基づく声門閉止等のイベント抽出について
スポンサーリンク
概要
- 論文の詳細を見る
音声波形の群遅延特性を利用して、声門閉止等の音声を駆動する主要なイベント生起時刻とイベント属性を定量的に高精度に抽出する新しい方法を発明した。Gauss型時間窓の中心時刻からその窓を用いて計算される平均時刻への写像の不動点として求められるイベントの初期推定値を、振幅スペクトルから計算される最小位相応答の群遅延特性を用いて補償することにより、声門閉止等のイベントの時刻とイベントの原因となった現象の継続時間を求めることができる。提案したアルゴリズムについて、合成音声等を用いた検証を行い、次いで、EGGと音声を同時録音したデータベースを用いて実音声の分析における定量的な評価を行った。合成音声の作成には、全極モデル、STRAIGHTにより求めた最小位相インパルス応答、パルス音源、Rosenberg-Klatt波形の様々な組合せを用いた。EGG同時収録音声のデータベースは、男女各14名がそれぞれ30文を読み上げた840文から構成されている。これらの実験結果は、本方法によれば40μsから200μsの誤差の標準偏差で声門の閉止時刻が推定できることを示している。本方法は、FFTを多用するものの収束計算を含まない実時間向きのアルゴリズムとして実現されているため、声帯振動の異常の診断や高品質音声合成法の音源情報抽出等に広範に応用できるものと考えられる。
- 2000-03-10
著者
関連論文
- 基本波検出に基づく高SNRの音声を対象とした高速なF0推定法(音声,聴覚)
- ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理技術の総合開発(総合報告)
- 視聴覚統合を利用した非言語的手段による音色知覚の評価について
- 視聴覚統合における刺激音の時間-周波数的特徴と視覚刺激の形状特徴の検討 : 人間の知覚特性に基づく音楽の可視化システムに向けて(インタフェース)
- 音声分析・変換・合成方法STRAIGHTの音声符号化への適用について
- 再合成音声の品質に対する音声スペクトル包絡推定法の影響について(感情音声,韻律,声質,音声生成・知覚,脳機能,一般)
- ユーザ感情理解に向けた実環境音声情報案内システムの収集発話分析(言語解析, 対話)
- 高品質分析合成のための有声音の非周期成分の表現と推定について
- 分析時刻に依存しない周期信号のパワースペクトル推定法を用いた音声分析(ディジタル信号処理)
- TANDEM-STRAIGHTおよび時変モーフィングのための研究用インタフェースの開発について(聴覚・音声・言語とその障害,一般)
- TANDEM-STRAIGHTおよび時変モーフィングのための研究用インタフェースの開発について
- 実時間操作インタフェースへの応用を目的とした歌唱モーフィング操作パラメタの時系列への拡張について(音響信号処理)
- 基本周波数情報に基づく線形予測と時間軸伸縮を利用した非周期成分の抽出について(音声合成・声質変換,第10回音声言語シンポジウム)
- TANDEM-STRAIGHTによるスペクトル包絡の近似精度の改善について : 基本周波数により定まるNyquist周波数以上の空間周波数成分の復元について(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
- 4L-5 STRAIGHTに基づく柔軟な音声合成技術の開発(リーディングプロジェクト e-society:自然な音声対話処理技術(2),一般セッション,リーディングプロジェクト e-society)
- リアルタイムSTRAIGHTの改良とSTRAIGHTライブラリの実装(聴覚・音声・言語とその障害,一般)
- AS-5-1 時間平均に基づく周期信号のパワースペクトル推定法(AS-5. 音響信号のモデリングと表現,シンポジウムセッション)
- ポップス系歌唱音声における基本周波数軌跡の楽譜からの変位について(スペシャルセッション・歌情報処理1)
- TANDEM-STRAIGHTに基づく基本周波数の抽出と評価について(音声合成・韻律,第9回音声言語シンポジウム)
- モーフィングに基づく歌唱デザインインタフェースの提案と初期的検討(音楽情報,インタラクションの理解とデザイン)
- 11.人にやさしい音声インタフェース(第2部:情報の高信頼蓄積・検索技術等の開発,学と産の連携による基盤ソフトウェアの先進的開発)
- 母音/子音区間検出を備えた適応形ビームフォーマを用いた母音/子音平均スペクトルに基づく雑音下音声認識
- 音声のテクスチャマッピングに基づく変換関数を利用した音声モーフィングの自動化について : 音声テクスチャマッピングの一応用例
- 帯域分割型CSP法に基づく話者位置推定法の検討(ポスターセッション)(第6回音声言語シンポジウム)
- 音源構造抽出法の初期推定値のバイアス除去と高速化について
- 零周波数フィルタ信号に基づく基本周波数抽出法のTANDEM-STRAIGHTへの応用について(音響分析一般(1))
- 圧縮型ガンマチャープ聴覚フィルタによるノッチ雑音データと圧縮特性データへの同時適合
- 音声中の複数の繰返し構造の表現とその基本周波数および非周期性抽出への応用について
- 声道長の正規化に基づく簡易モーフィング音声の品質改良について(感情音声,韻律,声質,音声生成・知覚,脳機能,一般)
- TANDEM-STRAIGHTに基づく基本周波数抽出法の最適化に関する一検討(ポスターセッション,第10回音声言語シンポジウム)
- E-023 ウェブ上の言語知識を利用した音声認識用単語辞書の更新手法(自然言語・音声・音楽,一般論文)
- TANDEM-STRAIGHTに基づく基本周波数の抽出と評価について(音声合成・韻律,第9回音声言語シンポジウム)
- LG-006 音楽聴取に関する一検討 : グループと頂点の推定(G. 音声・音楽)
- EA2010-35 擬似音声信号を用いた評価による音源構造抽出法の最適化について
- EA2010-36 スペクトル距離に基づく声道長正規化のための周波数帯域の選定について
- 母音情報に基づく話者変換システムの提案 : 音声テクスチャマッピングの一実装例(聴覚・音声・言語とその障害,一般)
- 基本周波数情報に基づく線形予測と時間軸伸縮を利用した非周期成分の抽出について(音声合成・声質変換,第10回音声言語シンポジウム)
- 基本周波数情報に基づく線形予測と時間軸伸縮を利用した非周期成分の抽出について(音声合成・声質変換,第10回音声言語シンポジウム)
- ポップス系歌唱音声における基本周波数軌跡の楽譜からの変位について(スペシャルセッション・歌情報処理1)
- 単語重要度を用いたN-gram補完手法が与える音声認識性能の調査
- 歌声を見て触る: TANDEM-STRAIGHTと時変モーフィングが提供する基盤
- 歌声情報処理の最新動向
- 音声モーフィングの背景と可能性
- レクチャー講演 STRAIGHTとGUIで体験する音声知覚の物理的基盤
- 圧縮型ガンマチャープ聴覚フィルタによるノッチ雑音データと圧縮特性データへの同時適合
- 高品質分析合成のための有声音の非周期成分の表現と推定について(聴覚・音声・言語とその障害,一般)
- 表情と感情音声の知覚(感情音声・感情認知I, 感情音声)
- 感性情報に曖昧さがある場合の音声の心理的評価とその物理的特性(聴覚,音声,言語とその障害)
- 3L-5 音声入力Webシステムによる音声認識アプリケーションの構築技術(リーディングプロジェクト e-society:自然な音声対話処理技術(1),一般セッション,リーディングプロジェクト e-society)
- 音声入力・認識機能を有するWebシステムw3voiceの開発と運用
- E-072 音声入力機能を有する対話型Webアプリケーションの公開試験(E分野:自然言語・音声・音楽)
- 聴覚系における寸法・形状情報抽出の計算理論と脳内部位の検討(機械学習によるバイオデータマインニング,一般)
- E-038 大人・子ども発話の自動識別に基づく安心Webシステムの検討(自然言語・音声・音楽,一般論文)
- 窓関数による分析時刻の影響を受けにくい周期信号のパワースペクトル推定法(研究速報)
- LE-004 単母音による歌唱音声スペクトルの統計的分析に基づく音色制御法の提案と評価(自然言語・音声・音楽)
- TANDEM-STRAIGHTに基づく基本周波数抽出法の最適化に関する一検討(ポスターセッション,第10回音声言語シンポジウム)
- STRAIGHTを用いた簡易モーフィングによる印象変化の評価について(セッション2)
- STRAIGHTを用いた簡易モーフィングによる印象変化の評価について(セッション2)
- ポップス系歌唱音声のSTRAIGHTによる分析とスペクトル変動の統計的性質について(合成,生成,韻律,一般)
- TANDEM-STRAIGHTに基づく基本周波数抽出法の最適化に関する一検討(ポスターセッション,第10回音声言語シンポジウム)
- 複数旋律音楽に対する演奏表情付けモデルの構築(演奏認識/合成,便利で身近な音楽情報処理)
- 聴覚ボコーダによる混合音声からの音声分離
- STRAIGHTを用いた聴覚メリンイメージからの信号再合成
- TANDEM-STRAIGHTに基づく基本周波数の抽出と評価について(音声合成・韻律,第9回音声言語シンポジウム)
- E-041 音声モーフィングのための母音スペクトル間区分線形写像関数自動設計手法(E分野:自然言語・音声・音楽)
- 時間方向および周波数方向の周期性の影響を除去した周期信号のパワースペクトルの表現について : STRAIGHTスペクトル推定の無調整化に向けて(聴覚・音声/一般)
- STRAIGHTスペクトルに基づく音源信号の抽出と非周期成分の評価について(一般)
- 周期信号における時間的変動の影響を受けない位相関連情報の表現について(オーガナイズドセッション:「Advances in soeech decomposition」,合成,生成,韻律,音声一般)
- 聴覚における情報表現に基づく音声信号の分解 : 周期性からの逸脱をどう扱うか(オーガナイズドセッション:「Advances in soeech decomposition」,合成,生成,韻律,音声一般)
- 自然性の高い感情音声合成に向けた感情音声データベース構築の検討
- リアルタイムSTRAIGHTの実装と特徴量削減の影響に関する検討((SS)高品質音声分析変換合成法STRAIGHT, 一般, STRAIGHTスペシャルセッション(SS))
- 聴覚特性を考慮した高品質領域におけるSTRAIGHTパラメタの補間特性に関する検討((SS)高品質音声分析変換合成法STRAIGHT, 一般, STRAIGHTスペシャルセッション(SS))
- 演奏者にとっての「実感」 : 心の通い合う演奏を求めて(実感させる…人間・音楽・演奏)
- 歌唱音声制御に伴うスペクトル変動の主成分分析と合成への応用について(聴覚・音声及び一般)
- J-006 ちょっとした一言の音声認識による子ども利用者判別法の検討(J分野:ヒューマンコミュニケーション&インタラクション,一般論文)
- E-012 音声ウェブシステムを用いて収集した実環境子供発話に関する調査(E分野:自然言語・音声・音楽,一般論文)
- 5U-6 ウェブ収集発話を対象とした若年者判別の検討(音声インタフェース・システム,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 安心ウェブの実現に向けた大人・子ども発話のネット収集実験
- 周波数から瞬時周波数への写像の不動点を用いた音源情報の抽出について
- STRAIGHTの声道情報の量子化についての検討
- 4kHz帯域のSTRAIGHTの品質評価と情報圧縮について
- 音声分析・変換・合成方法STRAIGHT-TEMPOにおける相補的な時間窓の利用について
- 一般逆行列を用いた母音情報に基づく声質変換法について(合成,生成,韻律,一般)
- 音声分析合成技術の動向(音声合成に関する研究の動向)
- 対数時間軸伸縮による人間の頭部伝達関数測定の精度改善について
- 高品質音声分析変換合成システムSTRAIGHTを用いたスキャット生成研究の提案(音楽情報科学)
- 高品質音声分析変換合成システムSTRAIGHTにおける分析窓の検討(合成,生成,韻律,一般)
- STRAIGHT合成音源に対する位相拡散の最適化 : 心理評価と制御変数値推定の試み
- STRAIGHT合成音源に対する位相拡散の最適化 : 心理評価と制御変数値推定の試み
- STRAIGHTを用いたCHATRの韻律制御
- 聴覚メリンイメージからの信号再合成
- スケール変形した有声/無声単語の寸法弁別と音韻認識に関する検討(聴覚・音響信号処理/一般)
- 非線形時間軸上のフィルタリングとFO制御における知覚-生成伝達関数の推定への応用(国際ワークショップ:Speech dynamics by Ear, Eye, Mouth and Machine)
- 発話時の頭部周辺での音声の伝達特性について
- 発声時の頭部周辺での音声の振幅位相特性について
- STRAIGHTによるリアルタイム歌唱モーフィングシステムの実装(セッション5)
- STRAIGHTによるリアルタイム歌唱モーフィングシステムの実装(セッション5)
- STRAIGHTによる歌声モーフィングの初期的検討
- 騒音適応型音楽再生システムのパラメタ設定における聴覚モデルによる評価の応用について
- 調波成分の瞬時周波数を用いた基本周波数推定方法(音声情報処理 : 現状と将来技術論文特集)