Perception of size modulated vowel sequence : Can we normalize the size of continuously changing vocal tract?
スポンサーリンク
概要
- 論文の詳細を見る
Changes in vocal tract size vary the formant frequencies, even when the shape of vocal tracts is the same and the spoken vowels are categorized to be the same. Several studies have demonstrated that the normalization of vocal tract size can be achieved in a bottom-up manner. To investigate how fast this process works, the identification of vowel sequences was examined under conditions where the size was sinusoidally modulated with several frequencies (0.24-62.50Hz). The performance level changed slightly, but significantly depending on the modulation frequency, and the dependence was not monotonic. The performance dropped for modulation around 4Hz. The nonmonotonic function could not be predicted by a simple assumption of usage of a single size-estimator that requires a certain processing time. Mismatches were prominent for high frequencies: a deterioration was predicted because of the limited processing time, while the actual performance showed a recovery. This indicates that a switching of the process mode for modulation occurs at around 4Hz. Below 4Hz, the auditory system can successfully normalize the size change. Above 4Hz, the auditory system segregates the sounds using the size cue and the recognition of each vowel is not critically affected.
- 社団法人日本音響学会の論文
著者
-
入野 俊夫
Ntt基礎研
-
入野 俊夫
日本電信電話株式会社nttコミュニケーション科学基礎研究所
-
入野 俊夫
Ntt基礎研究所
-
Tsuzaki Minoru
Faculty Of Music Kyoto City University Of Arts
-
Takeshima Chihiro
Graduate School of Music, Kyoto City University of Arts
-
Irino Toshio
Faculty of Systems Engineering, Wakayama University
-
入野 俊夫
和歌山大学システム工学部
-
Tsuzaki Minoru
Faculty of Music, Kyoto City University of Arts
関連論文
- 音の持続時間が音源の大きさ知覚に及ぼす影響 : 母音刺激を用いた検討(日本基礎心理学会第28回大会,大会発表要旨)
- 視聴覚統合を利用した非言語的手段による音色知覚の評価について
- 視聴覚統合における刺激音の時間-周波数的特徴と視覚刺激の形状特徴の検討 : 人間の知覚特性に基づく音楽の可視化システムに向けて(インタフェース)
- 再合成音声の品質に対する音声スペクトル包絡推定法の影響について(感情音声,韻律,声質,音声生成・知覚,脳機能,一般)
- 分析時刻に依存しない周期信号のパワースペクトル推定法を用いた音声分析(ディジタル信号処理)
- TANDEM-STRAIGHTおよび時変モーフィングのための研究用インタフェースの開発について(聴覚・音声・言語とその障害,一般)
- 実時間操作インタフェースへの応用を目的とした歌唱モーフィング操作パラメタの時系列への拡張について(音響信号処理)
- 基本周波数情報に基づく線形予測と時間軸伸縮を利用した非周期成分の抽出について(音声合成・声質変換,第10回音声言語シンポジウム)
- TANDEM-STRAIGHTによるスペクトル包絡の近似精度の改善について : 基本周波数により定まるNyquist周波数以上の空間周波数成分の復元について(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
- 4L-5 STRAIGHTに基づく柔軟な音声合成技術の開発(リーディングプロジェクト e-society:自然な音声対話処理技術(2),一般セッション,リーディングプロジェクト e-society)
- リアルタイムSTRAIGHTの改良とSTRAIGHTライブラリの実装(聴覚・音声・言語とその障害,一般)
- AS-5-1 時間平均に基づく周期信号のパワースペクトル推定法(AS-5. 音響信号のモデリングと表現,シンポジウムセッション)
- ポップス系歌唱音声における基本周波数軌跡の楽譜からの変位について(スペシャルセッション・歌情報処理1)
- TANDEM-STRAIGHTに基づく基本周波数の抽出と評価について(音声合成・韻律,第9回音声言語シンポジウム)
- はじめての聴覚フィルタ(やさしい解説)
- 零周波数フィルタ信号に基づく基本周波数抽出法のTANDEM-STRAIGHTへの応用について(音響分析一般(1))
- 圧縮型ガンマチャープ聴覚フィルタによるノッチ雑音データと圧縮特性データへの同時適合
- 音声中の複数の繰返し構造の表現とその基本周波数および非周期性抽出への応用について
- 声道長の正規化に基づく簡易モーフィング音声の品質改良について(感情音声,韻律,声質,音声生成・知覚,脳機能,一般)
- TANDEM-STRAIGHTに基づく基本周波数抽出法の最適化に関する一検討(ポスターセッション,第10回音声言語シンポジウム)
- E-023 ウェブ上の言語知識を利用した音声認識用単語辞書の更新手法(自然言語・音声・音楽,一般論文)
- TANDEM-STRAIGHTに基づく基本周波数の抽出と評価について(音声合成・韻律,第9回音声言語シンポジウム)
- EA2010-35 擬似音声信号を用いた評価による音源構造抽出法の最適化について
- EA2010-36 スペクトル距離に基づく声道長正規化のための周波数帯域の選定について
- 基本周波数情報に基づく線形予測と時間軸伸縮を利用した非周期成分の抽出について(音声合成・声質変換,第10回音声言語シンポジウム)
- 基本周波数情報に基づく線形予測と時間軸伸縮を利用した非周期成分の抽出について(音声合成・声質変換,第10回音声言語シンポジウム)
- ポップス系歌唱音声における基本周波数軌跡の楽譜からの変位について(スペシャルセッション・歌情報処理1)
- 単語重要度を用いたN-gram補完手法が与える音声認識性能の調査
- 圧縮型ガンマチャープ聴覚フィルタによるノッチ雑音データと圧縮特性データへの同時適合
- 高品質分析合成のための有声音の非周期成分の表現と推定について(聴覚・音声・言語とその障害,一般)
- 3L-5 音声入力Webシステムによる音声認識アプリケーションの構築技術(リーディングプロジェクト e-society:自然な音声対話処理技術(1),一般セッション,リーディングプロジェクト e-society)
- 音声のピッチと寸法情報の処理を担う脳領域のfMRIによる検討
- E-038 大人・子ども発話の自動識別に基づく安心Webシステムの検討(自然言語・音声・音楽,一般論文)
- TANDEM-STRAIGHTに基づく基本周波数抽出法の最適化に関する一検討(ポスターセッション,第10回音声言語シンポジウム)
- STRAIGHTを用いた簡易モーフィングによる印象変化の評価について(セッション2)
- STRAIGHTを用いた簡易モーフィングによる印象変化の評価について(セッション2)
- TANDEM-STRAIGHTに基づく基本周波数抽出法の最適化に関する一検討(ポスターセッション,第10回音声言語シンポジウム)
- 聴覚イメージ : 複雑な音が聴覚システムでいかに表現されるか(音を絵にする:アコースティック・イメージング小特集)
- ガンマチャープ関数による聴覚フィルタの近似
- Improvement of an IIR asymmetric compensation gammachirp filter
- TANDEM-STRAIGHTに基づく基本周波数の抽出と評価について(音声合成・韻律,第9回音声言語シンポジウム)
- 周期信号における時間的変動の影響を受けない位相関連情報の表現について(オーガナイズドセッション:「Advances in soeech decomposition」,合成,生成,韻律,音声一般)
- 劣化音声の知覚特性と音声認識器の認識傾向の比較
- 劣化処理した単音節系列音の知覚に関する検討
- 自己相関関数による聴知覚の時間非対称性の説明可能性
- J-006 ちょっとした一言の音声認識による子ども利用者判別法の検討(J分野:ヒューマンコミュニケーション&インタラクション,一般論文)
- E-012 音声ウェブシステムを用いて収集した実環境子供発話に関する調査(E分野:自然言語・音声・音楽,一般論文)
- 5U-6 ウェブ収集発話を対象とした若年者判別の検討(音声インタフェース・システム,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 安心ウェブの実現に向けた大人・子ども発話のネット収集実験
- スケール変形した有声/無声単語の寸法弁別と音韻認識に関する検討
- 自然発話された単語音声を用いた音源寸法知覚における弁別閾の測定
- 聴覚メリンイメージからの信号再合成
- スケール変形した有声/無声単語の寸法弁別と音韻認識に関する検討(聴覚・音響信号処理/一般)
- ZnOを中間層に持つ3媒質構造中に伝搬する弾性境界波の検討
- 聴覚系における共鳴体の「大きさ」知覚の時間追随性 : 寸法変調音声を用いた検討(日本基礎心理学会第26回大会,大会発表要旨)
- 日英母国語話者におけるCVとVC音節の脳領域の比較
- レクチャー講演 聴覚フィルタの測定と定式化について
- 聴覚末梢系の計算理論
- C-4 零温度係数を持つSiC/SiO_2/LiTaO_3構造弾性境界波基板(表面弾性波)
- Perception of vowel sequence with varying speaker size
- Perception of size modulated vowel sequence : Can we normalize the size of continuously changing vocal tract?
- Detection of temporal modulation of "size" in vowel sequences(ACOUSTICAL LETTER)
- Comparison of highly trained and less-trained pianists concerning utilization of auditory feedback
- 私のすすめるこの1冊 : 「相対性理論」アインシュタイン著, 内山龍雄訳・解説, 岩波文庫, 1988
- 零温度係数をもつSiO2/LiTaO3構造ストンリ-波基板
- Implementation of realtime STRAIGHT speech manipulation system : Report on its first implementation(Applied Systems)
- 音声研究から音聲研究へ(ちょっとしたエッセイ,コーヒーブレーク)
- 占有度を用いた耐雑音性の高い基本周波数推定法
- 調波成分の占有度を用いた基本周波数抽出法
- 瞬時周波数を用いたF_0抽出法の複数音声による評価
- トピックス1 聴覚フィルタ/蝸牛の周波数分析機能(〈特集〉-音響学における20世紀の成果と21世紀に残された課題-)
- 音源の形状情報と寸法情報を分離する聴覚でのイメージング(音を絵にする:アコースティック・イメージング小特集)
- 最適聴覚フィルタの計算理論的位置づけ
- ガンマトーンフィルタの最適性について
- 同一圧電体を接合した境界面に伝搬するストンリ-波の理論的検討
- スペクトルピークを強調したF0適応型スペクトル包絡抽出法の最適化と評価(音声,聴覚)
- 言葉の明瞭度と楽器等の音色を保持したクロス合成法の検討
- Perceptual judgment in synchronization of two complex tones : Relation to the cochlear delays(ACOUSTICAL LETTER)
- E-3 二枚の基板を接着した境界層に沿って伝搬する弾性境界波(弾性表面波とデバイスI)
- 圧電体と等方体の境界面を伝搬するストンリ-波の理論的検討
- Stoneley Waves Propagating along an Interface between Piezoelectric Material and Glass : Surface Acoustic Waves and Devices
- C-1 圧電体とガラスとの境界面を伝搬するストンリー波(表面波伝搬とデバイスI)
- ZnOとガラスの境界面を伝搬するストンリ-波の理論的検討
- 単独母音間の話者寸法弁別に影響を与える時間的要因の検討
- Functional differences between tonotopic and periodic information in recognition of transposed melodies : How do local cues affect global features?
- 複数の周期成分を持つ音声のための周期構造抽出法と障害音声分析への応用について(音響信号処理,聴覚,一般)
- 言葉の明瞭度と楽器等の音色を保持したクロス合成法の検討(音響信号処理,聴覚,一般)
- 聴覚フィルタバンクを用いた声道長比推定(分析,認識,理解,対話,一般)
- スケール変形母音の話者寸法弁別と母音同定 : 母音持続時間の依存性 (音声)
- スケール変形母音の話者寸法弁別と母音同定 : 母音持続時間の依存性
- 非対称レベルマスカを導入したノッチ雑音マスキング法の測定点の削減
- 環境音認識を応用した情報提供機能を有するモバイルアプリケーションの検討
- スケール変形母音の話者寸法弁別と母音同定 : 母音持続時間の依存性(オーガナイズドセッション「音声知覚生成インタラクション・音声認識合成統合技術」,音声知覚生成/聴覚コミュニケーション,一般)
- RJ-005 対話型音声インタフェースのための大人・子ども判別技術の改良(HIP(2),J分野:ヒューマンコミュニケーション&インタラクション)
- 周期信号の群遅延の安定な表現について
- 歌唱音声のスペクトル形状の線形伸縮に影響する要因の検討