A Model of Event Detection for Perceptual Extraction of the Temporal Structures of Speech (国際ワークショップ Frontiers in Speech and Hearing Research)
スポンサーリンク
概要
- 論文の詳細を見る
We introduce a new computational model, the "event-plausibility" model, as an extension of the loudness-jump model, which has been proposed with the aim of extracting temporal structures in speech based on simulated auditory processing. The main characteristic of the new model is to overcome a drawback of the loudness jump model, i.e., insensitivity to potential boundaries where the jump in loudness estimates is not sufficiently large. In the new model, the increases in auditory activation level in each tonotopic sub-band are computed using the Auditory Image Model, and they are used as an index for a potential new event. We compare the performance of the proposed model to that of the loudness-jump model by estimating speaking rates in a Japanese speech database. The results of the event-plausibility model demonstrate its advantage over the loudness-jump model.
- 社団法人電子情報通信学会の論文
- 2006-03-20
著者
-
Tanaka Satomi
Kyoto City University Of Arts
-
Tsuzaki Minoru
Kyoto City University Of Arts:atr Spoken Language Communication Research Labs
-
Tsuzaki Minoru
Kyoto City University Of Arts
-
Kato Hiroaki
ATR Human Information Science Labs
-
Sagisaka Yoshinori
Waseda University, GITI
-
Sagisaka Yoshinori
Waseda University Giti
-
Kato Hiroaki
Atr Human Information Processing Research Laboratories
関連論文
- ヘッドホン聴取時における外耳道伝達関数について
- 種々の周波数遷移特性における音の時間知覚の比較(日本基礎心理学会第28回大会,大会発表要旨)
- 等間隔性からのずれに対する聴覚感度の調査 : 周波数遷移の開始点と終了点での比較(日本基礎心理学会第27回東北大会,大会発表要旨)
- 日本人英語学習者音声の時間制御特性客観評価(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
- 母語話者と非母語話者による日本語特殊拍の知覚 : 発話速度と呈示文脈の影響
- 基本周波数パタンに見られる発話態度の分析(対話)
- 基本周波数パタンに見られる発話態度の分析(対話)
- 持続時間収縮錯覚と時間間隔による文脈の関係について(音楽認知・知覚3)
- 語彙が与える印象に基づく対話韻律生成
- 「金の言いまつがい」「銀の言いまつがい」, ほぼ日刊イトイ新聞, 東京糸井重里事務所, 2006年(私のすすめるこの二冊,コーヒーブレーク)
- 聞き間違いはなぜ起こる (特集 勘違いはなぜ起こる)
- 発話印象表現に基づく対話韻律制御の分析
- A Model of Event Detection for Perceptual Extraction of the Temporal Structures of Speech (国際ワークショップ Frontiers in Speech and Hearing Research)
- Durational shrinkage by noise replacement in quasi-isochronous and hyper-isochronous contexts
- Effects of deviation from isochronism on the durational shrinkage by noise replacement
- 18. 母語話者と非母語話者による日本語特殊拍音素の知覚(第309回研究例会発表要旨)
- A2.韓国人日本語学習者による日本語の促音の聴取訓練の効果(研究発表,音声学会2009年度(第23回)全国大会発表要旨)
- 日本語特殊拍の知覚学習システムを利用した聴取訓練の効果(第319回研究例会発表要旨)
- 促音挿入判断に着目した韓国語母語話者による日本語促音の知覚特性 : 韓国語の濃音化との関連性を中心に
- スペクトル距離相関と正中面音像定位の関係性(臨場感生成,ユニバーサルメディア,ディジタルエンタテインメント,一般)
- 3D音響技術の実用化へ向けた研究の現状 : 情報通信研究機構での取り組み(音響・超音波サブソサイエティ合同研究会)
- 3D音響技術の実用化へ向けた研究の現状 : 情報通信研究機構での取り組み(音響・超音波サブソサイエティ合同研究会)
- 促音挿入判断に着目した韓国語母語話者による日本語促音の知覚特性 : 韓国語の濃音化との関連性を中心に(聴覚一般,聴覚・音声・言語とその障害/一般)
- B1-4. タイミング制御特性に着目した非母語話者の日本語音声の評価 : 日本語の長短音素を中心に(研究発表,日本音声学会2012年度(第26回)全国大会発表要旨)
- Independence of mental representations for tonotopic and periodic scales in perceptual judgment of vowel-like sounds
- Perceptual sensitivity to temporal distortion of visual, auditory and bimodal speech