日本語単語アクセントの基本周波数パタンとその生成機構のモデル
スポンサーリンク
概要
- 論文の詳細を見る
Prosodic features in speech can be interpreted as responses of the underlying mechanisms to a set of linguistic commands. This paper presents a quantitative model for the mechanisms of generating fundamental frequency contours of word accent of standard Japanese. All the types of word accent of standard Japanese are characterized by the existence of a transition in the subjective pitch, either upward or downward, at the end of the initial mora, and by the fact that no more than one downward transition is allowed within a word. Table 1 lists are patterns of subjective pitch of all the possible accent types of words that consist of up to 5 morae. These binary patterns, however, never manifest as such in the fundamental frequency contours. Analysis of utterances of a number of speakers (Fig. 1) indicates that the logarithmic fundamental frequency contours of the same word accent, when normalized both in time and in frequency, are essentially similar(Fig. 2 and Fig. 3). These observations lead to the model of Fig. 4 based of the following assumptions:(1) Each type of word accent can be characterized by a unique logarithmic contour. (2) Commands for voicing and accent take the form of binary input to the system. (3) Separate mechanisms exist for voicing and accent, which can be approximated by linear system that convert the binary commands into the respective control signals(Fig. 5). (4) These control signals are combined and applied to the mechanism of glottal oscillation, whose fundamental frequency is an exponential function of the control signal. (5) The glottal mechanism shows hysteresis specified by the onset and cessation of the oscillation(Fig. 6). In order to investigate the validity of the model, fundamental frequency contours of various utterances of isolated words were extracted by a Computer program(Fig. 7) and were analyzed by the method of Analysis-by-Synthesis(Fig. ). A few examples of the comparison of the extracted fundamental frequency contour and its closest approximation obtained by the A-b-S procedure are shown in Fig. 9
- 社団法人日本音響学会の論文
- 1971-09-10
著者
関連論文
- 音声情報処理の将来を考える
- 国際シンポジウム"音楽と情報科学"
- 近畿方言2拍単語アクセント型の分析及び知覚
- 87 獲得した知識の体系度を指標とする帰納的推論能力の育成
- 単語音声中の半母音の認識
- 調音結合過程の機能的モデルを用いた連続母音の認識
- 未知語を含む文の形態素解析システム
- ホルマント周波数上での調音結合の定式化と音声自動認識への適用
- 305 言語能力と図形検査を中心とした非言語能力の発達過程の関連性(発達12 空間認知,研究発表)
- 209 語彙及び単音からみる言語能力の発達過程(発達2,研究発表)
- 316 談話構造の分析に基づく言語発達過程の検討(幼児の言語発達,発達)
- 231 幼児に於ける語連鎖の発達(発達5,発達)
- 230 幼児に於ける音素及び語の獲得過程(発達5,発達)
- 日本語文章音声の合成のための韻律規則
- 日本語単語アクセントの基本周波数パタンとその生成機構のモデル
- 日本語連続音声のピッチパタンの合成のためのモデル
- テーマ・キー概念・キーワード間の階層構造を利用する新聞記事情報の分類・検索システム
- 新聞記事を対象とする用字調査
- 高機能な検索のできる大規模日本語データベースの構成
- 音声研究の現状と将来を語る
- SEARMA法による音声分析における観測区間の適応的制御
- 極・零モデルに基づく無声破裂音の分析と特徴抽出
- IEEE ASSP SocietyのTokyo Chapterの設立と、1984年IEEE音響・音声・信号処理国際会議(ICASSP 84)報告
- 定常母音の分析・正規化および認識
- 調音機構のモデル化に関するシンポジウム
- 意味空間での操作に基づく自立語の意味の獲得
- 声道伝達関数の極に基づく面積関数の推定
- 時領域における音声のピッチ抽出の一方式
- 日本語無声摩擦音の分析と認識
- 音声通信系における信号の最適線形処理
- 第103回アメリカ音響学会会議報告
- 1982年 IEEE 音響・音声・信号処理国際会議 : ICASSP 82
- 合成音声の弁別と言語音知覚機構のモデル
- Auditory Perception of Temporal Duration and Visual Perception of Stroke Length in Aphasic Patients