ニューラルネットによる日本語音声のモーラ数自動抽出
スポンサーリンク
概要
- 論文の詳細を見る
音声の中に含まれる感情や意図といった情報をとらえるため、最近韻律的特徴を分析・抽出する研究がいくつか行われている。本研究では、韻律的特徴の中でも、発話速度に注目し、日本語音声からモーラ数を抽出するニューラルネットモデルを作成し、その評価を行った。発話速度検出のための情報として、ONニューロンモデルの出力波形を利用し、この波形を入力とする3層ニューラルネットによって、日本語音声の知覚単位と考えられているモーラを、誤差逆伝播学習によってどれだけ抽出できるかを調べた。学習及び評価用データとして、ONニューロンモデルの波形の特徴として現れにくい特殊モーラ /N/、/R/、/Q/ を含む、さまざまな発声スピードの単語音声を用いた。その結果、評価用単語音声のモーラ検出率は84.6%であった。さらに、朗読文を用いて、モーラ数を抽出する実験を行い、モーラ抽出率90.2%という結果を得た。
- 社団法人電子情報通信学会の論文
- 1996-03-08
著者
関連論文
- 幼児期のアクセント生成と知覚の相互影響
- 「日本語音声」データベースの構築 : 中間報告(国語学会2003年度秋季大会研究発表会発表要旨)
- 視聴覚情報の統合的知覚 : 音源定位課題による検討
- 2音呈条件における音源定位の偏向現象の規定因 : 周波数帯域の重なり及びレベル差の影響
- 2音の周波数帯域の重なり及びレベル差が音源定位に与える影響
- 2音の開始時間のずれが音源定位に与える影響
- 複数音源の同時呈示が音源定位に与える影響
- ペーシングボードが会話の継続性の向上と1発話の長さの延長に有効であった Dysarthria の1例 : 会話分析的手法による効果の検討
- 非分節音による反響的な模倣とその社会的効果 : 発話速度の変化に関する検討
- 音韻性錯誤の誤りパターンの経時的変化について : 1伝導失語例による検討
- 音韻性錯語に対する時間的要因の影響について
- 失語症者における音韻性錯語の生成モデルについての検討
- 失語症患者における音韻変化 -音節連鎖頻度との関連について-
- 文の音読において助詞の探索が見られた小児失語の1症例
- 表情、及び性別における曖昧性認知に関わる脳内部位の同定 : Event related fMRIを用いた検討
- 「ピカチュウ」にこめられた感性情報 (Feature Article: Emotion in Speech)
- 女性と判定された性同一性障害者(MtF)の声の基本周波数(聴覚,音声,言語とその障害)
- 女声と聴取された性同一性障害者(MtF)の音声の音響分析
- 日英語の「平静」「感情」発話における話者の母語弁別能力
- 音声による感情表現の発達的検討
- 感情判断と言語判断 母語は外国語より感情認知しやすいか
- 日本認知科学会博士論文コンソーシアム報告
- 協創的な認知科学研究の未来をめざして
- アクセントの獲得過程の言語間比較(言語の学習・教育と言語処理)
- 表情と感情音声の知覚(感情音声・感情認知I, 感情音声)
- 指向性マイクロホンを用いた波面合成法における波面合成精度
- DVD版「日本語音声データベース」の完成 (特集 音声データの保存・公開)
- 音場再現におけるマルチチャネル信号の空間符号化
- 声・顔・ことば : 感情の表出と知覚(「感性情報処理の基礎と応用」並びにヒューマン情報処理一般)(感性情報処理(2))
- 聴覚フィードバックに利用される音声情報の物理的特徴(聴覚,音声,言語とその障害)
- 感性情報に曖昧さがある場合の音声の心理的評価とその物理的特性(聴覚,音声,言語とその障害)
- 移動音源に対するマルチチャンネル音場空間符号化の検討
- 鹿児島方言幼児の単語アクセントの発話生成および知覚に関する検討
- 音声相関信号の聴覚フィードバックが発話に与える影響
- 非分節音を用いた人間 : コンピュータ間の相互作用における発話速度の変化とその効果
- 日本語文の読解過程における語特性および語順の影響
- 逆フィルタを用いた空間音響圧縮技術の拡がり感
- 空間情報を利用したマルチチャンネル音響信号の符号化と音源定位
- 音韻性錯語の発生要因について : 音節連鎖頻度による1失語例の検討
- 鹿児島方言幼児の単語アクセント獲得に関する予備的検討
- 波面合成法を用いた立体音場再生における合成音像定位モデル(スペシャルセッション : 究極の超臨場感 (2))
- 健常者とdysarthria例におけるテンポの知覚・記憶機能の検討--発話とタッピング課題から
- 日本語母語話者による英語音声探索
- 刺激の左右呈示における閉鎖子音の知覚
- 名が体を表すには(音叉)
- 座長記
- 言語の複雑さが複合名詞アクセント規制の獲得過程に及ぼす影響
- ニューラルネットによる日本語音声のモーラ数自動抽出
- ニューラルネットによる日本語音声のモーラ数自動抽出
- 微笑は概略的に認知されるのか? : 真の微笑と偽りの微笑の比較
- 部分・全体情報が偽りの微笑の認知に及ぼす影響
- 幼児・児童の感情表現における音響的分析
- 幼児・児童の感情表現における音響的分析 :「ぴかちゅう」にこめられた感性情報
- 幼児・児童の感情表現における発達的研究:聴取実験結果の分析 : 「ぴかちゅう」にこめられた感性情報
- 遅延聴覚フィードバック(DAF)条件下での読みの眼球運動への影響
- 招待講演 音声知覚の研究
- 言語音声の認知単位 (特集 ことばの単位--言語の分析的探究のための手立て)
- 音声の分節単位と音韻知覚
- 文中における連続同一母音の継続時間長とモーら数の関係およびその知覚
- 節境界決定に曖昧性のある文の朗読過程
- ピッチ情報のモーラ数知覚に及ぼす影響
- 語中音挿入知覚現象の検討
- 聴覚へのエコロジカル・アプローチ
- 音源の運動知覚における別音源の運動の影響
- 脳損傷者における間接的表現の理解
- 脳損傷患者における話し手の感情理解
- 遅延聴覚フィードバック下での発話行動の継時的変化
- 2つの仮現運動音の動き知覚
- 機械と人間の音声コミュニケーション
- 移動感を伴う音源の定位
- 人間と機械の音声認識 : 音声聴覚研究の学際性
- 1994年音声言語処理国際会議
- 波面合成におけるチャネル数の主観的影響 : 音源が正面付近にある場合
- 移動音源がある音場の空間符号化 : 音源抽出による伝送量の削減
- Dysarthria 例の発話特性における遅延聴覚フィードバック(DAF)の効果 : 運動低下性タイプ以外の例に対する検討
- 取り扱い説明書なしでの機器操作はどこまで可能か? : ラベル作成機によるケーススタディ
- 音場再現におけるマルチチャネル信号の空間符号化
- 「ピカチュウ」にこめられた感性情報(音声と感情)
- 音声の感性情報処理と意味の理解
- 波面合成法による立体音場再生におけるマイクロホン及びスピーカの指向特性による波面の合成精度への影響
- A8. 鹿児島方言幼児における単純語のアクセントの獲得(第16回全国大会発表要旨)
- DVD版「日本語音声データベース」の完成(音声データの保存・公開)
- 音声知覚と認知科学(認知科学と音声研究)
- 衝撃音の認知特性
- 2つの音の onset 時間と動き知覚の関係 - 仮現運動を用いて -
- 音の動きと音源の分離・融合
- 音源定位における視覚情報の影響 : FLMPによる視覚情報の影響の定量化
- 視覚情報がある場合の音源定位
- 対照研究を利用したモーラ数知覚の検討(音声の対照研究)
- 誌上討論 「ペダゴジカル・マシンの射程 : 相互随伴性のメカニズム」(開一夫氏)を読んで (小特集 ヒューマン・ロボット・ラーニング)
- 信号特性と音源定位
- 会長就任にあたって
- 15回目の認知科学会大会
- Dysarthria 例の発話速度調節訓練に影響を与える要因の一考察(第1報)
- 「ペダゴジカル・マシンの射程 : 相互随伴性のメカニズム」(開 一夫氏)を読んで
- 周波数帯域幅の異なる2音源が相互の移動感に及ぼす影響
- ニューラル・ネットワークによる概念学習のモデル化