Vocal Fry発声区間の自動検出法(音声,聴覚)
スポンサーリンク
概要
- 論文の詳細を見る
Vocal fry(フライ)は,声帯振動の様式に起因する声質の一種であり,気分的にテンションが低くリラックスしている場合や,強い感情や態度の表現の際に喉頭を力んだ場合に生じ,バラ言語や非言語情報を伝達する役割をもっている.本論文は,音声信号からフライ区間を自動的に検出することを目的としている.フライは通常発声よりも低い基本周波数の範囲で生じやすい.ゆえに,典型的な固定フレーム長の短時間処理が問題となるが,その解決策として,本論文では声帯パルスに同期した手法を提案した.具体的には,フライの声帯パルスのインパルス的な特性とダンピング特性を考慮し,超短時間処理で求めたパワー軌道から声帯パルスの候補となるパワーピークを検出する.検出されたパワーピークにおいて,周期性とパルス間類似度を用いて,フライであるか,それともインパルス的な雑音であるかを判定する.評価実験として,パワーピーク検出・周期性・パルス間類似度に関連するしきい値パラメータを様々な条件で分析した.その結果,73%の高い検出率と4%の低い挿入誤り率により,自動的にフライ区間が検出可能であることが示された.
- 2006-12-01
著者
-
榊原 健一
北海道医療大学心理学部
-
石黒 浩
ATR知能ロボティクス研究所
-
石井 カルロス寿憲
ATR 知能ロボティクス研究所
-
榊原 健一
日本電信電話株式会社nttコミュニケーション科学基礎研究所
-
石井 カルロス寿憲
ATR知能ロボティクス研究所
-
荻田 紀博
ATR知能ロボティクス研究所
-
榊原 健一
NTTコミュニケーション科学基礎研究所
-
榊原 健一
北海道医療大学心理科学部言語聴覚療法学科
-
榊原 健一
北海道医療大学心理科学部
-
Sakakibara Ken-ichi
Acoustical Science And Technology
関連論文
- 対話ロボットの人間へのアプローチ方法 : 対話ロボットの対話開始に対する戦略
- 生体ゆらぎに学ぶ知的人工物と情報システム
- 協調的移動に基づく対話ロボットによる注意共有の実現
- 人間型ロボットの研究
- 遠隔操作型アンドロイドとの同調感により誘起される身体感覚の延長(コミュニケーション支援(1),HCGシンポジウム)
- Vocal Fry発声区間の自動検出法(音声,聴覚)
- 声帯瘢痕の内視鏡診断
- ATRのコミュニケーションロボットにおける聴覚および音声理解に関する研究課題
- ロボット漫才 : 社会的受動メディアとしての二体のロボットの利用
- 立体内視鏡とハイスピードカメラによる声門面積関数の計測 (特集 音声生理研究の方法)
- 吸気発声における喉頭音源生成(感情音声,韻律,声質,音声生成・知覚,脳機能,一般)
- 喉頭トポグラフによる声帯振動様式の分析(感情音声,韻律,声質,音声生成・知覚,脳機能,一般)
- 声帯麻痺患者の異常声帯振動データに対する非対称二質量モデルの係数推定
- 新型高速度デジタルカメラの喉頭領域への応用および検討
- 半自律型コミュニケーションロボットの開発(エージェントデザイン,人とエージェントのインタラクション論文)
- Breathy/whispery発声の音響特徴と音声コミュニケーションにおける役割(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
- CDT-1-7 ロボットのための感覚システム(CDT-1.「五感」情報処理:アプリケーションの展望,チュートリアルセッション,ソサイエティ企画)
- CDT-1-7 ロボットのための感覚システム(CDT-1.「五感」情報処理 : アプリケーションの展望,チュートリアルセッション,ソサイエティ企画)
- 二次元フーリエ変換を利用した物体の姿勢推定 (マルチメディア・仮想環境基礎)
- 二次元フーリエ変換を利用した物体の姿勢推定 (音声)
- 二次元フーリエ変換を利用した物体の姿勢推定 (パターン認識・メディア理解)
- 二次元フーリエ変換を利用した物体の姿勢推定 (コミュニケーションクオリティ)
- 声帯瘢痕の内視鏡診断
- 全身にやわらかい触覚を備えたロボットの開発 (新春R&D特集)
- EA2010-34 声門面積解析に基づく喉頭音源モデルによる病的音声合成と知覚評価
- 着衣量の非接触計測による熱的快適指標の推定
- ロボット搭載カメラの移動がテレプレゼンスに与える影響
- 行動素の混合分布に基づく行動認識と例外行動の検出
- 環境情報を理解してサービス提供を行うロボットの実現
- 全天球画像と複合センシングによる自己位置識別 (マルチメディア・仮想環境基礎)
- ハッシュ関数を用いた行動認識 (マルチメディア・仮想環境基礎)
- 事例データに基づく人物領域の抽出 (マルチメディア・仮想環境基礎)
- 全天球画像と複合センシングによる自己位置識別 (音声)
- ハッシュ関数を用いた行動認識 (音声)
- 事例データに基づく人物領域の抽出 (音声)
- 全天球画像と複合センシングによる自己位置識別 (パターン認識・メディア理解)
- ハッシュ関数を用いた行動認識 (パターン認識・メディア理解)
- 事例データに基づく人物領域の抽出 (パターン認識・メディア理解)
- 全天球画像と複合センシングによる自己位置識別 (コミュニケーションクオリティ)
- ハッシュ関数を用いた行動認識 (コミュニケーションクオリティ)
- 事例データに基づく人物領域の抽出 (コミュニケーションクオリティ)
- 人々の興味を引きつける案内ロボット-後ろ向きに移動する案内の効果
- トゥバ喉歌の音源推定
- 喉歌喉頭音源モデルによる合成音の評価
- 高周波数マーカとカーネル回帰による物体の姿勢推定
- ヒューマノイドロボットの Subtle Expressions による感情モーション修飾手法
- 能動絞りカメラ
- 生体ゆらぎを模倣したロボット制御
- 夢はバラ色 認知能理解に基づく未来工学創成
- 二次元フーリエ変換を利用した物体の姿勢推定
- コミュニケーション支援ロボットビジネス
- 環境設置型センサとウェアラブルセンサを統合した個人同定(テーマセッション,クロスモーダル)
- 環境設置型センサとウェアラブルセンサを統合した個人同定(テーマセッション,クロスモーダル)
- 環境設置型センサとウェアラブルセンサを統合した個人同定(テーマセッション,クロスモーダル)
- 環境設置型センサとウェアラブルセンサを統合した個人同定(テーマセッション,クロスモーダル)
- 対話型ロボットによる小学校での長期相互作用の試み
- 人間と相互作用する自律型ロボットRobovieの評価
- ロボットからの発話 : 自発的発話生成のための注意の表出機構の実現(21世紀のグループウェア)
- 声門面積解析に基づく喉頭音源モデルによる病的音声合成と知覚評価
- 仮声帯振動を考慮した喉歌の喉頭音源モデル
- 声帯-仮声帯振動の喉頭音源モデルによる喉歌合成
- 声帯-仮声帯振動の喉頭音源モデルによる喉歌合成
- トゥバ,モンゴルの喉歌における声帯振動の観測
- 前言語期の音声発達
- 全天球画像と複合センシングによる自己位置識別
- 人ロボット相互作用における人型ロボットの外見の影響
- 実データの分類による人とロボットの触覚インタラクションの典型パターン抽出(ヒューマンモデル,人とエージェントのインタラクション論文)
- ハッシュ関数を用いた行動認識
- アンドロイドによるトータルチューリングテストの可能性(チューリングテストを再び考える)
- コミュニケーションロボットのための対人距離に基づく集団状態推定手法の提案
- ネットワークロボットのフィールド実験
- 座談会:チューリングテストを再び考える(チューリングテストを再び考える)
- 着衣量の非接触計測による熱的快適指標の推定 (マルチメディア・仮想環境基礎)
- 着衣量の非接触計測による熱的快適指標の推定 (パターン認識・メディア理解)
- ATRメディア情報科学研究所・知能ロボティクス研究所の代表的研究(けいはんな学研セッション,特別企画講演)
- ATRメディア情報科学研究所・知能ロボティクス研究所における研究プロジェクト(けいはんな学研セッション,特別企画講演)
- J-034 情報提示方法の違いがもたらすロボットサイネージの広告効果(J分野:ヒューマンコミュニケーション&インタラクション,一般論文)
- RJ-008 ヘルスケアロボットへのパーソナリティ付与による説得効果(J分野:ヒューマンコミュニケーション&インタラクション,査読付き論文)
- RJ-007 ロボットサイネージにおいて見かけと大きさの違いがもたらす広告効果の変化検証(J分野:ヒューマンコミュニケーション&インタラクション,査読付き論文)
- 相互排他性原理に基づくマルチモーダル共同注意
- 全身分布触覚における触覚特徴の局所性に注目した人間-ロボット間インタラクションの識別
- 対話ロボットの反応時間と反応遅延時における間投詞の効果
- コミュニケーションロボットのための指さしと指示語を用いた3段階注意誘導モデル
- 事例データに基づく人物領域の抽出
- コミュニケーションに資する音色の合成技術 (特集 人間情報科学が切り拓くコミュニケーションの未来)
- Windows上の音合成システム「おっきんしゃい」の構築
- Windows上の音楽制作用音合成システム「おっきんしゃい」 (特集論文2 コンピュータ音楽)
- 自然発話に現れるりきみ発声の音響特徴およびEGGの分析(感情音声,韻律,声質,音声生成・知覚,脳機能,一般)
- りきみの自動検出のための音響分析(音声・聴覚,一般)
- 韻律および声質を表現した音響特徴と対話音声におけるパラ言語情報の知覚との関連(音声言語,情報処理技術のフロンティア)
- 相手の視線に応じるロボットの視線の評価(誘うインタフェース(2), 誘うインタフェース(Inviting Interface), および一般)
- 対話型ロボットのための友達関係推定モデル
- ヒューマノイドロボットのための指さしジェスチャと発話を用いた階層的注意誘導モデルの提案(ロボットとコミュニケーション及び一般)
- 前言語期の音声発達
- 歌唱時の物真似による音響特徴の変化
- 東大音声研年報サイト : 先駆的音声研究の30年の足跡(私のすすめるこのサイト)
- 喉歌(ホーメイ、ホーミー)の歌声の秘密を探る (特集論文2 コンピュータ音楽)
- 立体内視鏡とハイスピードカメラによる声門面積関数の計測(音声生理研究の方法)
- 歌声に於ける声質の生成機構(音声学と音声工学)
- 4019 室内音場特性が演奏音の音色に与える影響に関する研究 : クラリネット単音の明るさ知覚の主観評価および音響パラメータとの相関関係の考察(環境)