音声操作ロボットの動作とユーザ発話の音響的特徴との関係の分析(ロボット対話,認識,理解,対話,一般)
スポンサーリンク
概要
- 論文の詳細を見る
音声操作インタフェースが移動機構を持つロボットなどに搭載されると,ユーザが音声によってロボットをリアルタイムで動作させるという状況が考えられる.しかしこのような場合,ユーザの言い間違えやシステムの誤認識などによってロボットがユーザの意図しない動作をする可能性がある.我々は,そのような動作を迅速に修正するために,ユーザの意図しないロボット動作が発生した際のユーザ発話の音響的特徴に着目し,これらをロボットの制御に応用することを提案する.そこで,被験者実験によって実際にロボットを操作している音声を収集し,ロボットがユーザの意図通りに動作している時とそうでない時で発話速度,基本周波数(F0),インテンシティ,発話間隔にどのような変化が出るのか比較を行った.その結果,ロボットがユーザの意図しない動作をした際,ユーザ発話は発話速度が速く,発話間隔が短くなるという傾向が見られたが,F0 とインテンシティに関しては大きな変化が見られないことが明らかとなった.
- 一般社団法人電子情報通信学会の論文
- 2013-07-18
著者
関連論文
- 時間冗長性圧縮によるボコーダ型音声符号化の低ビットレート化(音声,聴覚)
- DS-3-8 ADPCMを利用した情報ハイディングのビットレート制御(DS-3.マルチメディア情報ハイディング,シンポジウムセッション)
- LogPCM及びADPCMへのMultiple Descriptionスカラ量子化の適用(研究速報,留学生による日本語技術論文)
- MP3パケットロス隠蔽における音質の客観評価に関する検討(音響信号処理,一般)
- PLSA言語モデル適応におけるアニーリングスケジュールの評価(言語モデル・システム,第10回音声言語シンポジウム)
- 局所変化率変換と時間軸変換に基づく有声音声の正弦波モデル(音声,聴覚)
- ADPCM出力とサンプルの絶対値を考慮したG.711への固定ビットレート情報ハイディング
- 音声認識における言語モデル(自動音声認識研究の動向と展望)
- 正弦波モデルに基づく高品質音声変調の検討(聴覚・音響信号処理/一般)
- 時間冗長性圧縮によるボコーダ型音声符号化の低ビット化(言語獲得・学習,合成,生成,韻律,一般)
- 質問応答データベースの自動作成に基づく音声対話システムの評価(ポスターセッション,第10回音声言語シンポジウム)
- 生成したテキストのNgramを用いた英語学習者による文法誤りを含んだ発話の音声認識の高精度化(一般(ポスターセッション),第9回音声言語シンポジウム)
- I-009 全方位ステレオによる環境マップ生成に関する検討(I.画像認識・メディア理解)
- 日本人英語発話からの文法誤り検出
- Quinphone HM-Netを用いた単語グラフ統合に基づく講演音声認識(音声・言語・音響教育,一般)
- 確率的言語モデルに基づく音声ドキュメント検索のためのWebを利用したモデル拡張の検討 (音声)
- 確率的言語モデルに基づく音声ドキュメント検索のためのWebを利用したモデル拡張の検討 (言語理解とコミュニケーション)
- 多段GMMおよびセグメントモデルを用いた異常音検出の検討(音響信号処理,一般)
- 5R-4 ハミング楽曲検索のための音響信号からのデータベース生成の検討(音楽検索・解析,学生セッション,人工知能と認知科学)
- 1W-1 ビットストリームパターン再構成によるFlash Videoの適応的Multiple Description符号化(映像処理システム,学生セッション,ネットワーク)
- ビットストリームパターン再構成によるFlash Videoの適応的Multiple Description符号化(画像符号化,通信・ストリーム技術,一般)
- ビットストリームパターン再構成によるFlash Videoの適応的Multiple Description符号化(画像符号化,通信・ストリーム技術,及び一般)
- ビットストリームパターン再構成によるFlash Videoの適応的Multiple Description符号化(画像符号化,通信・ストリーム技術,及び一般)
- ビットストリームパターン再構成によるFlash Videoの適応的Multiple Description符号化(画像符号化,通信・ストリーム技術,及び一般)
- 質問応答データベースの自動作成に基づく音声対話システムの評価(ポスターセッション,第10回音声言語シンポジウム)
- 確率的言語モデルに基づく音声ドキュメント検索のためのWebを利用したモデル拡張の検討
- 歌唱の「熱唱度」評価の検討
- PLSA言語モデル適応におけるアニーリングスケジュールの評価(言語モデル・システム,第10回音声言語シンポジウム)
- PLSA言語モデル適応におけるアニーリングスケジュールの評価(言語モデル・システム,第10回音声言語シンポジウム)
- 教師なし言語モデル適応のためのWeb Documentを用いた単語のトピック表現
- マルチタスク型音声対話システムの対話制御のための発話識別(言語モデル,第11回音声言語シンポジウム)
- マルチタスク型音声対話システムの対話制御のための発話識別
- Aspectモデルを用いた話者と環境適応音声認識システムの検討(一般(ポスターセッション),第9回音声言語シンポジウム)
- Aspectモデルを用いた話者と環境適応音声認識システムの検討(一般(ポスターセッション),第9回音声言語シンポジウム)
- Aspectモデルを用いた話者と環境適応音声認識システムの検討(一般(ポスターセッション),第9回音声言語シンポジウム)
- 複数F0候補を用いた音楽音響信号からのハミング楽曲検索
- 複数の音声対話システム併用のための発話識別
- 複数 F0 候補データベースによる歌声楽曲検索の検討
- 人間共存型ロボットのためのロボットアバタを用いた親しみ感の向上 (特集 感性ロボティクス)
- K_088 ロボットアバタを用いたユーザ親和性向上手法の高齢者による評価(K分野:ヒューマンコミュニケーション&インタラクション)
- 3116 人間の手助けとなる機能を有するロボット IRIS の開発
- 監視マイクロホンのための多段GMMを用いた異常音検出手法(テーマセッション,福祉と見守りのための画像・音声処理)
- 監視マイクロホンのための多段GMMを用いた異常音検出手法(テーマセッション,福祉と見守りのための画像・音声処理)
- 監視マイクロホンのための多段GMMを用いた異常音検出手法(テーマセッション,福祉と見守りのための画像・音声処理)
- WWWを利用したトピック関連語推定に基づく言語モデル教師なし適応の性能評価(一般(ポスターセッション),第11回音声言語シンポジウム)
- WWWを利用したトピック関連語推定に基づく言語モデル教師なし適応の性能評価
- WWW を利用した言語モデル適応のための検索クエリ構成の検討
- WWW を利用した言語モデル適応のための検索クエリ構成の検討
- 質問応答データベースの自動作成に基づく音声対話システムの評価(ポスターセッション,第10回音声言語シンポジウム)
- 生活支援ロボットの実用化を目指して(ワークショップ(ポジションペーパー発表),「コミュニケーション研究の今,その先」及び一般)
- 複数の音高候補値を用いた楽曲検索システムの構築
- 合成音声と評価スコア統合に基づく英語のイントネーション評価(認識,理解,対話,一般)
- 音声対話システムにおけるタスク外発話処理の高度化に関する研究(システム,第9回音声言語シンポジウム)
- パス数削減や平滑化法を用いたSSS-freeによる音素認識の高精度化(一般(ポスターセッション),第9回音声言語シンポジウム)
- 自律移動ロボットのためのフレームベース音声対話システム(特別セッション「言語理解と行動」(3))
- 自律移動ロボットのためのフレームベース音声対話システム(特別セッション : 言語理解と行動(3))
- 複数の雑音重畳モデルの合成による複数雑音環境に頑健な音響モデルの検討(認識・理解・対話)
- 複数の雑音重畳モデルの合成による複数雑音環境に頑健な音響モデルの検討(認識・理解・対話)
- 対話型CALLシステムに関する検討
- 様々な雑音環境での音声対話における文法と認識精度の関係の分析(ポスターセッション)(第5回音声言語シンポジウム)
- バイリンガル話者音声に基づく二言語混合音響モデルの話者適応法の検討(ポスターセッション)(第5回音声言語シンポジウム)
- 様々な雑音環境での音声対話における文法と認識精度の関係の分析(第5回音声言語シンポジウム : ポスターセッション)
- バイリンガル話者音声に基づく二言語混合音響モデルの話者適応法の検討(第5回音声言語シンポジウム : ポスターセッション)
- ジェスチャ認識システムに向けた顔検出法の検討(顔とジェスチャの認識)
- HSn-gramの学習法の検討
- 決定木を用いた単語クラスタリングによる英語韻律自動評価の高精度化(教育システムにおけるプラットホームとコンテンツ開発論文)
- I-021 動き情報を用いたビットストリームパターン推定によるFlash VideoのMultiple Description符号化(グラフィクス・画像,一般論文)
- 3Y-3 Multiple Description符号化を用いたFlash Videoストリーミングのパケットロス補償に関する検討(画像符号化とその応用システム,学生セッション,ネットワーク)
- 小型ロボットによる音声認識のための内部雑音抑圧法
- 複数の音程特徴量によるハミング入力楽曲検索システムの高精度化(スペシャルセッション・歌情報処理1)
- 複数の音程特徴量によるハミング入力楽曲検索システムの高精度化(スペシャルセッション・歌情報処理1)
- 音声対話システムにおけるタスク外発話処理の高度化に関する研究(システム,第9回音声言語シンポジウム)
- パス数削減や平滑化法を用いたSSS-freeによる音素認識の高精度化(一般(ポスターセッション),第9回音声言語シンポジウム)
- 生成したテキストのNgramを用いた英語学習者による文法誤りを含んだ発話の音声認識の高精度化(一般(ポスターセッション),第9回音声言語シンポジウム)
- SN比に頑健なマルチミクスチャーHMMの性能評価(耐雑音, 音源分離, ロボット)
- Lempel-Ziv符号化を用いたLSP係数のセグメント量子化(音声,聴覚)
- LZ符号化を利用した音声符号化
- LZ符号化を利用した音声符号化
- パス数削減や平滑化法を用いたSSS-freeによる音素認識の高精度化(一般(ポスターセッション),第9回音声言語シンポジウム)
- 複数の音声対話システム併用のための発話識別
- 複数マイクロホンを用いた簡易な呼びかけ音方向同定システム
- バイリンガル話者音声に基づく二言語混合音響モデルの話者適応法の検討(第5回音声言語シンポジウム : ポスターセッション)
- バイリンガル話者音声に基づく二言語混合音響モデルの話者適応法の検討
- 音声処理と顔画像処理を統合した対話映像からの笑いの認識(マルチモーダル, コーパス・言語モデル)
- 音声処理と顔画像処理を統合した対話映像からの笑いの認識(マルチモーダル, コーパス・言語モデル)
- かな・漢字文字列を単位とした言語モデルの検討
- かな・漢字文字列を単位とした言語モデルの検討
- RE-005 局所変化率変換に基づく有声音声の正弦波モデル(自然言語・音声・音楽,査読付き論文)
- 発話速度と言語的特徴による変動を考慮した音素持続時間モデルを用いた音声認識(音声言語)
- 複数の音声対話システム併用のための発話識別
- かな・漢字文字列を単位とした言語モデルの検討
- カラーグローブを用いた指文字認識における特徴量の統合法(テーマセッション, 顔・ジェスチャーの認識・理解)
- 雑音環境下における呼びかけ音声の検出と到来方向の同定(認識,理解,対話,一般)
- 生成したテキストのNgramを用いた英語学習者による文法誤りを含んだ発話の音声認識の高精度化(一般(ポスターセッション),第9回音声言語シンポジウム)
- I-41 2次元ワープ法を用いた動画像中の動きベクトルの抽出(ステレオ・オプティカルフロー,I.画像認識・メディア理解)
- 統計的言語モデルを用いた作詞補助システム
- 東日本大震災 危機発生時の対応について考える:12.東日本大震災時の東北大学工学研究科の対応
- 音素分割選択マルチパスモデルによる自然発話音声の認識(認識・理解・対話)
- 音声対話システムのための非言語情報を用いた発話前状態の推定 (音声)
- 様々な雑音環境での音声対話における文法と認識精度の関係の分析(第5回音声言語シンポジウム : ポスターセッション)