ユビキタスホームにおける対話ロボットのための音声・雑音認識の開発(テーマセッション(2), ロボットとの相互作用のための言語処理・パターン認識・メディア理解)
スポンサーリンク
概要
- 論文の詳細を見る
フィノは, センサや家電が協調動作してコンテクストアウェア型サービスを提供するユビキタスホームにおいて, 住人との身体性を持った話し相手となり, システムへの親しみやすさと理解を与えるために開発された対話ロボットである.本稿では, その音声対話インタフェースに関して, 音声対話戦略と大語彙音声認識, 雑音認識を中心に報告する.また, 混合正規分布モデル(GMM)を用いた雑音認識実験では, 94.4%の識別正解率を得ることができた.
- 社団法人電子情報通信学会の論文
- 2005-09-14
著者
-
小林 亮博
情報通信研究機構知識創成コミュニケーション研究センター
-
西村 竜一
和歌山大学システム工学部デザイン情報学科
-
近間 正樹
情報通信研究機構
-
西村 竜一
和歌山大学
-
上田 博唯
独立行政法人情報通信研究機構
-
小林 亮博
独立行政法人情報通信研究機構
-
佐竹 純二
独立行政法人情報通信研究機構
-
近間 正樹
独立行政法人情報通信研究機構
-
上田 博唯
独立行政法人 通信総合研究所 けいはんな情報通信融合研究センター
-
佐竹 純二
情報通信研究機構
関連論文
- ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理技術の総合開発(総合報告)
- 視聴覚統合を利用した非言語的手段による音色知覚の評価について
- 2.献立を決める(生活に役立つメディア処理-料理行動を科学する-)
- 献立を決める
- スペクトル距離に基づく声道長正規化のための周波数帯域の選定について (応用音響)
- A-15-12 顔向き・頭部動作推定を用いたプロアクティブ情報提示システムの提案(A-15.ヒューマン情報処理,一般セッション)
- 生活を支援するロボットとユーザとの会話場面で形成される印象の検討
- 視聴覚統合における刺激音の時間-周波数的特徴と視覚刺激の形状特徴の検討 : 人間の知覚特性に基づく音楽の可視化システムに向けて(インタフェース)
- 驚きを与え,笑顔を得たい(ちょっとしたエッセイ,コーヒーブレーク)
- 医療分野を対象とした多言語発話収集WebシステムOTOCKERの開発(情報社会のデザイン:Inter Societyと実世界アプリケーション)
- 再合成音声の品質に対する音声スペクトル包絡推定法の影響について(感情音声,韻律,声質,音声生成・知覚,脳機能,一般)
- ユーザ感情理解に向けた実環境音声情報案内システムの収集発話分析(言語解析, 対話)
- TANDEM-STRAIGHTおよび時変モーフィングのための研究用インタフェースの開発について(聴覚・音声・言語とその障害,一般)
- 実時間操作インタフェースへの応用を目的とした歌唱モーフィング操作パラメタの時系列への拡張について(音響信号処理)
- 基本周波数情報に基づく線形予測と時間軸伸縮を利用した非周期成分の抽出について(音声合成・声質変換,第10回音声言語シンポジウム)
- TANDEM-STRAIGHTによるスペクトル包絡の近似精度の改善について : 基本周波数により定まるNyquist周波数以上の空間周波数成分の復元について(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
- 4L-5 STRAIGHTに基づく柔軟な音声合成技術の開発(リーディングプロジェクト e-society:自然な音声対話処理技術(2),一般セッション,リーディングプロジェクト e-society)
- リアルタイムSTRAIGHTの改良とSTRAIGHTライブラリの実装(聴覚・音声・言語とその障害,一般)
- ポップス系歌唱音声における基本周波数軌跡の楽譜からの変位について(スペシャルセッション・歌情報処理1)
- TANDEM-STRAIGHTに基づく基本周波数の抽出と評価について(音声合成・韻律,第9回音声言語シンポジウム)
- 音声のテクスチャマッピングに基づく変換関数を利用した音声モーフィングの自動化について : 音声テクスチャマッピングの一応用例
- アプリケーション開発における音声認識(パネル討論)
- 家庭内ユビキタス環境における対話ロボットの実稼動実験と対話戦略の評価(ユーザインタフェースとインタラクティブシステム)
- ユビキタス環境における対話型ロボットインタフェースのための対話戦略の構築(ユーザインタフェースとインタラクティブシステム, ユビキタス社会におけるコラボレーションサービス)
- ユビキタスホームにおけるサービス誘導ための対話戦略の構築(仮想都市, 複合現実感, および一般)
- ユビキタスホームにおける対話インタフェースロボットの試作(社会・都市システム)
- K-045 対話型ロボットにおける連想しりとり型対話戦略実現メカニズム(K.ヒューマンコミュニケーション&インタラクション)
- アンコンシャス型ロボットとビジブル型ロボットの協調メカニズム : 母親・子供メタファ
- アンコンシャス型ロボットとビジブル型ロボットの協調メカニズム : 母親・子供メタファ(人工現実感)
- 零周波数フィルタ信号に基づく基本周波数抽出法のTANDEM-STRAIGHTへの応用について(音響分析一般(1))
- 音声中の複数の繰返し構造の表現とその基本周波数および非周期性抽出への応用について
- 声道長の正規化に基づく簡易モーフィング音声の品質改良について(感情音声,韻律,声質,音声生成・知覚,脳機能,一般)
- TANDEM-STRAIGHTに基づく基本周波数抽出法の最適化に関する一検討(ポスターセッション,第10回音声言語シンポジウム)
- E-023 ウェブ上の言語知識を利用した音声認識用単語辞書の更新手法(自然言語・音声・音楽,一般論文)
- HK-1-7 ユーザの潜在的な興味を導き出すTV番組推薦システムの構築(HK-1.Needsからみたユビキタス環境構築術,グループ特別企画,ソサイエティ企画)
- A-15-5 日常生活における睡眠状態の収集とその評価(A-15.ヒューマン情報処理,一般講演)
- TV番組推薦システムの構築とその有用性の検証(誘うインタフェース(3), 誘うインタフェース(Inviting Interface), および一般)
- デモンストレーション: 音楽・音声言語情報処理の研究紹介(特別企画)
- TANDEM-STRAIGHTに基づく基本周波数の抽出と評価について(音声合成・韻律,第9回音声言語シンポジウム)
- デモンストレーション: 音楽・音声言語情報処理の研究紹介(特別企画)
- EA2010-35 擬似音声信号を用いた評価による音源構造抽出法の最適化について
- EA2010-36 スペクトル距離に基づく声道長正規化のための周波数帯域の選定について
- 母音情報に基づく話者変換システムの提案 : 音声テクスチャマッピングの一実装例(聴覚・音声・言語とその障害,一般)
- 基本周波数情報に基づく線形予測と時間軸伸縮を利用した非周期成分の抽出について(音声合成・声質変換,第10回音声言語シンポジウム)
- 基本周波数情報に基づく線形予測と時間軸伸縮を利用した非周期成分の抽出について(音声合成・声質変換,第10回音声言語シンポジウム)
- ポップス系歌唱音声における基本周波数軌跡の楽譜からの変位について(スペシャルセッション・歌情報処理1)
- HK-1-3 ロボットを用いた生活者へのサービス提供とユビキタス環境(HK-1.Needsからみたユビキタス環境構築術,グループ特別企画,ソサイエティ企画)
- ロボットを用いた対話インタフェースにおけるサービス実行理由説明機能(誘うインタフェース(3), 誘うインタフェース(Inviting Interface), および一般)
- ユビキタス環境における対話型ロボットのための顔識別システム(テーマセッション, 顔・ジェスチャーの認識・理解)
- ユビキタスホームにおける対話ロボットのための音声・雑音認識の開発(テーマセッション(2), ロボットとの相互作用のための言語処理・パターン認識・メディア理解)
- ユビキタスホームにおける対話ロボットのための音声・雑音認識の開発(テーマセッション(2), ロボットとの相互作用のための言語処理・パターン認識・メディア理解)
- ユビキタス環境における顔認識・音声認識を組み合わせたロボット対話インタフェースの試作(テーマ関連セッション)
- ユビキタスホームにおけるロボット対話インタフェースの実証実験
- ユビキタスホームにおける対話インタフェースロボットの試作(社会・都市システム)
- 高解像度撮影における実時間視線推定の高精度化(一般セッション3,文字・文書の認識・理解)
- AAMの動的選択に基づく不特定人物の顔追跡(一般セッション1)
- AAMの動的選択に基づく不特定人物の顔追跡(一般セッション1,CV/PR技術のVRへの応用)
- インタラクティブな情報提示システムのための非装着・非拘束な視線推定(わかってわくわくどきどき/認識を利用したインタラクション, どきどきわくわくインタラクション)
- Mind Probing : システムの積極的な働きかけによる視線パタンからの興味推定(わかってわくわくどきどき/認識を利用したインタラクション, どきどきわくわくインタラクション)
- 単語重要度を用いた N-gram 補完手法が与える音声認識性能の調査
- 3L-1 音声情報案内システム「たけまるくん」の運用(リーディングプロジェクト e-society:自然な音声対話処理技術(1),一般セッション,リーディングプロジェクト e-society)
- 単語重要度を用いたN-gram補完手法が与える音声認識性能の調査
- 高品質分析合成のための有声音の非周期成分の表現と推定について(聴覚・音声・言語とその障害,一般)
- 3L-5 音声入力Webシステムによる音声認識アプリケーションの構築技術(リーディングプロジェクト e-society:自然な音声対話処理技術(1),一般セッション,リーディングプロジェクト e-society)
- 音声入力・認識機能を有するWebシステムw3voiceの開発と運用
- E-072 音声入力機能を有する対話型Webアプリケーションの公開試験(E分野:自然言語・音声・音楽)
- E-038 大人・子ども発話の自動識別に基づく安心Webシステムの検討(自然言語・音声・音楽,一般論文)
- ロボットにおける音声認識技術
- TANDEM-STRAIGHTに基づく基本周波数抽出法の最適化に関する一検討(ポスターセッション,第10回音声言語シンポジウム)
- STRAIGHTを用いた簡易モーフィングによる印象変化の評価について(セッション2)
- STRAIGHTを用いた簡易モーフィングによる印象変化の評価について(セッション2)
- TANDEM-STRAIGHTに基づく基本周波数抽出法の最適化に関する一検討(ポスターセッション,第10回音声言語シンポジウム)
- 動作同期型調理ナビゲーションのための実世界対応型調理タスクモデル
- TANDEM-STRAIGHTに基づく基本周波数の抽出と評価について(音声合成・韻律,第9回音声言語シンポジウム)
- 時間方向および周波数方向の周期性の影響を除去した周期信号のパワースペクトルの表現について : STRAIGHTスペクトル推定の無調整化に向けて(聴覚・音声/一般)
- ICSLPにおける研究動向 : 言語モデル・対話システムを中心に(第8回音声言語シンポジウム)
- ICSLPにおける研究動向 : 言語モデル・対話システムを中心に
- ICSLPにおける研究動向 : 言語モデル・対話システムを中心に(Session-7 システム,第8回音声言語シンポジウム)
- ICSLPにおける研究動向 : 言語モデル・対話システムを中心に(Session-7 システム,第8回音声言語シンポジウム)
- ICSLPにおける研究動向 : 言語モデル・対話システムを中心に
- ICSLPにおける研究動向 : 言語モデル・対話システムを中心に
- ユビキタスホームにおける対話ロボットを使った生活実証実験 (ヒューマンコミュニケーション特集) -- (分散協調メディア)
- J-006 ちょっとした一言の音声認識による子ども利用者判別法の検討(J分野:ヒューマンコミュニケーション&インタラクション,一般論文)
- E-012 音声ウェブシステムを用いて収集した実環境子供発話に関する調査(E分野:自然言語・音声・音楽,一般論文)
- 5U-6 ウェブ収集発話を対象とした若年者判別の検討(音声インタフェース・システム,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 安心ウェブの実現に向けた大人・子ども発話のネット収集実験
- 「たけまるくん」実環境音声案内システムのデータベース整備と「キタちゃん」へのポータビリティーの検討(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 「たけまるくん」実環境音声案内システムのデータベース整備と「キタちゃん」へのポータビリティーの検討(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 「たけまるくん」実環境音声案内システムのデータベース整備と「キタちゃん」へのポータビリティーの検討
- 音声情報案内システム「たけまるくん」および「キタちゃん」の開発(特別企画「音声認識デベロッパーズフォーラム」)
- アンコンシャス型ロボットとビジブル型ロボットの協調メカニズム : 母親・子供メタファ
- 音声対話型観光案内システムにおける誤応答リカバリー効果の評価
- 高品質分析合成のための有声音の非周期成分の表現と推定について
- 公共音声情報案内システム「たけまるくん」の運用および収集発話の分析(音声対話システムA)(テーマ:音声対話システム、音声言語情報処理、一般)
- 複数の周期成分を持つ音声のための周期構造抽出法と障害音声分析への応用について(音響信号処理,聴覚,一般)
- 言葉の明瞭度と楽器等の音色を保持したクロス合成法の検討(音響信号処理,聴覚,一般)
- 聴覚フィルタバンクを用いた声道長比推定(分析,認識,理解,対話,一般)
- クラウド時代の新しい音声研究パラダイム
- D-14-9 日本語スピーキングテストにおける文生成問題の採点に影響を及ぼす要因の検討(D-14.音声,一般セッション)
- 動作同期型調理ナビゲーションのためのタスクモデリングの検討