パーソナルロボットPaPeRoにおける音声インタフェース(<特集>システム論文特集号)
スポンサーリンク
概要
- 論文の詳細を見る
パーソナルロボットPaPeRoにおける音声インタフェースの実現と性能評価について報告する。音声インタフェースは,話者方向推定,ノイズキャンセラ,エコーキャンセラから構成される。話者方向推定は,近接音場を想定した方向推定手法を用いて,話者の口とマイクロホンの高低差による誤差を解消している。ノイズキャンセラは,広範囲なSN比を想定したステップサイズ制御により,高い雑音消去性能と小さな音声歪を両立することができる。エコーキャンセラは,背景雑音の推定を行うことにより,ダブルトーク検出性能を向上させている。実環境評価により,話者方向推定の正解率が40%,音声認識率が,雑音環境下で最大65%,ロボット発話時最大71%改善できることを示す。音声インタフェースに対する音声認識システムの最適化は全く行っておらず,この音声インタフェースはそのまま他の音声認識システムにも適用できる汎用性を有している。この音声インタフェースの一部は,2005年愛知にて開催された愛・地球博において,チャイルドケアロボットとして技術実証運用を行った。
- 社団法人日本音響学会の論文
- 2006-03-01
著者
-
杉山 昭彦
NEC共通基盤ソフトウェア研究所
-
佐藤 幹
NEC共通基盤ソフトウェア研究所
-
宝珠山 治
Necメディア情報研究所
-
杉山 昭彦
NECメディア情報研究所
-
藤田 善弘
日本電気株式会社
-
佐藤 幹
NECメディア情報研究所
-
山下 信行
NECメディア情報研究所
-
大中 慎一
NECメディア情報研究所
-
藤田 善弘
NECメディア情報研究所
-
藤田 善弘
NECインキュベーションセンター
-
杉山 昭彦
NEC情報メディア研究所
-
杉山 昭彦
Nec C&cメディア研究所
-
大中 慎一
日本電気株式会社企業ソリューション企画本部
-
藤田 善弘
日本電気株式会社情報メディア研究所
-
藤田 善弘
Nec C&cイノベーション研究所
-
藤田 善弘
Nec
-
佐藤 幹
Atr知能ロボティクス研究所
-
佐藤 幹
国際電気通信基礎技術研究所知能ロボティクス研究所
-
藤田 善弘
Nec C&cイノベーション推進本部
-
佐藤 幹
国際電気通信基礎技術研究所(ATR)
関連論文
- 画像認識用並列プロセッサ研究20年の夜明け(平成21年度喜安記念業績賞紹介)
- パーソナルロボットを用いた特別支援教育の新しい学習環境の提案 : 知的障害と自閉症の児童らを対象とした2年間の国語の授業を通して(障害者教育・特別支援教育)
- 1チップ音声対話モジュールと PaPeRo-mini による評価
- F09 ユーモアインタラクションの研究1 : 漫才ロボット「パペじろう」の開発(情報デザイン, 第54回研究発表大会)
- A-4-37 複素信号に実フィルタ係数を用いるコンスタントモジュラスアルゴリズム(A-4.信号処理,一般講演)
- 5 ロボットに対する無意識レベルのイメージ : 子供やアテンダントスタッフを対象とした臨床心理的分析(ロボットメディアによる人間情報処理研究)
- パーソナルロボット"PaPeRo"の開発(2) : パートナー型ロボットのインタラクションデザイン開発事例(口頭による研究発表概要)
- パーソナルロボット"PaPeRo"の開発(1) : パートナー型ロボットの開発事例および概要(口頭による研究発表概要)
- 小型音声対話モジュールの開発(音声認識実用化に向けて)
- D-14-3 高品質MPEG-4オーディオHE-AACエンコーダ(D-14. 音声・聴覚, 情報・システム1)
- ロボット型統合UIプラットフォーム (組込みソフトウエア・ソリユーシヨン特集) -- (組込みシステム・プラットフォーム)
- パーソナルロボットPaPeRoにおける音声インタフェース(システム論文特集号)
- 一次元プロセッサアレイに基づく超高速画像処理システムの開発環境(並列処理)
- SNR補正分割型パワー正規化PNLMSによる低歪ノイズキャンセラ(信号処理,LSI及び一般)
- SNR補正分割型パワー正規化PNLMSによる低歪ノイズキャンセラ(信号処理,LSI及び一般)
- SNR補正分割型パワー正規化PNLMSによる低歪ノイズキャンセラ(信号処理,LSI及び一般)
- パーソナルロボットPaPeRoの話者方向推定と雑音消去
- A-4-20 クリッピング歪みを含む音響エコーを抑圧する非線形エコーキャンセラ(A-4.信号処理,一般講演)
- 小型機器で快適なハンズフリー通話を可能にする非線形エコー消去技術 (組込みソフトウエア・ソリユーシヨン特集) -- (イメージ/音声処理コンポーネントソリューション)
- ロボットにおける耐雑音音声認識(ロボットにおける音響技術)
- A-4-27 高非線形エコーの周波数領域モデルに基づくエコーサプレッサの主観評価(A-4.信号処理,一般講演)
- A-4-20 POST-PROCESSING NOISE SUPPRESSOR WITH ADAPTIVE GAIN-FLOORING SUITABLE FOR DISTORTED SPEECH
- A-4-19 非線形エコーサプレッサを対象とした残留エコーとエコーレプリカの回帰分析(A-4.信号処理,一般講演)
- マイクロフォンアレイ用の新しい自己較正法(信号処理, 符号化とそれらを用いた知的マルチメディアシステム, 一般)
- 残留エコーとエコーレプリカのスペクトル相関に基づく非線形音響エコーサプレッサ(信号処理, 符号化とそれらを用いた知的マルチメディアシステム, 一般)
- パペロのみみ(信号処理, 符号化とそれらを用いた知的マルチメディアシステム, 一般)
- マイクロフォンアレイ用の新しい自己較正法(信号処理, 符号化とそれらを用いた知的マルチメディアシステム, 一般)
- 残留エコーとエコーレプリカのスペクトル相関に基づく非線形音響エコーサプレッサ(信号処理, 符号化とそれらを用いた知的マルチメディアシステム, 一般)
- パペロのみみ(信号処理, 符号化とそれらを用いた知的マルチメディアシステム, 一般)
- マイクロフォンアレイ用の新しい自己較正法(信号処理, 符号化とそれらを用いた知的マルチメディアシステム, 一般)
- 残留エコーとエコーレプリカのスペクトル相関に基づく非線形音響エコーサプレッサ(信号処理, 符号化とそれらを用いた知的マルチメディアシステム, 一般)
- パペロのみみ(信号処理, 符号化とそれらを用いた知的マルチメディアシステム, 一般)
- A-4-4 残留エコーとエコーレプリカのスペクトル相関に基づく非線形音響エコー抑圧(A-4.信号処理,基礎・境界)
- ロボットにおける近接話者方向推定と2マイク音声強調
- 携帯電話用雑音抑圧技術の標準化(ディジタル信号処理)
- 重み付き雑音推定とMMSE STSA法に基づく高音質雑音抑圧
- 会議システム用音響エコーキャンセラ(画像信号処理及び一般)
- 会議システム用音響エコーキャンセラ(画像信号処理及び一般)
- A-4-31 可変ステップサイズサブフィルタを用いた低歪ノイズキャンセラ
- A-4-9 重み付き雑音推定に基づくノイズサプレッサの音質評価
- A-4-8 重みつき雑音推定に基づくノイズサプレッサのDSP実現
- AMR広帯域音声コーデック向け広帯域雑音抑圧法
- 携帯電話用雑音抑圧技術の標準化
- AMR広帯域音声コーデック向け広帯域雑音抑圧法
- 携帯電話用雑音抑圧技術の標準化
- A-4-42 Evaluation of a Noise Suppressor with Synthesis Windowing and Pseudo Noise Injection for the AMR Wideband Speech Codec
- Evaluation of a Noise Suppressor with Weighted Noise Estimation and Spectral Gain Modification for Adaptive Multi-Rate Speech Codec
- 重みつき雑音推定とMMSE STSA法に基づく高音質雑音抑圧
- 重みつき雑音推定とMMSE STSA法に基づく高音質雑音抑圧
- A-4-21 重みつき雑音推定とMMSE STSA法に基づく高音質雑音抑圧
- 耐雑音音声認識用音響信号処理技術 (ITS特集) -- (ITS情報通信システムアプリケーション拡大へ向けて)
- マイクロホンアレイの研究動向と実現技術
- 様々なサイズのアレイを用いた適応マイクアレイの評価
- ロバスト適応マイクロホンアレイのDSP実現
- 適応マイクロホンアレイの音声認識実験による評価
- 音響ビームフォーミングと多次元信号処理
- ロバスト適応マイクロフォンアレイの実時間音声認識による評価
- 適応マイクロホンアレイのための適応モード制御法
- ロバスト適応マイクロホンアレイの実環境における指向特性
- ブロッキング行列にリーク適応フィルタを用いたロバスト一般化サイドローブキャンセラ
- ロバスト適応マイクロホンアレイの実信号による評価
- ロバスト適応マイクロホンアレイのノルム拘束適応フィルタによる改良
- タップ係数拘束適応フィルタによるブロッキング行列を用いたロバスト適応ビームフォーマ
- A-127 リーク適応フィルタによるブロック行列を用いたロバスト適応マイクロホンアレイ(A-4. ディジタル信号処理,一般講演)
- 9)MPEG/Audio符号化アルゴリズム(画像通信システム研究会)
- 128-PEと16-Mb DRAMを集積化した並列画像処理メモリ
- 並列画像処理メモリPIP-RAM(3) : 動作速度及び消費電力について
- 並列画像処理メモリPIP-RAM(2) : メモリ部の回路方式
- 並列画像処理メモリPIP-RAM(1)
- メモリ型プロセッサによる動画像処理システムRVS-2 : 性能評価
- 幼児施設における保護者参加型子ども見守りシステムの提案(応用,サイバーワールド論文)
- P24 子供達がパペロに対して抱くイメージについての臨床心理学的分析 : 名古屋万博のリピーターの子どもたちを対象にして(第54回研究発表大会)
- 音声認識モジュールのアーキテクチャとその評価
- P34 チャイルドケアロボット"PaPeRo"のシナリオデザイン開発とオブザベーション(ポスターセッション方式による研究発表概要,平成18年度 日本デザイン学会 第53回研究発表大会)
- パーソナルロボットPaPeRoの開発と愛・地球博での実証実験(テーマセッション(3))
- パーソナルロボットPaPeRoの開発と愛・地球博での実証実験(テーマセッション(3))
- 保護者参加型子ども見守りシステム「メルロボ連絡帳」の紹介(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- 一次元プロセッサアレイに基づくリアルタイム画像処理システムの開発環境
- 超高速動画像処理ボ-ドIMAP-VISION (ITS (高度道路交通システム)特集)
- 10GIPS IMAP-VISONボード : 性能評価
- 10GIPS IMAP-VISONボード : ハードウェア
- リアルタイムビジョンのための並列処理 LSI IMAP とそのシステム
- メモリ集積型SIMDプロセッサIMAP
- メモリ型プロセッサによる動画像処理システムRVS-2 : メモリ型プロセッサIMAP-2
- 並列画像理解のハードウェアアーキテクチャ (「並列・分散協調画像理解」)
- 並列画像理解のハードウェアアーキテクチャ
- メモリ集積型プロセッサIMAP-LSI
- メモリ型画像処理プロセッサIMAPとその応用
- C06 社会-技術的ネットワークによるロボットのデザイン : 幼稚園におけるロボットの使用に関する、エスノグラフィ及びデザイン研究(ユーザの経験を理解する1(情報デザイン研究部会),心「こころ」とデザイン,第55回春季研究発表大会)
- P15 ネットワークとしてのロボットデザイン : 幼稚園にロボットを持ち込んデザインしたインタフェース(第54回研究発表大会)
- P43 社会的ネットワークにおけるロボットのデザイン : 幼稚園にPaPeRoを持ち込んでの長期的なフィールドワーク(ポスターセッション方式による研究発表概要,平成18年度 日本デザイン学会 第53回研究発表大会)
- F17 ロボットデザインプロセスと整合性の高い開発環境設計 : PaPeRo 対話オーサリングツール
- F16 セミヒューマンインタラクション (2) : 状況に埋め込まれたロボットの振る舞いのデザイン
- F15 人とロボットとの対話をデザインする : パーソナルロボット PaPeRo を事例とした基礎的な研究 (2)
- 人とロボットとの「かかわり合い」に関する人文系多角的研究(1) : 展示会におけるオブザベーション活動の事例報告
- コミュニケーションロボットPaPeRoと中高校・介護施設での利用事例(障害者教育・特別支援教育)
- デジタルプラクティス連携企画 標準化が企業を活かす--あるオーディオ研究者から見た光と影
- マイクロホンアレイの研究動向と実現技術
- A-4-21 ボルテラフィルタによる超音波パラメトリックスピーカの歪低減(A-4.信号処理,一般セッション)
- 高音質オーディオ符号化方式の開発とMPEG標準化