公共音声情報案内システム「たけまるくん」の運用および収集発話の分析(音声対話システムA)(テーマ:音声対話システム、音声言語情報処理、一般)
スポンサーリンク
概要
- 論文の詳細を見る
機械に対するユーザの自然な実発話の収集と統計的な分析のために,我々は音声情報案内エージェントシステム「たけまるくん」を公共施設に設置し,2004年5月までの19ケ月間で約17万発話を収集・整備した.本稿では現在のシステム構成,収集データの分析結果および雑音・不要音棄却実験の結果を報告する.全体のおよそ30%が雑音などの非音声入力であった.音声入力のうち81%が有効発話であり,残りは背景会話・無意味な発声・不明瞭で聞き取れない発声・発話断片・オーバフローなどの応答不能な無効発話であった.これらの無効発話に対して,入力長とGMMに基づく雑音・不要音棄却の性能を評価した.1か月分8,248個のデータで実験した結果,雑音・息・咳・笑い声などの非音声入力は99%棄却でき,叫び声や遠隔で発声された背景会話もある程度棄却できることが分かった.一方で,発話断片やドメイン外発話については音響的特徴からの弁別は難しかった.
- 2004-10-22
著者
-
西村 竜一
和歌山大学
-
李 晃伸
名古屋工業大学
-
李 晃伸
奈良先端科学技術大学院大学情報科学研究科
-
李晃伸
名古屋工業大学大学院情報工学専攻
-
鹿野 清宏
奈良先端科学技術大学院大学
-
李 晃伸
名古屋工業大学大学院工学研究科
-
山田 真士
旭化成(株)新事業本部
-
山田 真士
奈良先端科学技術大学院大学情報科学研究科
関連論文
- ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理技術の総合開発(総合報告)
- 視聴覚統合を利用した非言語的手段による音色知覚の評価について
- 音声認識のデコーダと認識エンジン(自動音声認識研究の動向と展望)
- 視聴覚統合における刺激音の時間-周波数的特徴と視覚刺激の形状特徴の検討 : 人間の知覚特性に基づく音楽の可視化システムに向けて(インタフェース)
- 驚きを与え,笑顔を得たい(ちょっとしたエッセイ,コーヒーブレーク)
- 医療分野を対象とした多言語発話収集WebシステムOTOCKERの開発(情報社会のデザイン:Inter Societyと実世界アプリケーション)
- 再合成音声の品質に対する音声スペクトル包絡推定法の影響について(感情音声,韻律,声質,音声生成・知覚,脳機能,一般)
- ユーザ感情理解に向けた実環境音声情報案内システムの収集発話分析(言語解析, 対話)
- TANDEM-STRAIGHTおよび時変モーフィングのための研究用インタフェースの開発について(聴覚・音声・言語とその障害,一般)
- 実時間操作インタフェースへの応用を目的とした歌唱モーフィング操作パラメタの時系列への拡張について(音響信号処理)
- 基本周波数情報に基づく線形予測と時間軸伸縮を利用した非周期成分の抽出について(音声合成・声質変換,第10回音声言語シンポジウム)
- TANDEM-STRAIGHTによるスペクトル包絡の近似精度の改善について : 基本周波数により定まるNyquist周波数以上の空間周波数成分の復元について(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
- 4L-5 STRAIGHTに基づく柔軟な音声合成技術の開発(リーディングプロジェクト e-society:自然な音声対話処理技術(2),一般セッション,リーディングプロジェクト e-society)
- リアルタイムSTRAIGHTの改良とSTRAIGHTライブラリの実装(聴覚・音声・言語とその障害,一般)
- ポップス系歌唱音声における基本周波数軌跡の楽譜からの変位について(スペシャルセッション・歌情報処理1)
- TANDEM-STRAIGHTに基づく基本周波数の抽出と評価について(音声合成・韻律,第9回音声言語シンポジウム)
- 11.人にやさしい音声インタフェース(第2部:情報の高信頼蓄積・検索技術等の開発,学と産の連携による基盤ソフトウェアの先進的開発)
- 音声対話技術コンソーシアム(ISTC)の活動成果報告(SIG-SLP内組織の活動報告)
- 音声のテクスチャマッピングに基づく変換関数を利用した音声モーフィングの自動化について : 音声テクスチャマッピングの一応用例
- アプリケーション開発における音声認識(パネル討論)
- 声質変換のためのスペクトル・F_0の同時モデリング(一般(ポスターセッション),第9回音声言語シンポジウム)
- HMM音声合成における共分散パラメータの共有に関する検討(ポスターセッション,第10回音声言語シンポジウム)
- 実環境における頑健な音声認識のための音韻モデルの教師なし話者適応(音声,聴覚)
- 零周波数フィルタ信号に基づく基本周波数抽出法のTANDEM-STRAIGHTへの応用について(音響分析一般(1))
- 音声中の複数の繰返し構造の表現とその基本周波数および非周期性抽出への応用について
- 声道長の正規化に基づく簡易モーフィング音声の品質改良について(感情音声,韻律,声質,音声生成・知覚,脳機能,一般)
- TANDEM-STRAIGHTに基づく基本周波数抽出法の最適化に関する一検討(ポスターセッション,第10回音声言語シンポジウム)
- E-023 ウェブ上の言語知識を利用した音声認識用単語辞書の更新手法(自然言語・音声・音楽,一般論文)
- デモンストレーション: 音楽・音声言語情報処理の研究紹介(特別企画)
- 信頼度基準による解探索打ち切りに基づく超早音声認識
- TANDEM-STRAIGHTに基づく基本周波数の抽出と評価について(音声合成・韻律,第9回音声言語シンポジウム)
- デモンストレーション: 音楽・音声言語情報処理の研究紹介(特別企画)
- 声質変換のためのスペクトル・F_0の同時モデリング(一般(ポスターセッション),第9回音声言語シンポジウム)
- 声質変換のためのスペクトル・F_0の同時モデリング(一般(ポスターセッション),第9回音声言語シンポジウム)
- SuperHマイコンへの搭載を目的とした連続音声認識ソフトウェアJuliusの計算量削減
- EA2010-35 擬似音声信号を用いた評価による音源構造抽出法の最適化について
- EA2010-36 スペクトル距離に基づく声道長正規化のための周波数帯域の選定について
- 母音情報に基づく話者変換システムの提案 : 音声テクスチャマッピングの一実装例(聴覚・音声・言語とその障害,一般)
- 基本周波数情報に基づく線形予測と時間軸伸縮を利用した非周期成分の抽出について(音声合成・声質変換,第10回音声言語シンポジウム)
- 基本周波数情報に基づく線形予測と時間軸伸縮を利用した非周期成分の抽出について(音声合成・声質変換,第10回音声言語シンポジウム)
- ポップス系歌唱音声における基本周波数軌跡の楽譜からの変位について(スペシャルセッション・歌情報処理1)
- ユビキタスホームにおける対話ロボットのための音声・雑音認識の開発(テーマセッション(2), ロボットとの相互作用のための言語処理・パターン認識・メディア理解)
- ユビキタスホームにおける対話ロボットのための音声・雑音認識の開発(テーマセッション(2), ロボットとの相互作用のための言語処理・パターン認識・メディア理解)
- 「ユビキタスアプリケーションを支えるツールキット」(全4回) : 第3回 Julius を用いた音声認識インタフェースの作成
- 変分ベイズ法を用いたGMMに基づく話者認識(ポスターセッション,第10回音声言語シンポジウム)
- 複数の音素決定木構造を含む統計モデルに基づく音声認識(ポスターセッション,第10回音声言語シンポジウム)
- 変分ベイズ法を用いたGMMに基づく話者認識(ポスターセッション,第10回音声言語シンポジウム)
- 複数の音素決定木構造を含む統計モデルに基づく音声認識(ポスターセッション,第10回音声言語シンポジウム)
- HMM音声合成における共分散パラメータの共有に関する検討(ポスターセッション,第10回音声言語シンポジウム)
- 変分ベイズ法を用いたGMMに基づく話者認識(ポスターセッション,第10回音声言語シンポジウム)
- 3L-1 音声情報案内システム「たけまるくん」の運用(リーディングプロジェクト e-society:自然な音声対話処理技術(1),一般セッション,リーディングプロジェクト e-society)
- 単語重要度を用いたN-gram補完手法が与える音声認識性能の調査
- 高品質分析合成のための有声音の非周期成分の表現と推定について(聴覚・音声・言語とその障害,一般)
- 3L-5 音声入力Webシステムによる音声認識アプリケーションの構築技術(リーディングプロジェクト e-society:自然な音声対話処理技術(1),一般セッション,リーディングプロジェクト e-society)
- 音声入力・認識機能を有するWebシステムw3voiceの開発と運用
- E-072 音声入力機能を有する対話型Webアプリケーションの公開試験(E分野:自然言語・音声・音楽)
- E-038 大人・子ども発話の自動識別に基づく安心Webシステムの検討(自然言語・音声・音楽,一般論文)
- ロボットにおける音声認識技術
- TANDEM-STRAIGHTに基づく基本周波数抽出法の最適化に関する一検討(ポスターセッション,第10回音声言語シンポジウム)
- STRAIGHTを用いた簡易モーフィングによる印象変化の評価について(セッション2)
- STRAIGHTを用いた簡易モーフィングによる印象変化の評価について(セッション2)
- TANDEM-STRAIGHTに基づく基本周波数抽出法の最適化に関する一検討(ポスターセッション,第10回音声言語シンポジウム)
- TANDEM-STRAIGHTに基づく基本周波数の抽出と評価について(音声合成・韻律,第9回音声言語シンポジウム)
- 時間方向および周波数方向の周期性の影響を除去した周期信号のパワースペクトルの表現について : STRAIGHTスペクトル推定の無調整化に向けて(聴覚・音声/一般)
- ICSLPにおける研究動向 : 言語モデル・対話システムを中心に(第8回音声言語シンポジウム)
- ICSLPにおける研究動向 : 言語モデル・対話システムを中心に
- ICSLPにおける研究動向 : 言語モデル・対話システムを中心に(Session-7 システム,第8回音声言語シンポジウム)
- ICSLPにおける研究動向 : 言語モデル・対話システムを中心に(Session-7 システム,第8回音声言語シンポジウム)
- ICSLPにおける研究動向 : 言語モデル・対話システムを中心に
- ICSLPにおける研究動向 : 言語モデル・対話システムを中心に
- J-006 ちょっとした一言の音声認識による子ども利用者判別法の検討(J分野:ヒューマンコミュニケーション&インタラクション,一般論文)
- E-012 音声ウェブシステムを用いて収集した実環境子供発話に関する調査(E分野:自然言語・音声・音楽,一般論文)
- 5U-6 ウェブ収集発話を対象とした若年者判別の検討(音声インタフェース・システム,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 安心ウェブの実現に向けた大人・子ども発話のネット収集実験
- 「たけまるくん」実環境音声案内システムのデータベース整備と「キタちゃん」へのポータビリティーの検討(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 「たけまるくん」実環境音声案内システムのデータベース整備と「キタちゃん」へのポータビリティーの検討(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 「たけまるくん」実環境音声案内システムのデータベース整備と「キタちゃん」へのポータビリティーの検討
- 音声情報案内システム「たけまるくん」および「キタちゃん」の開発(特別企画「音声認識デベロッパーズフォーラム」)
- 公共音声情報案内システム「たけまるくん」の運用および収集発話の分析(音声対話システムA)(テーマ:音声対話システム、音声言語情報処理、一般)
- 複数の周期成分を持つ音声のための周期構造抽出法と障害音声分析への応用について(音響信号処理,聴覚,一般)
- 言葉の明瞭度と楽器等の音色を保持したクロス合成法の検討(音響信号処理,聴覚,一般)
- 聴覚フィルタバンクを用いた声道長比推定(分析,認識,理解,対話,一般)
- クラウド時代の新しい音声研究パラダイム
- D-14-9 日本語スピーキングテストにおける文生成問題の採点に影響を及ぼす要因の検討(D-14.音声,一般セッション)
- D-14-8 日本語スピーキングテストにおける文章読み上げ問題の採点に影響を及ぼす要因の検討(D-14.音声,一般セッション)
- 日本語発話能力測定ウェブシステムのための留学生発話分析(ポスター講演,ポスターショートオーラル,時系列パターン認識)
- 日本語発話能力測定ウェブシステムのための留学生発話分析(ポスター講演,ポスターショートオーラル,時系列パターン認識)
- 日本語発話能力測定ウェブシステムのための留学生発話分析
- TANDEM-STRAIGHT によるスペクトル包絡の近似精度の改善について基本周波数により定まる Nyquist 周波数以上の空間周波数成分の復元について
- 10年間の長期運用を支えた音声情報案内システム「たけまるくん」の技術(音声対話システムの実用化に向けて)
- RJ-005 対話型音声インタフェースのための大人・子ども判別技術の改良(HIP(2),J分野:ヒューマンコミュニケーション&インタラクション)
- 周期信号の群遅延の安定な表現について
- 日本語発話能力測定ウェブシステムのための留学生発話分析
- SC1-4 S-CATの音声認識における言語モデル(特別セッション 音声認識技術を応用したコンピュータ自動採点日本語スピーキングテストの開発)
- 歌唱音声のスペクトル形状の線形伸縮に影響する要因の検討
- 10年間の長期運用を支えた音声情報案内システム「たけまるくん」の技術
- 説明対話における韻律情報および頭部運動と感情評価値の関連性分析の試み(オーガナイズドセッション:対話システムの評価【評価・分析】,音声・言語・対話,一般)
- 文章音声の好感度評価と属性別モーフィングを用いた要因の検討について(オーガナイズドセッション「多様な音声の認識・合成へ向けて」,音声,言語,対話,一般)
- D-9-25 クラウドソーシングによる環境音収集に向けたスマホアプリの開発(D-9.ライフインテリジェンスとオフィス情報システム,一般セッション)
- 周期信号の群遅延の安定な表現について