雑談音声の常時認識による楽曲提案システム(一般セッション,福祉と見守りのための画像・音声処理)
スポンサーリンク
概要
- 論文の詳細を見る
音声を連続音声認識システムにより常時認識することによって得られる認識単語列からその場の雰囲気に適切な音楽・楽曲を提案し,再生するシステムを構築した.楽曲を説明するテキストより構築された文書ベクトル空間と,楽曲の音響特徴量を表現する音響ベクトル空間の対応付けを利用することで,大語彙音声認識によって得られた音声認識単語列を音響ベクトル空間へとマッピングする.また,大語彙音声認識ではカバーできない固有名詞などのキーワードをワードスポッティングで認識する.本稿ではシステムの概要と基本的な性能評価の結果と実際の雑談音声への応用に向けた予備実験結果を示す.楽曲のレビューを読み上げた音声を認識した結果による楽曲検索結果と,レビューのテキストを用いた結果との比較により,テキストではMRR値1で検索できたものが,音声認識性能はWER70.55%,ワードスポッティング性能はF値31.58%でもMRR値0.83と比較的良い結果を得た.また,今後の雑談認識の応用の予備的実験を行い,雑談書き起こしからの例を示した.
- 2010-10-01
著者
-
武田 一哉
名古屋大学大学院情報科学研究科
-
北岡 教英
名古屋大学
-
原 直
名古屋大学大学院情報科学研究科
-
北岡 教英
名古屋大学大学院情報科学研究科
-
武田 一哉
名古屋大学
-
武田 昌一
帝京平成大学健康メディカル学部
-
大橋 宏正
名古屋大学大学院情報科学研究科
関連論文
- 正十二面体マイクロホンアレイを用いた実環境における音源信号分離の検討 (音声)
- ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理技術の総合開発(総合報告)
- ジェスチャインタフェースのための指先動作軌跡の統計的分割と正規化(信号処理,知的マルチメディアシステム,及び一般)
- ジェスチャインタフェースのための動作軌跡信号の統計的分割と認識(セッション4 : 理解るインタフェース : 手+足+触覚)
- 日常会話における発話タイミング分析
- 正十二面体マイクロホンアレイを用いた周波数領域ICAのpermutation問題に対する解決策の検討(音響信号処理/一般)
- 畳み込みHMMに基づく歌声の基本周波数制御モデルの提案とそのパラメータ学習方法(音響分析一般(1))
- 合同特別企画: パネルディスカッション「"音"研究の未来」
- 両耳室内インパルス応答の時空間周波数特性を利用した残響成分の解析
- 多様な音響環境下における音声認識システム利用時のデータ収集システム(音声,聴覚)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(3)(SIG-SLP内組織の活動報告)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(2)(雑音・VAD,第9回音声言語シンポジウム)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境 (2)(雑音・VAD,第9回音声言語シンポジウム)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(第8回音声言語シンポジウム)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(Session-1 検出,第8回音声言語シンポジウム)
- A-17-6 ドライブレコーダで収録した車両加速度を用いた運転特性の認識(A-17. ITS,一般セッション)
- 11.人にやさしい音声インタフェース(第2部:情報の高信頼蓄積・検索技術等の開発,学と産の連携による基盤ソフトウェアの先進的開発)
- CENSREC-1-C : 雑音下音声区間検出評価基盤の構築
- 自動車運転のマルチモーダル信号収録装置の開発(マルチモーダルシステム,システム開発論文)
- SLP雑音下音声認識評価WG活動報告 : 評価用データと評価手法について(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 実走行車内単語音声データベースCENSREC-3と共通評価環境の構築
- CENSREC-3 : 実走行車内単語音声データベースと評価環境の構築(ポスターセッション)(第6回音声言語シンポジウム)
- 実環境下音声認識の評価の標準化とその動向(音声・言語における標準化動向)(第6回音声言語シンポジウム)
- AURORA-2Jを用いたETSI STQ Aurora WI008 Advanced DSR Frontendの評価(ポスターセッション)(第5回音声言語シンポジウム)
- AURORA-2Jを用いたETSI STQ Aurora WI008 Advanced DSR Frontendの評価(第5回音声言語シンポジウム : ポスターセッション)
- 運転操作信号のケプストラム分析に基づく運転者識別
- 運転行動信号に含まれる個人性のモデル化(自動車・交通におけるコミュニケーション&インタフェース及び一般)
- 多視点・多聴点データ取得システムを用いた自由視聴点映像生成(研究速報,三次元・多視点映像処理,画像符号化・映像メディア処理レター)
- 音声対話システムの対話履歴N-gramを利用したユーザ満足度推定手法 (音声)
- 時系列アクティブ探索法に基づく運転行動の類似検索 (音声)
- 時系列アクティブ探索法に基づく運転行動の類似検索 (パターン認識・メディア理解)
- A-17-22 実環境大規模運転データベースの構築と閲覧システムの開発(A-17.ITS,一般セッション)
- 自動車運転行動のマルチモーダル信号コーパス(マルチモーダル)
- A-17-5 運転データ同期収録車両の開発と実走行環境における計測(A-17. ITS,一般セッション)
- マイクロコンピュータを用いた単発音入力インタフェースの開発(セッション1 : 理解るインタフェース : 音インタフェース)
- 追従走行における個人性を考慮したペダル操作量の推定(信号処理,符号化,知的マルチメディアシステム,一般)
- 音声認識システムの満足度評価におけるユーザモデル(言語モデル・システム,第10回音声言語シンポジウム)
- デモンストレーション:若手による研究紹介IV
- 確率的手法を用いた車線変更軌跡のモデル化
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(2)(雑音・VAD,第9回音声言語シンポジウム)
- 合同特別企画: パネルディスカッション「"音"研究の未来」
- 音声対話システムの対話履歴 N-gram を利用したユーザ満足度推定手法
- 運転行動データベースの構築とその応用 (「運転行動信号処理」特集号)
- 運転行動信号処理の現状と展望 (「運転行動信号処理」特集号)
- 雑音下マルチモーダル音声認識評価基盤CENSREC-1-AVの構築
- 座談会 : 音声研究を語る : (小特集:)
- 部分文仮説のゆう度を用いた連続音声認識のための音声区間検出法
- Nベスト意味探索と再評価法を用いた大規模内線受付装置の試作
- 音声対話システムの対話履歴N-gramを利用したユーザ満足度推定手法(対話,第11回音声言語シンポジウム)
- 音声対話システムの対話履歴N-gramを利用したユーザ満足度推定手法
- 空間音響特性を考慮したスぺースダイバーシチ型ロバスト音声認識(音声情報処理 : 現状と将来技術論文特集)
- 室内音響特性を考慮した音声認識に関する検討
- 空間音響特性依存HMMによるスペースダイバーシチ型ロバスト音声認識
- 空間音響特性依存HMMによるスペースダイバーシチ型ロバスト音声認識
- 正十二面体マイクロホンアレイを用いた実環境における音源信号分離の検討(音声,応用音響,一般,音声,応用/電気音響,信号処理,及び一般)
- 正十二面体マイクロホンアレイを用いた実環境における音源信号分離の検討(音声,応用音響,一般,音声,応用/電気音響,信号処理,及び一般)
- 正十二面体マイクロホンアレイを用いた実環境における音源信号分離の検討(音声,応用音響,一般,音声,応用/電気音響,信号処理,及び一般)
- 給電指令電話の音声検索システム
- 端点検出を行わない連続音声認識
- 端点検出を行わない連続音声認識手法
- 端点検出を行わない連続音声認識手法
- 端点検出を行わない連続音声認識手法
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(Session-1 検出,第8回音声言語シンポジウム)
- CENSREC-2 : 実走行車内における連続数字音声データベースと評価環境の構築
- 自動車内における連続数字音声コーパスCENSREC-2の設計と評価(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 自動車内における連続数字音声コーパスCENSREC-2の設計と評価(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- SLP雑音下音声認識評価WG活動報告 : 評価用データと評価手法について(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 自動車内における連続数字音声コーパスCENSREC-2の設計と評価(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- SLP雑音下音声認識評価WG活動報告 : 評価用データと評価手法について(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 把持動作から認知状態を識別するための信号処理手法の検討(一般セッション,クロスモーダル)
- 把持動作から認知状態を識別するための信号処理手法の検討(一般セッション,クロスモーダル)
- 把持動作から認知状態を識別するための信号処理手法の検討(一般セッション,クロスモーダル)
- 把持動作から認知状態を識別するための信号処理手法の検討(一般セッション,クロスモーダル)
- A-4-4 認知状態識別のための把持ヤコビ行列の特徴抽出(A-4. 信号処理,一般セッション)
- 個人性を考慮した車線変更時の車両軌跡生成過程のモデル化
- 個人性を考慮した車線変更時の車両軌跡生成過程のモデル化(一般セッション,システム・制御のためのパターン認識・メディア理解)
- スペクトル分析を用いた運転行動信号に含まれる個人性のモデル化(マルチメディア処理)
- 追従走行における個人性を考慮したペダル操作量の推定(信号処理,符号化,知的マルチメディアシステム,一般)
- 追従走行における個人性を考慮したペダル操作量の推定(信号処理,符号化,知的マルチメディアシステム,一般)
- LL-007 ケプストラム分布を用いた実環境下の運転行動信号に含まれる個人性のモデル化(L分野:ネットワークコンピューティング)
- 日常会話における発話タイミング分析
- Workshop on Robust Methods for Speech Recognition in Adverse Conditions報告
- 音声研究の現状と課題
- 時系列アクティブ探索法に基づく運転行動の類似検索(テーマセッション,クロスモーダル)
- 交差点進入時の運転行動の推定(テーマセッション,クロスモーダル)
- 時系列アクティブ探索法に基づく運転行動の類似検索(テーマセッション,クロスモーダル)
- 交差点進入時の運転行動の推定(テーマセッション,クロスモーダル)
- 時系列アクティブ探索法に基づく運転行動の類似検索(テーマセッション,クロスモーダル)
- 交差点進入時の運転行動の推定(テーマセッション,クロスモーダル)
- 時系列アクティブ探索法に基づく運転行動の類似検索(テーマセッション,クロスモーダル)
- 交差点進入時の運転行動の推定(テーマセッション,クロスモーダル)
- A-17-5 信号なし交差点における運転行動予測モデル(A-17. ITS,一般セッション)
- BS-11-4 分散センサ群による運転行動の記録・分析・コンテンツ化(BS-11.ひとを測るセンサネットワーク,シンポジウムセッション)
- ベイジアンネットワークを用いた単一チャネル信号による背景音楽抑圧(音響処理・話者同定,第10回音声言語シンポジウム)
- 自動車走行観測信号に含まれる個人性のモデル化(信号処理, 符号化とそれらを用いた知的マルチメディアシステム, 一般)
- 自動車走行観測信号に含まれる個人性のモデル化(信号処理, 符号化とそれらを用いた知的マルチメディアシステム, 一般)
- 自動車走行観測信号に含まれる個人性のモデル化(信号処理, 符号化とそれらを用いた知的マルチメディアシステム, 一般)
- 運転行動信号に含まれる個人性のモデル化(自動車・交通におけるコミュニケーション&インタフェース及び一般)
- LK-004 運転行動信号に含まれる個人性に関する検討(K. ヒューマンコミュニケーション&インタラクション)
- 指向性マイクロホンを用いた波面合成法における波面合成精度