音声ドキュメント検索におけるクエリ拡張と音節認識の併用の効果(音声処理,時系列パターン認識)
スポンサーリンク
概要
- 論文の詳細を見る
本稿ではクエリ拡張と音節認識を併用した音声ドキュメント検索手法を提案する.提案法では検索エンジンを用いてWebから収集したウェブページに含まれる単語によってクエリの拡張を行う.クエリベクトルと拡張ベクトルにより張られる平面でクエリに関連する音声ドキュメント集合をモデル化し,音声ドキュメントのベクトルとその平面との距離によりドキュメントを評価する.更に,検索対象となる音声ドキュメントは連続単語音声認識の結果から構築されるベクトル空間だけでなく,連続音節音声認識の結果から構築されるベクトル空間上においても表現される.各々の空間におけるクエリと音声ドキュメント間のコサイン距離を線形補間し,クエリ拡張と併用することによりMAP値がベースライン性能である0.393と比較して0.406に改善する結果を得た.
- 2012-02-02
著者
-
武田 一哉
名古屋大学大学院情報科学研究科
-
北岡 教英
名古屋大学
-
北 研二
徳島大学高度情報化基盤センター
-
北 研二
徳島大
-
柘植 覚
大同大学
-
柘植 覚
徳島大学大学院ソシオテクノサイエンス研究部情報ソリューション部門
-
武田 一哉
名古屋大 大学院情報科学研究科
-
武田 一哉
名古屋大学工学部
-
武田 一哉
名古屋大学
-
武田 昌一
帝京平成大学健康メディカル学部
-
北 研二
徳島大学
-
Tsuge Satoru
Atr Interpreting Telecommunications Research Laboratories
-
大橋 宏正
名古屋大学大学院情報科学研究科
-
北岡 教英
日本音響学会:現在,名古屋大学
-
大橋 宏正
名古屋大学
関連論文
- 正十二面体マイクロホンアレイを用いた実環境における音源信号分離の検討 (音声)
- ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理技術の総合開発(総合報告)
- ジェスチャインタフェースのための指先動作軌跡の統計的分割と正規化(信号処理,知的マルチメディアシステム,及び一般)
- ジェスチャインタフェースのための動作軌跡信号の統計的分割と認識(セッション4 : 理解るインタフェース : 手+足+触覚)
- 日常会話における発話タイミング分析
- 正十二面体マイクロホンアレイを用いた周波数領域ICAのpermutation問題に対する解決策の検討(音響信号処理/一般)
- 畳み込みHMMに基づく歌声の基本周波数制御モデルの提案とそのパラメータ学習方法(音響分析一般(1))
- 合同特別企画: パネルディスカッション「"音"研究の未来」
- 両耳室内インパルス応答の時空間周波数特性を利用した残響成分の解析
- 多様な音響環境下における音声認識システム利用時のデータ収集システム(音声,聴覚)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(3)(SIG-SLP内組織の活動報告)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(2)(雑音・VAD,第9回音声言語シンポジウム)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境 (2)(雑音・VAD,第9回音声言語シンポジウム)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(第8回音声言語シンポジウム)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(Session-1 検出,第8回音声言語シンポジウム)
- A-17-6 ドライブレコーダで収録した車両加速度を用いた運転特性の認識(A-17. ITS,一般セッション)
- 11.人にやさしい音声インタフェース(第2部:情報の高信頼蓄積・検索技術等の開発,学と産の連携による基盤ソフトウェアの先進的開発)
- CENSREC-1-C : 雑音下音声区間検出評価基盤の構築
- 自動車運転のマルチモーダル信号収録装置の開発(マルチモーダルシステム,システム開発論文)
- SLP雑音下音声認識評価WG活動報告 : 評価用データと評価手法について(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 実走行車内単語音声データベースCENSREC-3と共通評価環境の構築
- CENSREC-3 : 実走行車内単語音声データベースと評価環境の構築(ポスターセッション)(第6回音声言語シンポジウム)
- 実環境下音声認識の評価の標準化とその動向(音声・言語における標準化動向)(第6回音声言語シンポジウム)
- AURORA-2Jを用いたETSI STQ Aurora WI008 Advanced DSR Frontendの評価(ポスターセッション)(第5回音声言語シンポジウム)
- AURORA-2Jを用いたETSI STQ Aurora WI008 Advanced DSR Frontendの評価(第5回音声言語シンポジウム : ポスターセッション)
- 運転操作信号のケプストラム分析に基づく運転者識別
- 運転行動信号に含まれる個人性のモデル化(自動車・交通におけるコミュニケーション&インタフェース及び一般)
- 多視点・多聴点データ取得システムを用いた自由視聴点映像生成(研究速報,三次元・多視点映像処理,画像符号化・映像メディア処理レター)
- 音声対話システムの対話履歴N-gramを利用したユーザ満足度推定手法 (音声)
- 時系列アクティブ探索法に基づく運転行動の類似検索 (音声)
- 時系列アクティブ探索法に基づく運転行動の類似検索 (パターン認識・メディア理解)
- A-17-22 実環境大規模運転データベースの構築と閲覧システムの開発(A-17.ITS,一般セッション)
- 自動車運転行動のマルチモーダル信号コーパス(マルチモーダル)
- A-17-5 運転データ同期収録車両の開発と実走行環境における計測(A-17. ITS,一般セッション)
- マイクロコンピュータを用いた単発音入力インタフェースの開発(セッション1 : 理解るインタフェース : 音インタフェース)
- 追従走行における個人性を考慮したペダル操作量の推定(信号処理,符号化,知的マルチメディアシステム,一般)
- 音声認識システムの満足度評価におけるユーザモデル(言語モデル・システム,第10回音声言語シンポジウム)
- デモンストレーション:若手による研究紹介IV
- 確率的手法を用いた車線変更軌跡のモデル化
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(2)(雑音・VAD,第9回音声言語シンポジウム)
- 合同特別企画: パネルディスカッション「"音"研究の未来」
- 音声対話システムの対話履歴 N-gram を利用したユーザ満足度推定手法
- 運転行動データベースの構築とその応用 (「運転行動信号処理」特集号)
- 運転行動信号処理の現状と展望 (「運転行動信号処理」特集号)
- 雑音下マルチモーダル音声認識評価基盤CENSREC-1-AVの構築
- 座談会 : 音声研究を語る : (小特集:)
- 部分文仮説のゆう度を用いた連続音声認識のための音声区間検出法
- Nベスト意味探索と再評価法を用いた大規模内線受付装置の試作
- 音声対話システムの対話履歴N-gramを利用したユーザ満足度推定手法(対話,第11回音声言語シンポジウム)
- 音声対話システムの対話履歴N-gramを利用したユーザ満足度推定手法
- 空間音響特性を考慮したスぺースダイバーシチ型ロバスト音声認識(音声情報処理 : 現状と将来技術論文特集)
- 室内音響特性を考慮した音声認識に関する検討
- 空間音響特性依存HMMによるスペースダイバーシチ型ロバスト音声認識
- 空間音響特性依存HMMによるスペースダイバーシチ型ロバスト音声認識
- 正十二面体マイクロホンアレイを用いた実環境における音源信号分離の検討(音声,応用音響,一般,音声,応用/電気音響,信号処理,及び一般)
- 正十二面体マイクロホンアレイを用いた実環境における音源信号分離の検討(音声,応用音響,一般,音声,応用/電気音響,信号処理,及び一般)
- 正十二面体マイクロホンアレイを用いた実環境における音源信号分離の検討(音声,応用音響,一般,音声,応用/電気音響,信号処理,及び一般)
- 給電指令電話の音声検索システム
- 端点検出を行わない連続音声認識
- 端点検出を行わない連続音声認識手法
- 端点検出を行わない連続音声認識手法
- 端点検出を行わない連続音声認識手法
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(Session-1 検出,第8回音声言語シンポジウム)
- CENSREC-2 : 実走行車内における連続数字音声データベースと評価環境の構築
- 自動車内における連続数字音声コーパスCENSREC-2の設計と評価(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 自動車内における連続数字音声コーパスCENSREC-2の設計と評価(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- SLP雑音下音声認識評価WG活動報告 : 評価用データと評価手法について(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 自動車内における連続数字音声コーパスCENSREC-2の設計と評価(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- SLP雑音下音声認識評価WG活動報告 : 評価用データと評価手法について(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 把持動作から認知状態を識別するための信号処理手法の検討(一般セッション,クロスモーダル)
- 把持動作から認知状態を識別するための信号処理手法の検討(一般セッション,クロスモーダル)
- 把持動作から認知状態を識別するための信号処理手法の検討(一般セッション,クロスモーダル)
- 把持動作から認知状態を識別するための信号処理手法の検討(一般セッション,クロスモーダル)
- A-4-4 認知状態識別のための把持ヤコビ行列の特徴抽出(A-4. 信号処理,一般セッション)
- 個人性を考慮した車線変更時の車両軌跡生成過程のモデル化
- 個人性を考慮した車線変更時の車両軌跡生成過程のモデル化(一般セッション,システム・制御のためのパターン認識・メディア理解)
- スペクトル分析を用いた運転行動信号に含まれる個人性のモデル化(マルチメディア処理)
- 追従走行における個人性を考慮したペダル操作量の推定(信号処理,符号化,知的マルチメディアシステム,一般)
- 追従走行における個人性を考慮したペダル操作量の推定(信号処理,符号化,知的マルチメディアシステム,一般)
- LL-007 ケプストラム分布を用いた実環境下の運転行動信号に含まれる個人性のモデル化(L分野:ネットワークコンピューティング)
- 日常会話における発話タイミング分析
- Workshop on Robust Methods for Speech Recognition in Adverse Conditions報告
- 音声研究の現状と課題
- 時系列アクティブ探索法に基づく運転行動の類似検索(テーマセッション,クロスモーダル)
- 交差点進入時の運転行動の推定(テーマセッション,クロスモーダル)
- 時系列アクティブ探索法に基づく運転行動の類似検索(テーマセッション,クロスモーダル)
- 交差点進入時の運転行動の推定(テーマセッション,クロスモーダル)
- 時系列アクティブ探索法に基づく運転行動の類似検索(テーマセッション,クロスモーダル)
- 交差点進入時の運転行動の推定(テーマセッション,クロスモーダル)
- 時系列アクティブ探索法に基づく運転行動の類似検索(テーマセッション,クロスモーダル)
- 交差点進入時の運転行動の推定(テーマセッション,クロスモーダル)
- A-17-5 信号なし交差点における運転行動予測モデル(A-17. ITS,一般セッション)
- BS-11-4 分散センサ群による運転行動の記録・分析・コンテンツ化(BS-11.ひとを測るセンサネットワーク,シンポジウムセッション)
- ベイジアンネットワークを用いた単一チャネル信号による背景音楽抑圧(音響処理・話者同定,第10回音声言語シンポジウム)
- 自動車走行観測信号に含まれる個人性のモデル化(信号処理, 符号化とそれらを用いた知的マルチメディアシステム, 一般)
- 自動車走行観測信号に含まれる個人性のモデル化(信号処理, 符号化とそれらを用いた知的マルチメディアシステム, 一般)
- 自動車走行観測信号に含まれる個人性のモデル化(信号処理, 符号化とそれらを用いた知的マルチメディアシステム, 一般)
- 運転行動信号に含まれる個人性のモデル化(自動車・交通におけるコミュニケーション&インタフェース及び一般)
- LK-004 運転行動信号に含まれる個人性に関する検討(K. ヒューマンコミュニケーション&インタラクション)
- 指向性マイクロホンを用いた波面合成法における波面合成精度