CENSREC-1-C : An evaluation framework for voice activity detection under noisy environments
スポンサーリンク
概要
- 論文の詳細を見る
- 2009-09-01
著者
-
Tsuge Satoru
Institute of Technology and Science, The University of Tokushima
-
山本 一公
豊橋技術科学大学
-
KITAOKA Norihide
Nagoya University
-
TAKEDA Kazuya
Nagoya University
-
藤本 雅清
NTTコミュニケーション科学基礎研究所
-
Takeda Kazuya
Nagoya Univ.
-
Takeda K
Nagoya Univ. Nagoya Jpn
-
Tsuge Satoru
The University Of Tokushima
-
Kuroiwa S
Chiba University And National Institute Of Information And Communications Technology
-
Kuroiwa Shingo
Graduate School Of Advanced Integration Science Chiba University
-
Kuroiwa Shingo
Faculty Of Engineering The University Of Tokushima
-
Kuroiwa Shingo
Chiba University
-
Kuroiwa Shingo
Chiba Univ. And National Inst. Of Information And Communications Technol.
-
Tsuge Satoru
The Univ. Of Tokushima
-
Takeda Kazuya
Nagoya Univ. Nagoya‐shi Jpn
-
Matsuda Shigeki
Atr Spoken Language Communication Research Labs. And National Institute Of Information And Communica
-
Matsuda Shigeki
Atr Spoken Language Communication Research Laboratories
-
Nakayama Masato
Ritsumeikan University
-
Shikano Kiyohiro
Chiba University And National Institute Of Information And Communications Technology
-
YAMADA Takeshi
University of Tsukuba
-
NISHIURA Takanobu
Ritsumeikan University
-
MIYAJIMA Chiyomi
Nagoya University
-
Ogawa Tetsuji
Waseda Univ. Tokyo Jpn
-
Ogawa Tetsuji
Waseda Institute For Advanced Study
-
Ogawa Tetsuji
Waseda University
-
Tamura Satoshi
Gifu University
-
Nakamura S
National Institute Of Information And Communications Technology
-
Nakamura Satoshi
National Inst. Information And Communications Technol. (nict) Kyoto‐fu Jpn
-
YAMAMOTO Kazumasa
Toyohashi University of Technology
-
DENDA Yuki
Ritsumeikan University
-
FUJIMOTO Masakiyo
NTT Communication Science Laboratories, NTT Corporation
-
TAKIGUCHI Tetsuya
Kobe University
-
FUJIMOTO Masakiyo
the ATR Spoken Language Communication Research Laboratories
-
Denda Yuki
Ritsumeikan Univ.
-
Matsuda Shigeki
Atr Spoken Language Communication Res. Labs. And National Inst. Of Information And Communications Te
-
Yamamoto Kazumasa
Faculty Of Engineering Shinshu University
-
Yamamoto Kazumasa
Graduate School Of Science And Technology Shinshu University
-
Miyajima Chiyomi
The Graduate School Of Information Science Nagoya University
-
Takiguchi Tetsuya
Kobe Univ. Kobe‐shi Jpn
-
Fujimoto Masakiyo
Ntt Communication Science Laboratories Ntt Corporation
-
Fujimoto Masakiyo
Department Of Electronics And Informatics Faculty Of Science And Technology Ryukoku University
-
Yamamoto K
Toyohashi University Of Technology
-
Nishiura Takanobu
Ritsumeikan Univ. Kusatsu‐shi Jpn
-
Yamada T
University Of Tsukuba
-
Miyajima Chiyomi
Nagoya Univ.
-
Takiguchi Tetsuya
Kobe Univ.
-
Kitaoka Norihide
Nagoya Univ.
-
Nishiura Takanobu
Ritsumeikan Univ.
-
Ogawa Tetsuji
Waseda Inst. For Advanced Study Waseda Univ.
-
Tamura Satoshi
Gifu Univ.
-
Nakamura Satoshi
National Institute Of Information And Communications Technology
関連論文
- Fuzzy Cluster Analysis and its Evaluation Method(BIOMETRICS AND ITS APPLICATIONS)
- 長時間分析に基づく位相情報を用いた音声認識の検討 (音声)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(3)(SIG-SLP内組織の活動報告)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(2)(雑音・VAD,第9回音声言語シンポジウム)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境 (2)(雑音・VAD,第9回音声言語シンポジウム)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(第8回音声言語シンポジウム)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(Session-1 検出,第8回音声言語シンポジウム)
- CENSREC-1-C : 雑音下音声区間検出評価基盤の構築
- SLP雑音下音声認識評価WG活動報告 : 評価用データと評価手法について(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 実走行車内音声認識の評価データベースCENSREC-3とその共通評価ベースライン
- 実走行車内単語音声データベースCENSREC-3と共通評価環境の構築
- CENSREC-3 : 実走行車内単語音声データベースと評価環境の構築(ポスターセッション)(第6回音声言語シンポジウム)
- 実環境下音声認識の評価の標準化とその動向(音声・言語における標準化動向)(第6回音声言語シンポジウム)
- Acoustic Feature Transformation Combining Average and Maximum Classification Error Minimization Criteria
- Acoustic Feature Transformation Based on Discriminant Analysis Preserving Local Structure for Speech Recognition
- E-055 VADが音声認識性能に与える影響(E分野:自然言語・音声・音楽)
- 長時間分析に基づく位相情報を用いた音声認識の検討(認識,理解,対話,一般)
- Hidden Conditional Neural Fieldsを用いた音声認識における目的関数と階層的音素事後確率特徴量の検討
- 重要文抽出に基づく講義音声の自動要約
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(2)(雑音・VAD,第9回音声言語シンポジウム)
- Hidden Conditional Neural Fieldsを用いた音声認識の検討
- 距離付きn-gramインデックスによる認識誤りと未知語に頑健な高速検索法
- 雑音下マルチモーダル音声認識評価基盤CENSREC-1-AVの構築
- 音声に含まれるプライバシ情報の保護(センシングウェブ)
- 日本語講義音声コンテンツコーパスの作成と分析
- 複数仮説を考慮した講義音声認識結果の自動整形
- 位相情報を利用した話者識別・照合法の評価(ポスターセッション,第10回音声言語シンポジウム)
- 位相情報を利用した話者識別・照合法の評価(ポスターセッション,第10回音声言語シンポジウム)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(Session-1 検出,第8回音声言語シンポジウム)
- SLP雑音下音声認識評価WG活動報告 : 評価用データと評価手法について(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- SLP雑音下音声認識評価WG活動報告 : 評価用データと評価手法について(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 位相情報を利用した話者識別・照合法の評価(ポスターセッション,第10回音声言語シンポジウム)
- 重要文の連続性を考慮した講義音声の自動要約(チャンキング・要約)
- HMMに基づく音声認識のための音節モデルとtriphoneモデルの比較
- 話速・音韻間距離・尤度と音声認識性能の関係
- 音節モデルによる連続音声認識の性能の検討
- STRAIGHTによるスペクトル包絡特性を用いた連続音節認識
- 雑音重畳音声のフレーム間相関と音声認識性能に関する考察
- 音声知覚実験による音声認識モデル単位の検討
- CENSREC-1-C : An evaluation framework for voice activity detection under noisy environments
- Driver Identification Using Driving Behavior Signals(Human-computer Interaction)
- CENSREC-3 : 実走行車内単語音声データベースと評価環境の構築(ポスターセッション)(第6回音声言語シンポジウム)
- 実環境下音声認識の評価の標準化とその動向(音声・言語における標準化動向)(第6回音声言語シンポジウム)
- 話者の同定を組み込んだニュース音声の認識
- 発話スタイルの違いが音声認識に及ぼす影響についての検討
- 朗読音声と自然発話音声の違いのスペクトル分布, 継続時間分布および認識率による検討
- HMM合成による雑音環境下でのセグメント単位入力HMMのモデル補償法
- 音声認識におけるサンプリング周波数とフロントエンドの違いに対するモデル補償
- 音声認識におけるサンプリング周波数とフロントエンドの違いに対するモデル補償
- セグメント単位入力HMMのコンテキスト依存、混合分布化による連続音声認識
- フロントエンドの違いによる認識性能の比較
- パソコン用連続音声認識クライアント・サーバシステムの実装
- 雑音環境下での音声認識におけるセグメント単位入力HMMの評価
- セグメント統計量を用いた隠れマルコフモデルによる音声認識
- セグメント単位入力の混合分布型HMMの評価
- セグメント単位入力HMMとその評価
- セグメント単位入力HMMと条件付きHMMの比較・評価
- AURORA-2J: An Evaluation Framework for Japanese Noisy Speech Recognition(Speech Corpora and Related Topics, Corpus-Based Speech Technologies)
- CENSREC-3: An Evaluation Framework for Japanese Speech Recognition in Real Car-Driving Environments(Speech and Hearing)
- Evaluation of HRTFs estimated using physical features
- Multiple Regression of Log Spectra for In-Car Speech Recognition Using Multiple Distributed Microphones(Feature Extraction and Acoustic Medelings, Corpus-Based Speech Technologies)
- Evaluation of Combinational Use of Discriminant Analysis-Based Acoustic Feature Transformation and Discriminative Training
- Robust distant speech recognition by combining variable-term spectrum based position-dependent CMN with conventional CMN (Speech) -- (国際ワークショップ"Asian workshop on speech science and technology")
- Linear Discriminant Analysis Using a Generalized Mean of Class Covariances and Its Application to Speech Recognition
- Robust Speech Recognition by Combining Short-Term and Long-Term Spectrum Based Position-Dependent CMN with Conventional CMN
- Robust distant speech recognition by combining variable-term spectrum based position-dependent CMN with conventional CMN
- Acoustic Feature Transformation Based on Discriminant Analysis Preserving Local Structure for Speech Recognition
- Gamma Modeling of Speech Power and Its On-Line Estimation for Statistical Speech Enhancement(Speech Enhancement, Statistical Modeling for Speech Processing)
- Noisy Speech Recognition Based on Integration/Selection of Multiple Noise Suppression Methods Using Noise GMMs
- Multichannel Speech Enhancement Based on Generalized Gamma Prior Distribution with Its Online Adaptive Estimation
- SNR and sub-band SNR estimation based on Gaussian mixture modeling in the log power domain with application for speech enhancements (第6回音声言語シンポジウム)
- SNR and sub-band SNR estimation based on Gaussian mixture modeling in the log power domain with application for speech enhancements (第6回音声言語シンポジウム)
- SNR and sub-band SNR estimation based on Gaussian mixture modeling in the log power domain with application for speech enhancements (第6回音声言語シンポジウム)
- Acoustic Feature Transformation Combining Average and Maximum Classification Error Minimization Criteria
- Driver's irritation detection using speech recognition results (音声・第10回音声言語シンポジウム)
- Driver's irritation detection using speech recognition results (音声言語情報処理)
- Driver's irritation detection using speech recognition results (言語理解とコミュニケーション・第10回音声言語シンポジウム)
- Nonparametric Speaker Recognition Method Using Earth Mover's Distance(Speaker Recognition, Statistical Modeling for Speech Processing)
- Speaker Recognition using a Non-parametric Speaker Model Representation and Earth Mover's Distance
- Speaker Recognition using a Non-parametric Speaker Model Representation and Earth Mover's Distance
- Speaker Recognition using a Non-parametric Speaker Model Representation and Earth Mover's Distance
- An Acoustically Oriented Vocal-Tract Model
- Speaker Recognition by Combining MFCC and Phase Information in Noisy Conditions
- Distant Speech Recognition Using a Microphone Array Network
- Estimation of speaker and listener positions in a car using binaural signals
- Distant-Talking Speech Recognition Based on Spectral Subtraction by Multi-Channel LMS Algorithm
- Response Timing Detection Using Prosodic and Linguistic Information for Human-friendly Spoken Dialog Systems
- NMFとVQ手法による音楽重畳音声の音声認識(音声・言語・音響教育,一般)
- 複数理解候補の保持と効率性・自然性を考慮した応答生成による誤認識に頑健な音声対話戦略とその評価(音声,聴覚)
- 運動障害性構音障害者の発話明瞭度改善に対する音響パラメータを用いた自動推定法 : 歌唱・発声リハビリテーションを介して
- 音声ドキュメント検索のための音節ラティスの拡張とn-gram索引の削減手法(音声検索,第13回音声言語シンポジウム)
- 音声ドキュメント検索のための音節ラティスの拡張とn-gram索引の削減手法(音声検索,第13回音声言語シンポジウム)
- 複数の対話エージェントを用いた音声対話システムの分析と評価
- 複数の対話エージェントを用いた音声対話システムの分析と評価
- 複数理解候補の保持と効率性・自然性を考慮した応答生成による誤認識に頑健な音声対話戦略とその評価
- 音声ドキュメント検索のための音節ラティスの拡張と n-gram 索引の削減手法
- 音声ドキュメント検索のための音節ラティスの拡張と n-gram 索引の削減手法
- 単一対話エージェントと複数対話エージェントを用いた音声対話システムの分析と評価
- Acoustic Model Training Using Pseudo-Speaker Features Generated by MLLR Transformations for Robust Speaker-Independent Speech Recognition
- 少数のステレオデータに基づく特徴量変換による残響除去(雑音対策,認識,理解,対話,一般)