時間拘束条件下での重畳音声分解法の高速化(認識・理解・対話)
スポンサーリンク
概要
- 論文の詳細を見る
本論文は時間拘束条件下での重畳音声分解法とその評価について述べる。本論文の目的は二人の話者による重畳音声を各々の音声にスペクトル領域で分離することである。従来法は自己相関係数で保持された符号帳を利用し、瞬時音響情報と時間拘束条件を用いて音声の分離を行う。従来法の処理の削減のため、木構造符号帳を用いた2段探索アルゴリズムと2種類の処理削減法を提案する。実験としてランダムに選んだ100単語対を各々の話者のスペクトルに分離した。評価はSpectrum Deviation Rateに基づいて行う。従来法では大きさ256の符号帳を用いた時の分離歪みは5.82dBであり、分析フレーム毎に222.23秒の処理時間が必要であった。今回提案した2段探索アルゴリズムでは64×64の木構造符号帳を用いた時、分離歪みは5.49dBであり1.78秒の処理時間となった。この時、分離対象を母音のみと限定したときの分離歪みは4.54dBであった。また、処理削減法を用いる事によって128×32木構造符号帳を用いた時、分離歪みは5.39dB、処理時間は1.01秒の結果を得た。従来法に対し、本論文が提案する木構造符号帳を用いた2段探索アルゴリズムと2種類の処理削減法は0.43dBの分離歪み減少と200倍以上の処理の高速化を実現した。
- 2003-05-23
著者
関連論文
- 距離空間と出現確率時系列の幾何学的性質に基づくセグメント高速探索法(情報検索,情報処理技術のフロンティア)
- 話者認証を用いたX Window施錠システムxvlock : 開発とその評価
- 話者認証を用いたX Window 施錠システム xvlock 開発とその評価(バリアフリーインタフェース, および一般)
- 距離に基づく時系列Active探索法におけるl_p距離の探索効率の比較(音声,聴覚)
- 音声研究の現状と課題
- 音声/非音声区間検出のための自動モデル学習法の評価(音声言語,情報処理技術のフロンティア)
- 複数時系列中の類似セグメント高速探索法 : 3つの時系列に対する実装と評価(認識,理解,対話,一般)
- 類似セグメント探索RDDS法の評価(第8回音声言語シンポジウム)
- 類似セグメント探索RDDS法の評価(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 類似セグメント探索RDDS法の評価(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 音声研究会報告 : 解説と展望
- ジュニアスイマーにおける血中乳酸濃度及びストロークパラメータの測定を利用したトレーニングサポート(1)
- 音声/非音声区間検出のための自動モデル学習法の評価(特徴量, 区間検出)
- 譜面情報による楽曲の特徴付けの検討
- 字幕表示のためのVCMLプロジェクトの研究開発の現状 : 環境情景音表示とVCML文書の木構造化
- VCML Player字幕生成のための笑い声の検出
- VCML Player 字幕生成のための笑い声の検出
- 字幕表示システムVCML Playerの新機能について
- 音声と音楽のセグメンテーションの最適化
- 音楽と音声のセグメンテーションの最適化
- SP2000-17 Cepstrum Fluxを用いた音声と音楽のセグメンテーション
- 1K-4 標本化周波数識別法の雑音下音声に対する評価
- 音声の標本化周波数の自動識別方法
- 時間拘束条件下での重畳音声分解法の高速化(認識・理解・対話)
- 時間拘束条件下でのモデルを用いた重畳音声分解法
- 時間拘束条件下でのモデルを用いた重畳音声分解法
- パワー情報を用いた楽曲検索法
- SP2000-16 楽曲の高速検索手法の検討
- 時系列の歪み一定区分化法とセグメント探索における評価(一般, 一般, チュートリアルレクチャー)
- 字幕表示のための音声とテキストの自動対応付け手法とその評価
- Cepstrum Fluxを用いた音声区間の検出
- 話者認識を用いたコンピュータセキュリティシステムの評価
- 音響シーンセグメンテーション法の検討
- 音声/非音声判別法を用いた時間圧縮音声再生法(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 音声/非音声判別法を用いた時間圧縮音声再生法(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 音声/非音声判別法を用いた時間圧縮音声再生法(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 音声認識のためのマルチマイクロホンシステム : 第2部 超接話マイクロホンと音声認識実験結果
- セグメント高速探索法とその評価(Session-2 情報検索, 第7回音声言語シンポジウム)
- セグメント高速探索法とその評価(Session-2 情報検索, 第7回音声言語シンポジウム)
- セグメント高速探索法とその評価(Session-2 情報検索, 第7回音声言語シンポジウム)
- Video Caption Player 2.4 : 複数字幕同時表示機能の追加(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- 書き起しテキストのある音声ドキュメントの検索
- 音声とテキストの自動対応付けによる音声インデキシング手法とその評価(要約, 検索, 認識・理解・対話・一般)
- テキスト情報を利用した音声インデキシング
- 長時間音声字幕化のための朗読単位への区分化
- 字幕表示用言語VCMLの設計とその表示システムの開発
- 字幕自動生成における字幕と音声の時間軸整合の検討
- 任意個数の時系列に含まれる類似部分探索法(システム,第9回音声言語シンポジウム)
- 任意個数の時系列に含まれる類似部分探索法(システム,第9回音声言語シンポジウム)
- 任意個数の時系列に含まれる類似部分探索法(システム,第9回音声言語シンポジウム)
- 音声区間検出のためのVQ符号帳の自動学習
- 時間拘束条件下でのモデルを用いた重畳音声分解法
- 出現確率の幾何学的性質を用いたセグメント高速探索法(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 出現確率の幾何学的性質を用いたセグメント高速探索法(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- Active探索におけるノルムと類似度との関係(聴覚・音声・言語とその障害, 一般)
- 音響情報の検索
- 複数時系列中の類似セグメント高速探索法(情報検索)
- 類似セグメント高速探索法における球被覆の検討(認識,理解,対話,一般)
- 距離に基づくActive探索法の計算量について(認識・理解・対話・一般)
- 複数時系列中の類似セグメント探索法の提案と評価(聴覚・音声・言語とその障害,一般)
- Active探索法による出現確率時系列の区分化とクラスタリング(一般, STRAIGHTスペシャルセッション(SS))
- 5N-9 手話パターン間距離の導出
- 2T-2 インターネット対応音響効果支援ツールキットの開発
- セグメントの高速探索法
- セグメントの高速探索法
- Java言語を用いたInternet対応しりとりゲーム
- ビデオデータにおける指定人物の検出と追跡 : 音声部分を用いた処理
- 音響シーンセグメントの接続の検討