2つのスペクトログラムを用いた画像処理による混合音声の分離に関する研究
スポンサーリンク
概要
- 論文の詳細を見る
We propose a method for separating speeches using two spectrograms. First, two spectrograms are generated from voices recorded with a pair of microphones. The onsets and the offsets of the frequency components are extracted as the features using image processing techniques. Then the correspondences of the features between the spectrograms are determined and the intermicrophone time differences are calculated. Each of frequency components with the common onset/offset occurrences and time difference are grouped together as originating one of the speech signals. A set of band-pass filters are generated corresponding to each group of frequency components. Finally, each of the separated speech signals is extracted by applying the set of band-pass filters to the voice signal recorded by a microphone. Experiments were conducted with the mixture of a male speech sound and a female speech sound consisting of Japanese vowel and contain consonant. The evaluation results demonstrated that the separation was done reasonably well with the proposed method.
- 社団法人 電気学会の論文
- 2004-12-01
著者
-
杉江 昇
名城大学理工学部情報工学科
-
旭 健作
名城大学理工学部
-
旭 健作
名城大学大学院理工学研究科
-
佐川 雄二
名城大学大学院理工学研究科
-
杉江 昇
名城大学大学院理工学研究科
-
杉江 昇
名古屋大学
-
旭 健作
名城大学大学院理工学研究科情報工学専攻
-
佐川 雄二
名城大学理工学部情報工学科
-
樋口 寛晃
名城大学大学院 理工学研究科
-
杉江 昇
名城大学
-
旭 健作
名城大学大学院 理工学研究科 情報工学専攻
関連論文
- スペクトログラムを利用した音声の雑音低減法
- AS-2-6 スペクトログラムによる音声の雑音低減(AS-2. 画像・音声認識に関する最近の応用技術, 基礎・境界)
- 多角的造形手段を備えた仮想レリーフシステムの提案
- 雑音低減・鮮鋭度向上・動き補償を学習した時空間ニューラルフイルターによるX線透視像の高画質化
- 自動車用ヘッドアップディスプレイ(HUD)にみられる「3次元的に空間に位置する視距離が異なる視対象」の認識(ヒューマンインフォメーション)
- 視覚シミュレータを用いた道路情報板における文字フォントに関する研究
- 視覚シミュレータを用いた道路情報板における文字フォントに関する研究 (ITS研究会 テーマ「交通管理と情報システム」)
- LED式屋外型表示装置における夜間視認性の向上 : 微弱背景光による輝度コントラストの最適化
- LED式車載標識装置における夜間視認性の向上
- LED式車載標識装置における夜間視認性の向上(セッション5,ITS情報処理・一般)