音声と非音声の識別処理に基づく定常雑音抑圧方式
スポンサーリンク
概要
- 論文の詳細を見る
入力信号を音声とそれ以外の信号(非音声)に識別して, 定常雑音を効率的に抑圧する方式を提案した。音声と非音声の識別には, 入力信号の周期性を表す特徴量, 信号スペクトル特徴, パワーなどを用いた。雑音抑圧処理は, スペクトルサブトラクション(SS)とロスコントロール(LC)を併用した。SSでは, 周波数重みづけによって雑音を差し引くこととし, また, LCはSSで消し残った残留雑音を損失制御することによって無音区間の残留雑音を完全に除去した。種々の雑音を用いて評価実験を行った結果, 信号対雑音比が10dB程度以上の雑音条件下で良好な動作をすることを示した。また, 本方式をマルチマイク集音系と組み合わせることによって更に性能を向上させることを示した。更に, 聴覚障害者による数字了解度試験を実施し, 提案した雑音抑圧処理が難聴者の聴こえに非常に有効であることを示した。
- 社団法人日本音響学会の論文
- 2005-08-01
著者
-
北脇 信彦
筑波大学大学院
-
伊藤 憲三
岩手県立大学ソフトウェア情報学部
-
伊藤 憲三
Ntt研究所
-
伊藤 憲三
岩手県立大
-
水島 昌英
国際電気通信基礎技術研究所音声言語コミュニケーション研究所
-
北脇 信彦
筑波大 電子・情報工学系
-
水島 昌英
Nttヒューマンインタフェース研究所
-
北脇 信彦
NTT電気通信研究所
-
水島 昌英
国際電気通信基礎技術研究所
関連論文
- 映像品質と音声品質との相互作用を考慮したマルチメディア品質の推定モデル(マルチメディア(システム/通信/ネットワーク),放送通信連携サービスとその品質,一般)
- 映像品質と音声品質との相互作用を考慮したマルチメディア品質の推定モデル(画像処理・品質確保,マルチメディア(システム/通信/ネットワーク),放送通信連携サービスとその品質,一般)
- 楽音と音声の双方に適用できる客観品質推定尺度の検討(ワイヤレス環境でのアプリケーション品質,P2P/アドホックネットワーク,画像符号化ストリーム技術,信頼性,一般)
- IP電話における中国・日本・欧米のMOS評価特性の比較(五感メディア,映像/音声サービスの品質,ネットワークの品質・QoS制御,次世代ネットワークアーキテクチャ,仮想空間におけるユーザコミュニケーション,一般)
- 再帰的画面分割を用いた肢体不自由者向けポインティング補助手法の開発と評価(肢体障害・聴覚障害,HCGシンポジウム)
- 1Y-9 Google Mapsを利用した調査支援システムの開発(ユーザインタフェース,学生セッション,インタフェース)
- TKA術前計画における骨参照情報を利用したレジストレーション手法(一般セッション,映像ハンドリング技術とその応用)
- 2Y-5 円周分割入力方式における入力切り替え方式の検討(入出力インタフェース,学生セッション,インタフェース)
- 1Y-7 画面拡大による高齢者のためのポインティング操作支援手法に関する研究(ユーザインタフェース,学生セッション,インタフェース)
- 3Q-5 携帯電話のメール機能を利用した生活音識別システムの検討(音声の分析・合成,学生セッション,人工知能と認知科学)
- 生活音識別システムにおける識別結果呈示法に関する研究(識別・同定,システムLSIの応用と要素技術,プロセッサ,DSP,画像処理技術及び一般)
- 事前登録型生活音自動識別システム(聴覚・音響信号処理/一般)
- 6ZC-2 被写体を想起させる映像の時間的低解像度化に関する検討(コミュニケーション,学生セッション,インターフェース)
- 5ZC-3 円周分割入力方式における誤入力を許容する候補語選択に関する研究(モバイル,学生セッション,インターフェース)
- 5ZC-2 円周分割入力方式におけるサウンドフィードバックの効果の検証(モバイル,学生セッション,インターフェース)
- 5ZC-1 円周分割入力方式における精度向上のための拡大調整機能の検討(モバイル,学生セッション,インターフェース)
- 5ZL-3 注視情報に基づく画像理解のための着目領域の抽出に関する研究(視線解析,学生セッション,人工知能と認知科学)
- 2W-1 カラライゼーションにおけるLuPCモデルの有効性に関する検討(画像処理基礎,学生セッション,人工知能と認知科学)
- 2S-7 地方都市における犯罪多発地域に基づく地区の類型化(科学データベースとメディア,学生セッション,データベースとメディア)
- 2S-4 Google Mapによる水稲危機情報の効果的な提示に関する研究(科学データベースとメディア,学生セッション,データベースとメディア)
- 身体特徴と声質との関連性に関する一検討
- D-14-28 身体特徴と声質との関連性に関する一検討
- D-11-128 Hough空間における投票ヒストグラムを利用したFAX帳票識別(D-11.画像工学D)
- D-11-97 フィルムの粒状感に基づいたディジタル画像の質感改善(D-11.画像工学D)
- ラジオとインターネットのメディア連携に関する一考察(セッション2:放送とネットワーク技術)
- ラジオとインターネットのメディア連携に関する一考察
- B-11-1 IP網における音声の客観品質評価に用いる擬似音声信号の検討(B-11.コミュニケーションクオリティ,一般セッション)
- D-12-168 最頻動きベクトルを利用したニュース速報テロップの除去(D-12. パターン認識・メディア理解B)
- D-14-2 MRI 解析を利用した顔画像からの声道長推定
- ヒューマノイドロボットHRP-2における音響情報と画像情報を統合したリアルタイム音声インタフェース(システム論文特集号)
- マイクロホンアレイと音源定位を用いた会議録再生システムについて(立体音響・音場制御/聴覚/一般)
- 高次統計量の分布モデルを用いた音声・環境音識別法の検討(音声・音響処理)
- 高次統計量の分布モデルを用いた音声・環境音識別法の検討(音声・音響処理)
- A-19-8 タッチパネルのための音像定位インタフェースの検討(A-19.福祉情報工学,一般セッション)
- 講義のユニバーサルデザインを目指した情報提示方法に関する検討(障害者教育/一般)
- 2S-3 GISによる琵琶湖への河川流入負荷量推定シミュレーション(科学データベースとメディア,学生セッション,データベースとメディア)
- TKA術前計画における骨参照情報を利用したレジストレーション手法(一般セッション,映像ハンドリング技術とその応用)
- TKA術前計画における骨参照情報を利用したレジストレーション手法(一般セッション,映像ハンドリング技術とその応用)
- ラジオとインターネットのメディア連携に関する一考察(セッション2:放送とネットワーク技術)
- B-11-2 雑音抑圧音声の総合品質推定モデルを適用したフルリファレンス客観品質評価法(B-11.コミュニケーションクオリティ,一般セッション)
- B-11-11 時間離散ひずみの評価を考慮した擬似音声信号の検討(B-11.コミュニケーションクオリティ,一般セッション)
- B-11-12 中国と日本のMOS評価特性の比較(B-11.コミュニケーションクオリティ,一般セッション)
- BS-8-3 雑音抑圧音声の品質推定モデルを用いたノンリファレンス客観品質評価法(BS-8.次世代ネットワークにおける新たなサービス提供を目指したQoS関連技術,シンポジウムセッション)
- BS-8-4 映像品質と音声品質との相互作用を考慮したマルチメディア品質の推定モデル(BS-8.次世代ネットワークにおける新たなサービス提供を目指したQoS関連技術,シンポジウムセッション)
- D-14-7 ETSI標準雑音抑圧フロントエンドのための雑音推定法の検討(D-14. 音声,一般セッション)
- 雑音抑圧音声の品質推定モデルとそのノンリファレンス客観品質評価への適用(NW管理,次世代NWアーキテクチャ,次世代NWのオペレーションアーキテクチャ,トラヒック計測・モデリング・品質,オーバレイネットワーク,次世代NWサービス品質,一般)
- 映像品質と音声品質との相互作用を考慮したマルチメディア品質の推定モデル
- 映像品質と音声品質との相互作用を考慮したマルチメディア品質の推定モデル(画像処理・品質確保,マルチメディア(システム/通信/ネットワーク),放送通信連携サービスとその品質,一般)
- 映像品質と音声品質との相互作用を考慮したマルチメディア品質の推定モデル(画像処理・品質確保,マルチメディア(システム/通信/ネットワーク),放送通信連携サービスとその品質,一般)
- 装置劣化要因の品質評価に用いるテスト信号の検討(五感メディア,映像/音声サービスの品質,有線無線ネットワークの品質・QoS制御,次世代ネットワークアーキテクチャ,一般)
- 認識対象語彙数を考慮した雑音下孤立単語認識の性能推定(耐雑音性)
- CT画像からの立位三次元膝関節モデルの生成手法
- 1U-2 気導と骨導の加算処理を利用した環境騒音低減法に関する一検討(音声分析・強調,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 回帰面による輝度画像のエッジ抽出法
- D-11-88 濃淡画像からの色相領域分割における領域形状の客観的評価(D-11.画像工学D)
- 音声コミュニケーションに関わるバリアフリー(音支援(音バリアフリー)を考える)
- 1N-8 周期的な動作を伴う機械の異常診断システムに関する一検討(システム評価,学生セッション,ソフトウェア科学・工学,情報処理学会創立50周年記念)
- K-021 携帯メール機能を用いた事前登録型生活音自動識別システム(教育工学・福祉工学・マルチメディア応用,一般論文)
- E-048 ウイグル語単音節の出現頻度とその特徴分析(自然言語・音声・音楽,一般論文)
- 生活音識別システムにおける識別結果呈示法に関する研究(識別・同定,システムLSIの応用と要素技術,プロセッサ,DSP,画像処理技術及び一般)
- 生活音識別システムにおける識別結果呈示法に関する研究(識別・同定,システムLSIの応用と要素技術,プロセッサ,DSP,画像処理技術及び一般)
- HMMとMFCCを用いた楽器音の音源同定の検討
- DSP処理を目的とした簡便な雑音抑圧処理に関する検討
- 雑音下音声認識の性能推定のためのひずみ尺度の検討(雑音・VAD,第9回音声言語シンポジウム)
- 雑音下音声認識の性能推定のためのひずみ尺度の検討(雑音・VAD,第9回音声言語シンポジウム)
- 雑音下音声認識の性能推定のためのひずみ尺度の検討(雑音・VAD,第9回音声言語シンポジウム)
- 音楽聴取を目的とした補聴システムにおけるフィッティング手法の検討
- D-14-1 声道特性(声道長)が個人性知覚に及ぼす影響
- 室内伝達関数の高次項消去による残響歪低減法
- 音声認識技術の利用形態とその性能評価に関する一検討
- 音声認識技術の利用形態とその性能評価に関する一検討
- B-11-12 QoE評価に用いる標準音声データベースとその特徴量の分析(B-11. コミュニケーションクオリティ,一般セッション)
- BT-1-3 超高速インターネット衛星WINDS「きずな」を用いたアジアの大学との遠隔教育実験(BT-1.新たな衛星利用、衛星応用,チュートリアルセッション,ソサイエティ企画)
- IP電話の通話音質評価(音響配信及び通信における音質変化とその評価)
- 音メディア通信サービスの未来を読む
- IPネットワークサービスを支える音声・音響技術の歴史と発展(信号処理, 符号化とそれらを用いた知的マルチメディアシステム, 一般)
- IPネットワークサービスを支える音声・音響技術の歴史と発展(信号処理, 符号化とそれらを用いた知的マルチメディアシステム, 一般)
- IPネットワークサービスを支える音声・音響技術の歴史と発展(信号処理, 符号化とそれらを用いた知的マルチメディアシステム, 一般)
- B-11-35 平均非対称妨害密度を用いたI_の算出(B-11. コミュニケーションクオリティ, 通信2)
- コンデンサマイクロホンの拡散音場感度の検討
- 音声と非音声の識別処理に基づく定常雑音抑圧方式
- 音声の音響的特徴量に着目した難聴者のための自動利得制御の検討
- 自動利得制御と雑音抑圧処理が難聴者の音声知覚に及ぼす影響
- 事前登録型生活音自動識別システム
- 聴覚障害者支援を目的とした生活音識別システム
- 気導音と骨導音の蝸牛加算モデルに関する一検討
- メディカル CT画像からの立位三次元膝関節モデルの生成手法
- 回帰面を用いた高精度なエッジ抽出法
- D-14-4 声道模型を用いた個人性知覚に関する検討(D-14. 音声・聴覚)
- D-14-16 フレーム正規化対数尤度に基づく信頼度を用いた単語レベルの認識結果の統合(D-14. 音声・聴覚, 情報・システム1)
- B-11-19 未知広帯域音声codecの符号化歪み指標Ie,wb算出法に関する一検討(B-11.コミュニケーションクオリティ,一般講演)
- 雑音抑圧処理音声に対する人間の認識率の検討及びPESQを用いた客観推定(ブロードバンドと放送のコンテンツ/セキュリティ/信頼性/モバイル, 及び一般)
- 雑音抑圧手法の主観・客観品質と音声認識性能の関係(ポスターセッション)(第6回音声言語シンポジウム)
- 雑音抑圧手法の主観・客観品質と音声認識性能の関係(ポスターセッション)(第6回音声言語シンポジウム)
- 雑音抑圧手法の主観・客観品質と音声認識性能の関係(ポスターセッション)(第6回音声言語シンポジウム)
- モバイル音声通信のための雑音抑圧手法の主観・客観品質評価(モバイルサービス,サービス品質,一般)
- モバイル音声通信のための雑音抑圧手法の主観・客観品質評価(モバイルサービス,サービス品質,一般)
- B-11-18 装置劣化要因を考慮したマルチメディア品質の推定モデル(B-11.コミュニケーションクオリティ,一般講演)
- B-11-7 符号化パラメータを用いたAV通信品質推定のオピニオンモデル(B-11. コミュニケーションクオリティ, 通信2)
- オーディオビジュアル通信における音情報と映像情報の相互関係(モバイル,コンテンツ,セキュリティ,信頼性,一般)