0-paddingを用いた短時間窓がけスペクトル群からの長時間窓がけスペクトルの合成による複数窓長解析の計算量削減(音声,聴覚)
スポンサーリンク
概要
- 論文の詳細を見る
非定常信号に対する周波数解析では,短時間フーリエ変換(STFT)がよく用いられる.しかし,解析時の分解能はフレーム長で規定されるため,必要とする時間-周波数分解能を一つのフレーム長で確保できないとき,複数種のフレーム長で解析する場合があり,計算量が膨大となる.従来,STFTの計算量削減に関して様々な提案がなされているが,複数分解能による反復解析時の計算冗長性に着目した研究は行われていない.本論文では,このような複数窓長解析の計算量削減のために,複数の短いフレーム長の窓がけスペクトルから,様々な長いフレーム長の窓がけスペクトルを直接合成する手法を提案する.まず,複数の短時間窓関数から同一形式の長時間窓関数を合成できれば,異なるフレーム長のスペクトルが合成可能であることを明らかにする.次に,実際にHanning, Blackman, Nuttall窓関数を合成し,この合成窓関数と元の窓関数を比較することで窓関数合成の妥当性を示し,更に実信号を用いたスペクトルの合成精度を示すことで,提案するスペクトル合成法の妥当性を評価する.最後に,提案手法によって計算量削減が可能であることも示す.
- 2013-09-01
著者
関連論文
- A-1-8 ダイナミック・リコンフィギャラブル技術の音声復号における適用(A-1. 回路とシステム, 基礎・境界)
- A-1-39 ダイナミック・リコンフィギャラブル技術の音声復号における適用(A-1. 回路とシステム)
- 言語学におけるカテゴリー構造の複雑系多値論理解析
- D-5-4 映画の内容に基づくタイトル検索(D-5.言語理解とコミュニケーション,一般セッション)
- D-14-6 波形編集型音声合成法における調音結合部での素片接続に関する一検討(D-14.音声,一般セッション)
- 多義の単語のセットからの共通概念の抽出
- D-14-13 学習データに依存した最適な音声単位の自動獲得
- N-26 簡単なCPUを用いたハードウェア教育(情報技術教育,N.教育・人文科学)
- D-12-93 エッジ部における奥行き推定のための三次元エッジトラッキング法の一検討(D-12.パターン認識・メディア理解,一般セッション)
- D-14-1 音声の静的・動的特徴に着目したSUSサブワードの提案(D-14.音声,一般セッション)
- D-5-11 読み上げのための小説への感情タグ付け(D-5.言語理解とコミュニケーション,一般セッション)
- D-5-10 動詞に着目した算数問題解決システムの頑健性の向上(D-5.言語理解とコミュニケーション,一般セッション)
- D-5-9 時系列情報に着目した複数のL^AT_EX文書の自動要約(D-5.言語理解とコミュニケーション,一般セッション)
- A-4-26 窓がけ信号に対する短時間スペクトルからの長時間スペクトルの合成法(A-4.信号処理,一般セッション)
- 行動選択確率に基づく動的強化関数を用いた強化学習手法(人工知能,認知科学)
- D-6-1 ターゲットの変更が可能な命令スケジューラに関する研究
- C-12 ターゲットの変更が可能な命令スケジューラに関する研究(計算機アーキテクチャと最適化,C.アーキテクチャ・ハードウェア)
- G-24 株式市場において外部環境により売買判断の多様性を生む投資家モデルの提案(人工知能(一般),G.人工知能)
- D-8-15 画像・音声メディアを用いた言語概念獲得モデルにおける学習効率の評価
- トレーダの取引行動の遅延を要因として複雑さを生じる市場モデル(知識処理・知識コミュニティ)
- トレーダの取引行動の遅延を要因として複雑さを生じる市場モデル(一般 : マルチエージェントと学習)
- トレーダの取引行動の遅延を要因として複雑さを生じる市場モデル(一般(マルチエージェントと学習))(「社会システムにおける知能」及び一般)
- D-15-1 COMET-II互換プロセッサ上におけるリアルタイムOS演習の為のデバッグ環境の開発(D-15. 教育工学)
- D-11-114 時系列画像を用いた画像状況に適した統合によるオプティカルフロー抽出精度向上
- C-11 分岐履歴を用いた条件付き双方向パスの考察(計算機アーキテクチャと最適化,C.アーキテクチャ・ハードウェア)
- C-2 アプリケーションプログラムを基にしたプロセッサアーキテクチャの自動生成(FPGA,C.アーキテクチャ・ハードウェア)
- C-1 COMET-II互換プロセッサによるCPU設計演習環境の開発(FPGA,C.アーキテクチャ・ハードウェア)
- B-39 COMET-II互換プロセッサ上におけるITRON仕様OSに関する研究(リアルタイムと分散共有メモリ,B.ソフトウェア)
- B-38 ITRON仕様カーネルのレディキューに関する性能比較(リアルタイムと分散共有メモリ,B.ソフトウェア)
- I-42 時系列画像を用いたオプティカルフロー抽出精度向上(ステレオ・オプティカルフロー,I.画像認識・メディア理解)
- 思考過程の内部観測によるカテゴリー構造の言語学的多値論理解析
- 言語学におけるカテゴリー構造の複雑系多値論理解析
- 言語学におけるカテゴリー構造の複雑系多値論理解析
- 思考過程の内部観測によるカテゴリー構造の言語学的多値論理解析
- Circle Packingを用いた不定間隔サンプリング画像による文字列CAPTCHA(ヒューマンコンピュータインタラクション)
- 統計的手法に基づいた画像・音声情報からの概念獲得(一般 : データマイニングII)
- 統計的手法に基づいた画像・音声情報からの概念獲得(一般(データマイニングII))(「社会システムにおける知能」及び一般)
- D-4-16 単文内自立語間共起の相互情報量を用いた文書自動分類
- G-26 人間-エージェント間対話による画像・音声刺激からの言語シンボル概念獲得に関する研究(人工知能(一般),G.人工知能)
- 画像・音声メディアによる人間対計算機間の対話からの物体概念獲得
- 画像・音声メディアによる人間対計算機間の対話からの物体概念獲得
- 画像・音声情報により表現される知識の整合性保持を目的とした人間-計算機間対話モデル
- D-8-5 画像・音声情報からの概念獲得を目的とした刺激場を用いた複数話者間対話モデル
- 画像・音声情報により表現される知識の整合性保持を目的とした人間-計算機間対話モデル
- 画像・音声情報により表現される知識の整合性保持を目的とした人間-計算機間対話モデル
- 単文内自立語間共起ネットワークによる話題情報表現を用いた文書検索
- 単文内自立語感共起ネットワークによる話題情報表現を用いた文書検索
- マスメディア上の音響信号からのリアルタイム楽曲スポッテイング
- マスメディア上の音響信号からのリアルタイム楽曲スポッティング
- D-12-74 Body Motion Signatureによる3次元動画像個人認証(D-12.パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス),一般セッション)
- D-11-26 Light Field Rendering法を用いた3次元エッジ抽出についての一検討(D-11.画像工学,一般セッション)
- A-10-13 楽曲構成要素の時空間局在性を考慮した多重時空間分解能分析に関する一検討(A-10.応用音響,一般セッション)
- A-4-15 複数解像度Gabor Wavelet変換のためのGaussianの畳み込みを用いたWavelet係数合成法(A-4.信号処理,一般セッション)
- 0-paddingを用いた短時間窓がけスペクトル群からの長時間窓がけスペクトルの合成による複数窓長解析の計算量削減(音声,聴覚)
- D-12-41 カメラアレイ合成画像の光線探索を用いた3次元エッジ抽出についての一検討(D-12.パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス))
- MLB詳細スコアデータから学習した試合構成要素群間の確率的因果構造に基づく野球投手の投球戦術推定(社会システムと情報技術研究)
- H-050 粗間隔なカメラアレイで取得したLight Fieldを利用した合焦法による奥行き推定の一検討(H分野:画像認識・メディア理解,一般論文)