8-3 倍音構造に基づいた警告音の認識(第8部門メディア処理2)
スポンサーリンク
概要
- 論文の詳細を見る
We propose a system for recognizing horn and siren sounds. We calculate the degree of harmonic structure from the amplitude spectrum and search its peaks. The peak frequency corresponds to the fundamental frequency of warning sounds. The experimental results show the method can detect warning sounds in SNR of 0dB.
- 一般社団法人映像情報メディア学会の論文
- 2011-08-24
著者
-
松本 哲也
名古屋大学大学院
-
Takeuchi Yoshinori
Graduate School Of Information Science Department Of Media Science Nagoya University
-
竹内 義則
Department Of Media Sience Graduate School Of Information Science Nagoya University
-
板垣 達也
名古屋大学大学院情報科学研究科メディア科学専攻
-
竹内 義則
名古屋大学 情報セキュリティ対策推進室
-
工藤 博章
名古屋大学大学院工学研究科情報工学専攻
-
大西 昇
名古屋大学
-
竹内 義則
大同大学
-
竹内 義則
名古屋大学情報科学研究科メディア科学専攻
関連論文
- 難聴者のための,会議における発言聴取支援システム(肢体障害・聴覚障害,HCGシンポジウム)
- 視聴覚事象の中心的事例の教師なし学習
- 重なり合う物体の輪郭線抽出 : 頂点組み合わせ決定と輪郭線生成の改良
- A-19-13 聴覚障害者の講義におけるハウリング音の位置検出(A-19.福祉情報工学,一般講演)
- 安全運転支援のための緊急自動車のサイレン音の検出
- 指示語に対応する指示対象抽出による遠隔パソコン要約筆記者支援の提案
- 曲面に書かれた文字の抽出(テーマセッション: マルチメディアコンテンツ, データ工学とメディア理解との融合)
- 小数標本時における階層型ニューラルネットの汎化能力の実験的評価-胃X線二重造影像の場合-
- webページ中のテキストと表からの重要個所抽出
- E-18 Webページの主題推定(情報抽出,E.自然言語・文書)
- タッチパネル操作における視覚障害者の指の誘導法(聴覚と福祉情報工学・一般)
- 画像内のオブジェクトに注目した画像内容検索(一般セッション(2))
- 指向性マイクロホンの近接配置における周波数領域ブラインド音源分離の性能評価(電気音響,音響一般)
- 時系列キー入力データの分析結果に対する一考察
- 動画間の差異検出に基づくスポーツフォーム教示システム(一般,顔・人物・ジェスチャ・行動)
- 動画間の差異検出に基づくスポーツフォーム教示システム(一般,顔・人物・ジェスチャ・行動)
- スーパーピクセルを用いた対応付けによる室内の領域分割(一般セッション1)
- スーパーピクセルを用いた対応付けによる室内の領域分割(一般セッション1,三次元画像,多視点画像)
- スーパーピクセルを用いた対応付けによる室内の領域分割(一般セッション1,三次元画像,多視点画像)
- A-10-7 移動音源存在時の指向性マイクを利用したブラインド音源分離
- 分離パラメータ収束点推定を用いた源信号分離の収束性能の向上
- ラベル要素検出とモデル照合による商品棚ラベル認識(一般セッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- ラべル要素検出とモデル照合による商品棚ラべル認識(一般セッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 大規模画像処理のための並列協調型ニューラルネットワークの一実現方式
- 視覚障害者向け商品情報取得システム
- 視覚障害者の共有資料観覧支援システム
- 生物に示唆を得た選択的注意による視聴覚事象の対応付け手法
- 事前学習を用いないオンラインでの話者識別(聴覚・音声・言語とその障害,一般)
- 物体操作による視聴覚事象の対応付け
- 事前学習を用いないオンラインでの話者識別
- 類似画像検索における部分教師付き特徴次元圧縮
- 物体操作による視聴覚事象の対応付け(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- 検索 : 組合せ法を用いた単眼画像からの三次元人物姿勢推定(テーマ関連セッション2)
- 検索-組合せ法を用いた単眼画像からの三次元人物姿勢推定(テーマ関連セッション,事例ベースメディア解析)
- 実環境音源分離におけるフィルタタップ数の低減手法
- 実環境音源分離におけるフィルタタップ数の低減手法
- A-10-6 マイクの近接配置による音源分離の性能評価と考察
- 運動で生じた視聴覚事象の対応付け(映像メディアおよび一般 : インターネット, デジタル放送, マルチメディア, 三次元画像, 視覚と画質評価, ITS等)
- 運動で生じた視聴覚事象の対応付け
- 運動で生じた視聴覚事象の対応付け
- F-13 指向性マイクを利用した移動音源分離(音声・音声言語情報処理,F.音声・音楽)
- 並列協調型ニューラルネットワークの実装と画像処理への応用
- 計算機群の同時稼働環境における大規模画像処理のための並列協調型ニューラルネットワーク
- Teager Energy Operatorを使用した音声感情認識(一般, STRAIGHTスペシャルセッション(SS))
- 感情に関係する特徴量の検討(視聴覚情報処理及び一般)
- 振動子を用いた感情モデルとそのロボットへの応用
- 振動子を用いた情動モデルとそのロボットへの応用
- A-19-14 伝音難聴者のための会議聴取支援システムの提案(A-19.福祉情報工学,一般講演)
- 感情に関係する特徴量の検討
- 視覚障害者のための環境内文字情報獲得支援システムにおける文字列抽出率の向上と音声出力の順位付け(ヒューマンインフォメーション)
- 視覚障害者のための環境内の文字情報抽出システム
- 視覚障害者のための環境内の文字情報伝達システム抽出精度の向上と音声出力の順位付け(テーマセッション(2))(ユビキタスコンピューティングのためのパターン認識・理解)
- 囲碁盤面の評価方法(セッション(2) : ゲーム情報学(2))
- 単語の頻度統計を用いた文章の類似性の定量化 : 部分的類似性の考慮(自然言語処理)
- 視覚障害者のための環境内の文字情報抽出システム : 音声出力における順位付け
- 視覚障害者のための環境内の文字情報抽出システム : 音声出力における順位付け(自動車・交通におけるコミュニケーション&インターフェース : 人にやさしい交通をめざして)
- 視覚障害者のための環境内の文字情報抽出システム : 音声出力における順位付け(自動車・交通におけるコミュニケーション&インターフェース : 人にやさしい交通をめざして)
- 視覚障害者のための環境内の文字情報抽出システム : 音声出力における順位付け(自動車・交通におけるコミュニケーション&インターフェース : 人にやさしい交通をめざして)
- ロボットへの物体位置伝達を目的とした指差し動作と指示代名詞の併用
- 音源数の変化を伴う音源分離(研究速報)
- 音源数の変化を伴う音源分離(アレー信号処理・音響計測/一般)
- マイクの近接配置における周波数領域ブラインド音源分離の性能評価(音響信号処理/一般)
- マイクの近接配置における周波数領域ブラインド音源分離の性能評価(音響信号処理/一般)
- 囲碁の中盤における評価関数
- D-8-2 コンピュータ囲碁における眼型計算法
- G-30 コンピュータ囲碁 : 人間の直感に近い勢力計算モデル(人工知能(一般),G.人工知能)
- e-Learningにおけるベイジアンネットワークを用いた学習者特性の推定(新しいインターネット技術の教育環境への利用/一般)
- 非線形な制御対象での音源定位能力の自己組織的獲得
- 聴覚障害者のための警告音の識別(聴覚・音声・言語とその障害, 一般)
- VR手法による柔軟物体のソリッドモデリング
- マイクロホンアレーによるクラクションの同時定位(音響・超音波サブソサイエティ合同研究会)
- 大規模分散型情報処理教育システムの一構成方法
- A-4-47 実環境音源分離におけるタップ数の低減
- WEBベース学習における学習履歴に基づく統計的学習者モデルの構築( 遠隔教育/一般)
- 頻度統計と概念辞書を用いた文章の類似性の定量化
- E-19 文章の類似性の定量化(情報抽出,E.自然言語・文書)
- リカレントニューラルネットによる時系列顔表情からの特徴抽出
- A-19-7 道路の白線を利用した視覚障害者歩行支援システム
- 視覚障害者のための環境内の文字情報理解支援システム
- 視覚障害者のための環境内の文字情報理解支援システム
- 視覚障害者のための環境内の文字情報理解支援システム
- 3D地図を利用した写真中の山名提示システム
- 画像内のオブジェクトに注目した画像内容検索
- リカレントニューラルネットワークによる系列画像処理の検討
- スティックスリップ音の不快要因 : ピーク周波数と包絡線
- 色覚異常のための代表色の分布に基づいた画像変換
- 視覚障害者の商品情報取得を支援する画像-音声変換システム(視聴覚技術,ヒューマンインタフェース)
- オブジェクトと背景への画像の領域分割(視聴覚技術,ヒューマンインタフェース)
- 特徴空間の自動構築に基づく類似画像検索システム
- 視覚障害者のための環境内の文字情報抽出システム
- A-19-5 文字情報を手がかりとした視覚障害者用環境理解支援システム
- A-19-5 文字情報を手がかりとした視覚障害者用環境理解支援システム
- 生成型学習とLSHを用いた視点変化に強いオブジェクト認識(一般セッション,文字・文書の認識と理解)
- 特徴空間の視覚化と適合性フィードバックに基づく類似画像検索システム(一般セッション(1))(ユビキタスコンピューティングのためのパターン認識・理解)
- 曲面に書かれた文字列の抽出と補正(テーマセッション(1),文字認識・文書理解)
- 曲面に書かれた文字列の抽出と補正(テーマセッション(1), 文字認識・文書理解)
- 曲面に書かれた文字の抽出(テーマセッション: マルチメディアコンテンツ, データ工学とメディア理解との融合)
- リアルタイム字幕作成支援のための数式抽出(聴覚と福祉情報工学,一般)
- 画像入力による花図鑑検索
- 複数運動で生じた視聴覚事象の対応付け : 物体全体が移動する場合