音声と画像の統合によるドライバの発話区間検出
スポンサーリンク
概要
- 論文の詳細を見る
Voice activity detection is an important part of the development of speech functions for on-board car navigation and assistance systems. It is difficult to detect voice activity using only sound information in a vehicle environment that has a wide variety of sounds and noises. We propose an suitable image feature and integration method that can be used to develop a robust bimodal voice activity detection (VAD) systems using a driver's voice and facial images. We select the normal correlation value between sequential mouth images and the number of low-intensity pixels in mouth image, which we then used as the feature for VAD. We propose a system in which the discrimination function consist of the sum of weighted singles feature discrimination functions and combinations of logical addition and multiplication of singles feature discrimination functions. The experimental results show that the proposed sound and image features can be useful and that the proposed integration method has a 97% hit rate, which is 9 points better than the previous integration method at the point that false alarm rate is about 12%.
- 2008-03-01
著者
-
二宮 芳樹
(株)豊田中央研究所
-
森 健策
名古屋大学情報科学研究科
-
末永 康仁
名古屋大学情報科学研究科
-
北坂 孝幸
名古屋大学大学院情報科学研究科
-
宮島 千代美
名古屋大学
-
末永 康仁
名古屋大学
-
森 健策
名古屋大学
-
宮島 千代美
名古屋大学大学院情報科学研究科
-
二宮 芳樹
(株)豊田中央研究所第22研究領域
-
根木 大輔
名古屋大学大学院情報科学研究科
-
坂 義秀
名古屋大学大学院工学研究科
-
前野 俊希
名古屋大学大学院情報科学研究科
-
二宮 芳樹
(株)豊田中央研究所 走行環境認識研究室
-
坂 義秀
名古屋大学大学院情報科学研究科
関連論文
- 構造物の知識に基づく車載カメラ画像からの走行環境の三次元直線復元(画像認識,コンピュータビジョン)
- 気管支鏡ガイダンスシステムのための自動気管支構造認識手法の開発
- 4.術中MRIの現在と未来(PS2-4 21世紀のOperation Suite(Visual Presentation),プレナリーセッション,手術再考,第30回日本脳神経外科コングレス総会)
- 大腸ひだと特徴点を用いた三次元腹部CT像の大腸領域における位置合わせ手法の開発 (医用画像)
- 大腸ひだと特徴点を用いた三次元腹部CT像の大腸領域における位置合わせ手法の開発 (画像工学)
- D-16-4 3次元CT像に基づく腹部動脈に対する血管名自動対応付けに関する研究(D-16.医用画像,一般セッション)
- GPUを利用した局所濃淡構造解析の高速化に関する検討(一般セッション,センシングのための認識・理解)
- 気管支の変形に対応したマーカレス気管支鏡追跡手法に関する検討(腹部CT)
- MICCAI2009参加報告 : 研究動向調査(国際会議報告)
- 局所濃淡構造解析及びCT値分布特徴を用いた3次元胸部CT像からの気管支領域抽出手法の検討(領域抽出・自動検出)
- 4時相の3次元腹部CT像を用いた膵臓領域抽出手法の開発(腹部CT)
- 医用画像を処理してみませんか? : CT像を対象とした画像認識・理解・生成を中心として(道しるべ)
- パネル討論 新学術領域「計算解剖学」何を目指すか? 何を期待するか? (医用画像)
- MICCAI'99国際会議参加報告 : Medical Image Computing and Computer-Assisted Intervention Second International Conference
- MICCAI'99国際会議参加報告 : Medical Image Computing and Computer-Assisted Intervention Second International Conference
- 局所濃淡構造解析を用いた3次元腹部X線CT像からのリンパ節抽出手法の改良(一般セッション,映像ハンドリング技術とその応用)
- MICCAI'99国際会議参加報告 : Medical Image Computing and Computer-Assisted Intervention Second International Conference
- D-16-17 胸部X線CT像からのキー・スライス間の肺動脈・肺静脈の抽出
- 3次元胸部X線CT像からの肺動脈・肺静脈の自動認識のためのキー・スライス推定に関する基礎的検討
- 神経内視鏡手術ナビゲーションのための磁気センサを利用した内視鏡カメラ位置姿勢推定に関する予備的検討(セッション2)
- Virtual simulation による内視鏡下経蝶形骨洞手術のアプローチ
- 神経内視鏡手術ナビゲーションのための磁気センサ補正と評価(MRI)
- 複数時相の造影3次元CT像を用いた腹腔鏡下胃切除術支援画像の作成手法
- 脳神経外科手術ナビゲーションのための術前・術中画像における非線形レジストレーション手法の検討
- 3次元腹部X線CT像を用いた結腸ひも抽出手法(腹部)
- SY-3-9 術前MDCT画像から作成した3次元仮想術野画像の消化器外科手術への応用(シンポジウム3 消化器外科手術における画像診断の新展開,第62回日本消化器外科学会定期学術総会)
- D-16-5 3次元胸部CT像からのリンパ節検出に関する検討(D-16.医用画像,一般講演)
- 3次元腹部CT像に基づいた腹腔鏡下手術支援のためのVascular Navigation Systemの検討(企業セッション)
- 3次元腹部CT像を用いた腹腔鏡下手術支援のための Vascular Navigation System の検討
- 複数時相の3次元CT像を用いた複数臓器抽出による腹腔鏡下胃切除術支援画像の生成
- 大腸仮想展開像生成における歪み軽減手法に関する検討
- 2時相の3次元CT像を用いた肝臓がん検出手法に関する検討
- 3次元腹部X線CT像からのリンパ節抽出に関する検討
- 仮想腹腔鏡像作成による腹腔鏡下胃癌手術支援画像の生成
- 腹腔鏡下手術支援のための仮想腹腔鏡像作成に関する検討
- VW-2-8 医用画像処理システム(NewVES)を用いた腹部外科手術支援(画像手術支援の現在と今後,ビデオワークショップ(2),第110回日本外科学会定期学術集会)
- VW-2-KL 画像処理技術による手術支援(基調講演,画像手術支援の現在と今後,ビデオワークショップ(2),第110回日本外科学会定期学術集会)
- 部分空間法を用いた胸部X線CT像からの肺結節陰影認識における精度低下要因の分析
- 部分空間法を用いた肺結節陰影自動認識手法の改良(肺CT, 医用画像一般)
- D-16-4 局所濃淡構造を用いた3次元胸部X線CT像からのリンパ節抽出(D-16.医用画像,一般講演)
- 3次元腹部X線CT像からの局所濃淡構造解析を用いた血管領域およびリンパ節抽出手法の検討
- D-16-13 3次元腹部X線CT像におけるVascular Navigation Systemの基礎的検討(D-16.医用画像,一般講演)
- 腹腔鏡下胃切除術における画像手術支援(胃・十二指腸18, 第60回日本消化器外科学会総会)
- A-17-17 可視光車車間通信システムのためのLED 送信部検出手法(A-17.ITS,一般セッション)
- 簡便な気管支鏡カメラキャリブレーション手法に関する検討
- 非剛体レジストレーションを利用した3次元胸部CT像の位置合わせと多発性小肺結節の経過観察支援への応用(一般セッション8,コンピュータビジョンとパターン認識のための学習理論)
- ナビゲーション診断に基づいた大腸がん診断支援システムの開発(一般セッション(3) : 福祉・医療のためのパターン認識・メディア理解)
- ナビゲーション診断に基づいた大腸がん診断支援システムの開発(福祉・医療のためのパターン認識・メディア理解)
- 芯線モデルを利用した非造影3次元胸部X線CT像からの縦隔内血管領域抽出
- O-2-3 術前MDCT画像から作成した3次元仮想腹腔内画像を活用した胃切除術(胃 診断1,一般演題(口演),第63回日本消化器外科学会総会)
- SF-039-3 バーチャルリアリティを用いた鏡視下手術支援と外科教育(第108回日本外科学会定期学術集会)
- シンクロトロン光を利用した非浸潤性乳管癌の3次元再構築
- 3次元胸部X線CT像からの肺拡散能力推定手法の開発(セッション4(体幹部CAD))
- D-16-2 3次元X線CT像における気管支断面積計測に関する検討(D-16.医用画像,一般講演)
- OR1-6 Virtual Bronchoscopyを利用した肺小病変切除のCAD支援(胸腔鏡1,一般口演1,第32回日本呼吸器内視鏡学会学術集会)
- 非剛体レジストレーションを利用した3次元胸部CT像の位置合わせと多発性小肺結節の経過観察支援への応用(一般セッション8)
- 5.マイクロCT撮影像による伸展固定肺標本の肺末梢微細構造の観察(第30回日本呼吸器内視鏡学会北海道支部会)
- 局所濃淡構造解析による3次元腹部CT像からの大腸ひだ検出手法
- ディジタル残渣除去の不要な腸内残渣造影CT像からの大腸ポリープ検出手法(診断支援,医用画像論文)
- 複数モデルの動的選択に基づく気管支枝名自動対応付け手法(アトラス,医用画像論文)
- Y7-5 伸展固定肺標本のマイクロCT撮影像による肺末梢微細構造の観察(気道再生及び基礎的研究,要望演題7,第31回日本呼吸器内視鏡学会学術集会)
- 気管支木構造解析に基づく肺区域分けの一手法(セッション2(手術支援・アトラス))
- 3次元胸部CT像からの肺葉分割手法の改善(一般セッション,センシング技術とその応用)
- 分岐特徴を利用した気管支鏡誘導システムのための観察部位特定手法の改善(一般セッション8(顔・医用画像),文字・文書の認識・理解)
- D-16-3 ディジタル図形分割に基づく3次元胸部CT像からの肺葉領域抽出(D-16.医用画像,一般講演)
- アクティブ照明制御による乗員検知技術(画像認識,コンピュータビジョン)
- Multi-scale Semantic Bag of Textonsに基づいた道路シーンの領域分割及び物体認識(テーマセッション1(広域空間センシング関連),実世界センシングとその応用)
- D-11-101 近赤外領域の分光反射特性を利用した物体識別(D-11.画像工学,一般セッション)
- D-12-88 単眼カメラによる道路面領域の検出(D-12. パターン認識・メディア理解,一般セッション)
- 道路環境におけるSfMを用いた3Dテクスチャセグメンテーション(一般セッション4)
- 道路環境におけるSfMを用いた3Dテクスチャセグメンテーション(一般セッション4,CV/PR技術のVRへの応用)
- 車載単眼カメラを用いた自車両の運動推定
- 車載外界監視センサを用いた高精度自車運動推定および自車位置推定(ITSポジショニング・一般)
- D-12-53 移動点除去による単眼カメラを用いた運動推定の高精度化(D-12.パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス),一般セッション)
- A-17-16 ミリ波レーダによる自車運動推定(A-17. ITS,一般セッション)
- 車載単眼カメラを用いた走行環境の直線構造の三次元位置推定(一般セッション2,文字・文書の認識・理解)
- 安全のための画像センサ技術(運転者の知覚・認知能力の診断と補償)
- レーザレーダを用いた路側物計測とGPSによる高精度自車両位置推定手法の提案(ITSポジショニングシステム,一般)
- 車載単眼カメラによる車両前方の障害物検出(テーマ関連セッション)
- 地図と画像の融合によるレーン形状推定手法の提案
- 地図と画像の融合によるレーン形状推定方法の提案
- 複数センサ情報の融合による走行環境認識技術
- 画像と地図情報の融合による道路形状推定
- 高速パターン照合手法を利用したレーン認識システム(画像処理, 画像パターン認識)
- レーン検出のための高速パターン照合装置の開発
- レーン検出におけるロバスト性向上の検討
- オプティカルフローによる移動物体の検知
- オプティカルフローによる移動物体の検知
- 線分ラベリング高速処理装置
- 走行環境認識のためのステレオ視の一方法(画像認識,コンピュータビジョン)
- 音声と画像の統合によるドライバの発話区間検出
- バイモーダル車内音声認識評価用データベースの構築
- 映像付き雑音環境下音声認識評価用共通データベースAURORA-2J-AV/AURORA-3J-AVの構築(一般セッション(4) : 福祉・医療のためのパターン認識・メディア理解)
- 映像付き雑音環境下音声認識評価用共通データベースAURORA-2J-AV/AURORA-3J-AVの構築(福祉・医療のためのパターン認識・メディア理解)
- 映像付き雑音環境下音声認識評価用共通データベースAURORA-2J-AV/AURORA-3J-AVの構築(福祉・医療のためのパターン認識・メディア理解)
- 車載カメラ映像を用いたドライバの発話区間検出の改善(テーマセッション(1))(ユビキタスコンピューティングのためのパターン認識・理解)
- 車載カメラ映像を用いたドライバの発話区間検出
- 車載周辺のセンシング・認識技術(運転行動信号処理)
- ITSにおける自動車の高機能化 : 走行環境認識技術
- 走行レーン認識におけるロバストなレーンマーキング候補選択の一手法(動画像処理論文特集)