実環境における発話区間検出のための音響情報と画像情報の統合(音響と音声処理,音声強調,ロバスト音声認識)
スポンサーリンク
概要
- 論文の詳細を見る
本報告では実環境での音声認識に有効であると考えられる発話区間検出の手法を提案する.この手法では、音響情報と画像情報をベイジアンネットワークを用いて統合して扱うことにより,複数の音声を含む音源が存在する状況において,話者の発話区間を検出することが可能である.この発話区間情報は,音声認識で用いられるのみでなく,音声認識の前処理として用いられる適応ビームフォーマの学習に用いられる.適応ビームフォーマでは,話者位置を発話区間から,雑音の空間的特性を非発話区間から求めることにより,音源分離性能が大幅に向上する.情報統合の手段としてベイジアンネットワークを用いることにより,(1)音響座標系と画像座標系の対応を学習により求めることができる,(2)入力ノードの追加により,情報源の追加を容易に行える,(3)状況依存性を表現できる,などの利点がある.
- 社団法人電子情報通信学会の論文
- 2003-04-17
著者
-
本村 陽一
産業技術総合研究所サービス工学研究センター
-
市村 直幸
産業技術総合研究所脳神経情報研究部門
-
浅野 太
産業技術総合研究所
-
山本 潔
産業技術総合研究所
-
麻生 英樹
産業技術総合研究所
-
中村 哲
ATR音声言語通信研究所
-
山本 潔
筑波大学大学院システム情報工学研究科
-
吉村 隆
産業技術総合研究所 情報処理研究部門
-
吉村 隆
産業技術総合研究所情報処理研究部
-
中村 哲
Atr音声口語コミュニケーション研究所
-
本村 陽一
産業技術総合研 デジタルヒューマン研究セ
-
麻生 英樹
産業技術総合研 情報技術研究部門
-
浅野 太
産業技術総合研 情報技術研究部門
-
市村 直幸
産業技術総合研究所
関連論文
- 近似LoGフィルタを用いた局所不変特徴量の抽出 : GPUによる実装(一般セッション5,アンビエント環境知能)
- 近似LoGフィルタを用いた局所不変特徴量の抽出 : GPUによる実装(一般セッション5,アンビエント環境知能)
- 近似LoGフィルタを用いた局所不変特徴量の抽出 : GPUによる実装(一般セッション5)
- 波形の折れ線近似による低遅延・少計算量楽音符号化方式(信号処理・符号化・一般)
- 波形の折れ線近似による低遅延・少計算量楽音符号化方式(信号処理・符号化・一般)
- 密なエッジサンプリングに基づく局所不変特徴量による対応付け(一般セッション,実世界センシングとその応用)
- ヒューマノイドロボットにおける音響シミュレーションの検討
- ブラインド信号処理の最近の動向 : 超指数法と固有ベクトル法(ブラインド信号処理の技術とその応用論文)
- 協調フィルタリングと属性ベースフィルタリングの統合について(ベイズ情報処理,ベイズ情報処理及び一般)
- OP-116-5 Bayesian Networkを用いた本邦における外傷生存関連因子と外傷診療体制の問題点(救急-1,一般口演,第110回日本外科学会定期学術集会)
- ロケーションEMGセンサを用いた行動の時空間展開記述に基づく日常生活行動モデリング手法(日常生活行動コンピューティング)
- ベイジアンネットワーク(OR事典Wiki)
- 嗜好のモデル化におけるモデル適応について(ヒトの行動とモデル,神経ダイナミクス,一般)
- ベイジアンネットによる映画コンテンツ推薦方式の検討(ベイジアンネット1 : ポスターセッション)
- 確率的潜在意味解析を用いた大規模ID-POSと顧客アンケートの統合利用による顧客-商品の同時カテゴリ分類 (ニューロコンピューティング)
- 一般化固有値展開を用いたセミブラインド音源分離
- 正規化LoG関数の近似に基づく局所不変特徴量の抽出(一般セッション17)
- 正規化LoG関数の近似に基づく局所不変特徴量の抽出(一般セッション6,三次元画像,多視点画像)
- Tree Augumented Naive Bayesとベイジアンネットを組み合わせたベイズ推定による幼児の室内行動認識
- 1.仮想状況と現実状況における食事メニュー嗜好の差異について(一般セッション 認知・情報)
- 子どもの傷害予防教育・啓発に活かすVR技術
- 子どもの事故予防のための日常生活インフォマティクス(子どもの安全とバイオメカニズム)
- 計算論的日常生活行動理解研究基盤 : オープンライフマトリクスプロジェクトの構想
- 不確実性に関わるコンピューティング(知能コンピューティングとその周辺〔第11回〕)
- 日常生活のロボタイゼーション
- 室内における幼児の行動予測のための確率的因果構造モデルの学習と推論
- 交通安全のための状況・意図理解に向けて(交通移動体事故の抜本的低減へ向けて)
- 大規模データに基づく日常生活のモデリングと社会応用 (特集 ベイジアンネットワークの最先端)
- 2.移動端末におけるユーザの状況を考慮した嗜好抽出技術(実世界上のユーザ行動に着目した嗜好抽出・情報推薦, 利用者の好みをとらえ活かす-嗜好抽出技術の最前線-)
- 大規模データに基づく日常生活のモデリングと社会応用(ベイジアンネットワークの最先端)
- 身体知研究の潮流 : 身体知の解明に向けて
- GPUと方向マップに基づく局所不変特徴量のオンライン抽出
- サービスイノベーションのための大規模データの観測・モデリング・サービス設計・適用のループ(サービスイノベーションとAIその2)
- 自己組織化型状態空間モデルを用いた運動軌跡のフィルタリング
- 自己組織化型状態空間モデルを用いた運動軌跡のフィルタリング
- ベイジアンネットワークモデルの構造学習におけるMDL規準の改善提案
- ベイジアンネットによる映画コンテンツ推薦方式の検討(好みの計量)
- 映画コンテンツ推薦のためのユーザ嗜好性モデルの実験的評価
- ヒューマノイドロボットにおける音響シミュレーションの検討
- 視聴覚センサ情報の統合による音源追跡
- マイクロホンアレイとカメラアレイを用いた会議録コンテンツ作成システムについて
- ロボットにおける音源位置推定(ロボットにおける音響技術)
- 実環境における発話区間検出のための音響情報と画像情報の統合(音響と音声処理,音声強調,ロバスト音声認識)
- 実環境における発話区間検出のための音響情報と画像情報の統合(音響と音声処理,音声強調,ロバスト音声認識)
- RANSACを用いた車両運転時のイベント検出法(確率数値解析に於ける諸問題,VII)
- 日常生活サービスにおける大規模データからのベイジアンネットモデル構築と活用技術
- 企画主旨
- 「新サービス創造に向けたサービス工学の取り組み」特集号を企画して(新サービス創造に向けたサービス工学の取り組み)
- サービス工学における計算論的モデル(新サービス創造に向けたサービス工学の取り組み)
- 製造業における取り組みとサービス工学への期待(新サービス創造に向けたサービス工学の取り組み)
- 人間の理解 : 神経素子から確率変数, 行動, 日常生活の計算モデルへ
- 大規模データと認知構造を導入した消費者行動モデルについて
- ヒトの認知・評価構造の定量化モデリングと確率推論
- GPUによる方向マップを用いた局所不変特徴量の抽出
- 正規化LoG関数の近似に基づく局所不変特徴量の抽出(一般セッション6,三次元画像,多視点画像)
- 安心空間設計のための移動データ解析とシミュレーション手法の統合(セッション3:実空間におけるモデル化とシミュレーション)
- 安心空間設計のための移動データ解析とシミュレーション手法の統合(セッション3:実空間におけるモデル化とシミュレーション,社会システムと知能)
- センサーデータと人流シミュレーションの統合 (テーマ:知能・適応と社会,ネットワーク) -- (マルチエージェントシステム)
- CoBITを用いた位置に基づく情報支援基盤システムの構築(位置情報・動線解析(1))
- 情報インフラに基づくグラウンディングとその応用 : サイバーアシストプロジェクトの概要
- サイバーアシスト構想 (テーマ:「エージェント技術:基礎と応用」および一般)
- Inference and Learning with Graphical models (特集 RWC研究--実世界知能の実現を目指して) -- (第2部 実世界知能研究推進センターの最新の研究成果)
- 確率的潜在意味解析を用いた大規模ID-POSと顧客アンケートの統合利用による顧客-商品の同時カテゴリ分類
- 国際生活機能分類を用いた日常生活プロトコルデータの正規化に基づく生活機能構造のモデル化と理解
- 2重潜在クラスモデルとベイジアンネットを結合した小売サービスにおける顧客購買行動モデリング(一般講演(構造学習・ベイジアンネット・確率推論),機械学習とその応用)
- Webセンサとユビキタスセンサによる乳幼児行動のセンシングとモデリング(一般セッション(2),人の検出・計測・認識)
- 9. 乳幼児事故予防のための日常行動モデリング(医療のためのディジタルヒューマン技術)
- 日常生活行動の計算論的理解のための確率的構造モデル
- 乳幼児事故予防のための情報循環システム : 事故シーン動画の提供サービスと事故の特徴量表現による最適動画選択手法
- 安心・安全社会構築のための日常行動センシングとモデリングの基盤技術
- 子供の事故予防のための事故サーベイランスシステムへの取り組み : 確率的知識の抽出と活用(プライバシー・安全と可視化, 「安全・安心な社会生活の実現に向けた知識の活用とソフトウェア開発支援」及び一般)
- 日常生活支援システムのためのサービス計算論(脳・ヒューマンモデリング3, 脳・ヒューマンモデリング, 一般)
- 日常系の科学技術 : 乳幼児事故予防のための日常行動モデリング
- HK-1-5 乳幼児事故予防のための日常行動センシングとモデリング(HK-1.Needsからみたユビキタス環境構築術,グループ特別企画,ソサイエティ企画)
- 子供の事故予防のための確率モデル構築の試み
- 乳幼児の事故予防のための確率的行動モデル(ベイジアンネット1 : ポスターセッション)
- 映画コンテンツ推薦のためのユーザ嗜好性モデルの実験的評価
- 想定状況と現実状況における食事メニュー嗜好の差異の分析(一般,生物模倣情報処理,機械学習,一般)
- 3D-2 テキストマイニングによる成功経験の抽出(自然言語処理(1),一般セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 確率伝搬法を用いたベイジアンネットのEMアルゴリズム
- 6自由度カメラ運動の下でのMultiperspective Imagingによるステレオ(一般セッション(1))
- 局所不変特徴量に基づく複数広告看板の認識(一般セッション3)
- 1次元カメラモデルを用いたMultiperspective ImagingによるIBR(一般セッション(1))
- 1次元カメラモデルを用いたMultiperspective ImagingによるIBR(一般セッション(1))(CVのためのパターン認識・学習理論の新展開)
- フレーム毎の特徴点抽出に基づく特徴点の追跡
- 幼児の行動認識のための Tree Augmented Naive Bayes Model とベイジアンネットを組み合わせたベイズ推定の精度比較
- 幼児の行動認識のための Tree Augmented Naive Bayes Model とベイジアンネットを組み合わせたベイズ推定の精度比較
- 話者位置推定のためのベイジアンネットによる音響情報と画像情報の統合
- ベイズ推定における事前分布のグラフ構造モデリングと実生活行動理解
- ベイジアンネットワークによるヒューマンモデリング(ベイジアンネットワークと確率的情報処理の新展開)
- 日常系の科学技術 : 子どもの事故予防のための日常行動センシングとモデリング(システムLSIの応用と要素技術,専用プロセッサ,プロセッサ,DSP,画像処理技術,及び一般)
- 日常系の科学技術 : 子どもの事故予防のための日常行動センシングとモデリング(システムLSIの応用と要素技術,専用プロセッサ,プロセッサ,DSP,画像処理技術,及び一般)
- 日常系の科学技術 : 子どもの事故予防のための日常行動センシングとモデリング(システムLSIの応用と要素技術,専用プロセッサ,プロセッサ,DSP,画像処理技術,及び一般)
- 乳幼児の環境誘発行動を予測する計算モデルの開発
- GPUによる特徴点とエッジに基づく局所不変特徴量の抽出
- 百貨店ID付きPOSデータからのカテゴリ別状況依存的変数間関係の自動抽出法(データ解析コンペティション:ファッションCRM)
- 形状空間への直交射影行列と判別基準を用いた複数運動の分割
- 日常生活における不確実性のモデル化と知識循環
- 乳幼児の環境誘発行動を予測する計算モデルの開発
- 店頭タブレット端末を用いた顧客フィードバックとID-POSデータの統合による顧客分析(一般セッション マーケティング(2))