音響情報と画像情報の統合による発話区間検出 : 基本的なコンセプト

概要

論文の詳細を見る
2003-03-18

著者

浅野太
産業技術総合研究所
中村哲
ATR音声言語通信研究所
浅野太
産総研
麻生英樹
産総研
本村陽一
産総研
中村哲
ATR Interpreting Telephony Research Laboratories
市村直幸
産総研
市村直幸
産業技術総合研究所

関連論文

波形の折れ線近似による低遅延・少計算量楽音符号化方式(信号処理・符号化・一般)
波形の折れ線近似による低遅延・少計算量楽音符号化方式(信号処理・符号化・一般)
ヒューマノイドロボットにおける音響シミュレーションの検討
A-16-18 Blendshapesによるリップシンクアニメーションのためのキーフレーム削除法(A-16.マルチメディア・仮想環境基礎,一般講演)
携帯型端末を用いた音声自動翻訳システムとフィールド実験(モバイルと放送の融合時代を迎えて(1セグ放送, モバイル放送, 携帯放送融合サービス, 1セグ対応携帯端末, モバイルコンテンツと放送コンテンツの融合, マルチメディア配信, ディジタル放送受信機, および一般))
ブラインド信号処理の最近の動向 : 超指数法と固有ベクトル法(ブラインド信号処理の技術とその応用論文)
バイモーダル音声認識における音素境界を越えた同期性のモデル
5.効率的アニメ制作支援のための3次元CG技術(情報技術が支えるアートとコンテンツの世界)
連続音声認識候補受理/リジェクションのためのワードスポッティング仮説検証手法(第5回音声言語シンポジウム : システム・信頼度)
SLP雑音下音声認識評価WG活動報告 : 評価用データと評価手法について(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
ATR実環境雑音DB-ATRANS-を用いた雑音重畳音声認識実験(耐雑音)
実走行車内単語音声データベースCENSREC-3と共通評価環境の構築
CENSREC-3 : 実走行車内単語音声データベースと評価環境の構築(ポスターセッション)(第6回音声言語シンポジウム)
実環境下音声認識の評価の標準化とその動向(音声・言語における標準化動向)(第6回音声言語シンポジウム)
分散型認識システムでのデータ補完に関する一検討
一般化固有値展開を用いたセミブラインド音源分離
歩行者支援GISにおける音声入力インタフェースの検討(福祉と言語処理/一般)
音声翻訳研究の展開(機械翻訳)
翻訳可能なフレーズを単位とした音声認識結果の信頼度評価
連続音声認識候補受理/リジェクションのためのワードスポッティング仮説検証手法(第5回音声言語シンポジウム : システム・信頼度)
iFACe:デジタルアニメ声優体験システム
携帯型端末を用いた音声自動翻訳システムとフィールド実験
ヒューマノイドロボットにおける音響シミュレーションの検討
視聴覚センサ情報の統合による音源追跡
マイクロホンアレイとカメラアレイを用いた会議録コンテンツ作成システムについて
ロボットにおける音源位置推定(ロボットにおける音響技術)
多人数インタラクションの工学的応用 : 認識・理解システムの構築とその利用について(ワークショップ,言語・非言語コミュニケーション及び一般)
ヒューマノイドロボットHRP-2における音響情報と画像情報を統合したリアルタイム音声インタフェース(システム論文特集号)
パーティクルフィルタを用いた移動音源の追跡技術
マイクロホンアレイと音源定位を用いた会議録再生システムについて(立体音響・音場制御/聴覚/一般)
ひずみ感と帯域感を考慮した楽音符号化方式の最適品質設計法(ネットワーク)
高次統計量の分布モデルを用いた音声・環境音識別法の検討(音声・音響処理)
高次統計量の分布モデルを用いた音声・環境音識別法の検討(音声・音響処理)
EMアルゴリズムを用いた移動音源の追跡と分離に関する基礎的検討(音響と音声処理・音声強調,ロバスト音声認識,一般)
EMアルゴリズムを用いた移動音源の追跡と分離に関する基礎的検討(音響と音声処理・音声強調,ロバスト音声認識,一般)
音を分ける
実環境における発話区間検出のための音響情報と画像情報の統合(音響と音声処理,音声強調,ロバスト音声認識)
重畳区間の推定情報を用いたHMM合成に基づくロバスト音声認識の検討(音響と音声処理,音声強調,ロバスト音声認識)
実環境における発話区間検出のための音響情報と画像情報の統合(音響と音声処理,音声強調,ロバスト音声認識)
利得適応型AR-HMM分解法を用いた音響モデルの雑音適応化の検討(音響と音声処理,音声強調,ロバスト音声認識)
利得適応型AR-HMM分解法を用いた音響モデルの雑音適応化の検討(音響と音声処理,音声強調,ロバスト音声認識)
CENSREC-2 : 実走行車内における連続数字音声データベースと評価環境の構築
自動車内における連続数字音声コーパスCENSREC-2の設計と評価(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
Switching dynamical systemとパーティクルフィルタを用いた非定常雑音の逐次推定(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
自動車内における連続数字音声コーパスCENSREC-2の設計と評価(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
SLP雑音下音声認識評価WG活動報告 : 評価用データと評価手法について(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
自動車内における連続数字音声コーパスCENSREC-2の設計と評価(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
SLP雑音下音声認識評価WG活動報告 : 評価用データと評価手法について(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
Switching dynamical systemとパーティクルフィルタを用いた非定常雑音の逐次推定(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
Switching dynamical systemとパーティクルフィルタを用いた非定常雑音の逐次推定(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
マイクロフォンアレイを用いた音環境の見守りによる非日常音と危険状態の検出システム(ユビキタス・センサネットワークの要素技術,コンテクストの抽出,スマートスペース,ユビキタス生活支援,一般)
歩行者支援地理情報システムにおける音声入力インタフェースと高齢者に対するその評価
歩行者支援GISにおける音声入力インタフェースの検討(福祉と言語処理/一般)
HMM/BN音響モデルの設計と実装
HMM/BN音響モデルの設計と実装(国際ワークショップ"Beyond HMM")
HMM/BN音響モデルの設計と実装(国際ワークショップ"Beyond HMM")
雑音や発話スタイルの変動に頑健な日本語大語彙連続音声認識
ハイブリッドHMM/BNモデルに基づいた調音特徴とスペクトル特徴の統合
ハイブリッドHMM/BNモデルに基いた大語彙音声認識システム
ハイブリッドHMM/BNモデルに基いた大語彙音声認識システム
多様な雑音環境下での頑健な音声認識
GMMを用いた音声区間の検出
Q&Aコーナー(コーヒーブレーク)
コヒーレントサブスペース法を用いたアレイ信号処理による音声強調
エコーキャンセラの残留エコー特性測定に用いる信号の検討
エコーキャンセラの残留エコー特性測定に用いる信号の検討
環境音モデルとHMM合成による音声区間検出法の文章発話への適用
環境音モデルとHM合成による音声区間検出法の文章発話への適用
環境音モデルとHMM合成による音声区間検出法の文章発話への適用
環境音モデルとHMM合成を用いた文章発話に対する音声区間検出の検討
重畳区間の推定情報を用いたHMM合成に基づくロバスト音声認識の検討(音響と音声処理,音声強調,ロバスト音声認識)
環境音モデルとHMM合成を用いた音声区間検出法の音声認識への適用
ひずみ感と帯域感を考慮した楽音符号化の最適品質設計法(マルチメディア通信とQoS, VoIP, ストリーミング, 一般)
ひずみ感と帯域感を考慮した楽音符号化の最適品質設計法
音響情報と画像情報の統合による発話区間検出 : 基本的なコンセプト
話者位置推定のためのベイジアンネットによる音響情報と画像情報の統合
SVMを用いた音源数推定の音源分離システムへの応用
隠れマルコフ網と逐次状態分割法を用いた環境音のモデル化の検討
隠れマルコフ網と逐次状態分割法を用いた環境音のモデル化の検討
音源分離におけるSVMを用いた音源数推定法について
音源分離におけるSVMを用いた音源数推定法について
Kirchhoff-Helmholtz 積分方程式に着目した状態フィードバック制御による反射音抑圧手法の提案
ブラインド信号分離における音源数推定法について
符号化音声の客観品質評価に用いる擬似音声の有効性
残留エコー特性の客観測定に用いるテスト信号の比較
楽音波形の折れ線近似に基づくVariable bit-rate符号化の一検討
帯域とビットレートを考慮した楽音符号化品質設計法
3. ICAによる音響信号の分離(見分ける,聞き分ける)
実音響環境における音響シーンデータの収集
D-14-36 RWCP実環境音声・音響データベース
実環境における音響シーンデータベースの構築
一般化固有値展開を用いたセミブラインド音源分離
反射のある音場における信号分離 (独立信号分析と信号分離の基礎)
反射のある音場における信号分離 (独立信号分析と信号分離の基礎)
楽音波形の折れ線近似 Variable bit-rate 符号化方式の適応量子化による品質改善
高次Cumulantを用いたアレイ信号処理
近頃, 思うこと
サブスペース法に基づいたアレイ信号処理による音声強調手法
分割構造を持つGriffiths-Jim型適応ビームフォーマについて
RLS適応ビームフォーマの実装に関する検討

音響情報と画像情報の統合による発話区間検出 : 基本的なコンセプト

スポンサーリンク

概要

著者

関連論文

スポンサーリンク