ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
会議やポスター発表などの,多人数によるインタラクションを含む場面において,「誰がいつ話したか?」を検出できれば,検索のためにインデクスを付与する場合や談話構造分析の手がかりとして有用である.この実現のためには,まず観測信号の中から何らかの音声が話されている区間を取り出し(発話区間検出),検出された音声区間について発話者を分類する必要がある(話者識別).本稿では,マイクロホンアレイによりポスター発表を収録して得られた音声データに対し,「いつ」を捉えるために音声の周期性・非周期性の比を用いた発話区間検出技術を適用し,「誰が」を捉えるために音声信号の到来方向を用いた話者識別の手法を適用した場合について,その結果得られる話者識別性能に関し予備的な検討を行った.
- 社団法人電子情報通信学会の論文
- 2007-12-13
著者
-
荒木 章子
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
石塚 健太郎
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
藤本 雅清
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
河原 達也
京都大学大学院 情報学研究科
-
藤本 雅清
NTTコミュニケーション科学基礎研究所
-
藤本 雅清
日本電信電話(株)nttコミュニケーション科学基礎研究所
-
高梨 克也
京都大学学術情報メディアセンター
-
瀬戸口 久雄
京都大学大学院情報学研究科
-
FUJIMOTO Masakiyo
the ATR Spoken Language Communication Research Laboratories
-
Fujimoto Masakiyo
Department Of Electronics And Informatics Faculty Of Science And Technology Ryukoku University
-
高梨 克也
科学技術振興機構さきがけ|京都大学
-
荒木 章子
日本電信電話株式会社 NTTコミュニケーション科学基礎研究所
関連論文
- 多人数会話シーン分析に向けた実時間マルチモーダルシステムの構築 : マルチモーダル全方位センサを用いた顔方向追跡と話者ダイアリゼーションの統合(テーマセッション2,アンビエント環境知能)
- 多人数会話シーン分析に向けた実時間マルチモーダルシステムの構築 : マルチモーダル全方位センサを用いた顔方向追跡と話者ダイアリゼーションの統合(テーマ関連セッション2)
- 音響情報と映像情報の統合による多人数会話における話者決定技術(音響処理・話者同定,第10回音声言語シンポジウム)
- 音響・言語モデルの適応処理によるスポーツ実況中継の音声認識(音声,聴覚)
- 音響・言語適応処理を用いたスポーツ実況中継音声の認識 : ハイライトシーン検出への応用
- 周波数領域ブラインド音源分離のための極座標表示に基づく活性化関数
- マルチモーダルインタラクションによるニュース映像中の人物認識(システム論文特集号)
- 音声認識システムSOLONの日本語話し言葉コーパスによる評価(2006年版)(第8回音声言語シンポジウム)
- 音声認識システムSOLONの日本語話し言葉コーパスによる評価(2006年版)(Session-7 システム,第8回音声言語シンポジウム)
- 音声認識システムSOLONの日本語話し言葉コーパス(公開版Ver.1.0)による評価(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 招待講演 時間周波数マスクによる実環境でのブラインド音源分離 (応用音響)
- 音声区間検出の基礎と最近の研究動向(音声・言語・音響教育,一般)
- Dirichlet事前分布を用いた音声区間検出の検討
- 音声区間検出技術の最近の研究動向
- B-8-59 停電時上り音声通信を実現する光アクセス方式の提案(B-8.通信方式,一般セッション)
- 多人数会話シーン分析に向けた実時間マルチモーダルシステムの構築 : マルチモーダル全方位センサを用いた顔方向追跡と話者ダイアリゼーションの統合(テーマセッション2,アンビエント環境知能)
- Dirichlet事前分布を用いた音声区間検出の検討(韻律・VAD,第11回音声言語シンポジウム)
- 乳幼児の母音に対する周波数ピークの縦断的分析
- 音声認識システムSOLONの日本語話し言葉コーパスによる評価(2006年版)(Session-7 システム,第8回音声言語シンポジウム)
- 音声認識システムSOLONの日本語話し言葉コーパス(公開版Ver.1.0)による評価(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 音声認識システムSOLONの日本語話し言葉コーパス(公開版Ver.1.0)による評価(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 音源分離技術の最新動向
- 幻の「っ」--日本語促音の知覚発達過程
- ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
- ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
- ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
- B-8-11 停電時上り音声通信光アクセス方式の実現技術の検討(B-8.通信方式,一般セッション)
- 音声情報と画像情報の併用による商品紹介映像のセグメンテーション(音声,聴覚)
- GMMとEMアルゴリズムを用いた加法性雑音及び乗法性ひずみの抑圧(音声, 聴覚)
- GMMに基づく音声信号推定法と時間領域SVDに基づく音声強調法の併用による雑音下音声認識(音声, 聴覚情報論的学習理論論文)
- GMMとEMアルゴリズムを用いた加法性雑音及び乗法性歪みの抑圧(耐雑音)(第5回音声言語シンポジウム)
- GMMとEMアルゴリズムを用いた加法性雑音及び乗法性歪みの抑圧(第5回音声言語シンポジウム : 耐雑音)
- GMMとEMアルゴリズムを用いた加法性雑音及び乗法性歪みの抑圧(第5回音声言語シンポジウム : 耐雑音)
- GMMに基づく音声信号推定法の改良と実走行車内音声による評価
- 野球中継のハイライトシーン実時間配信を目的としたPCシーンの自動検出(映像・マルチメディアとパターン認識・理解)
- 音声区間推定と時間周波数領域方向推定の統合による会議音声話者識別(音響信号処理/一般)
- AS-4-5 音声のスパース性を用いたUnderdetermined音源分離(AS-4. ICAを超える,シンポジウムセッション)
- A-10-6 周波数領域ICAにおける初期値の短時間データからの学習(A-10. 応用音響,一般セッション)
- A-10-9 多くの背景音からの主要音源のブラインド抽出(A-10.応用音響,基礎・境界)
- A-10-8 3次元マイクロホンアレイを用いた多音源ブラインド分離(A-10.応用音響,基礎・境界)
- A-10-7 観測ベクトルのクラスタリングによるブラインド音源分離(A-10.応用音響,基礎・境界)
- 畳込み混合のブラインド音源分離(独立成分分析とその応用特集号)
- ブラインド信号処理技術の研究動向(マイクロホンアレー・ブラインド分離・音源位置推定/一般)
- [招待論文]独立成分分析に基づくブラインド音源分離(マイクロホンアレー・ブラインド分離・音源位置推定及び一般)
- 移動音源の低遅延実時間ブラインド分離
- 周波数領域ブラインド音源分離における permutation 問題の頑健な解法
- 周波数領域ICAと時間遅れスペクトル減算による残響下での実時間ブラインド音源分離
- 間隔の異なる複数のマイクペアによるブラインド音源分離
- 非定常スペクトルサブトラクションによる音源分離後の残留雑音除去
- エントロピーによる重み付けを用いた雑音環境下での基本周波数推定
- 音響情報と映像情報の統合による多人数会話における話者決定技術(音響処理・話者同定,第10回音声言語シンポジウム)
- 音響情報と映像情報の統合による多人数会話における話者決定技術(音響処理・話者同定,第10回音声言語シンポジウム)
- NTTにおける男女共同参画への取組み(男女共同参画のページ)
- 「木のいのち 木のこころ」, 西岡常一著, 新潮OH!文庫, 2001年(私のすすめるこの一冊)
- 周波数領域ブラインド音源分離と適応ビームフォーマの等価性について
- 周波数領域ブラインド音源分離と周波数領域適応ビームフォーマの関係について
- 混じりあった声を解く--遠隔発話の認識を目指して (特集論文1 人にやさしい対話型コンピュータ)
- ブラインドな処理が可能な音源分離技術 (特集 コミュニケーションの壁を克服するための音声・音響処理技術)
- 音声区間検出と雑音抑圧の統合法を用いた雑音下音声認識(音響処理・話者同定,第10回音声言語シンポジウム)
- 音声区間検出と雑音抑圧の統合法を用いた雑音下音声認識(音響処理・話者同定,第10回音声言語シンポジウム)
- 音声区間検出と雑音抑圧の統合法を用いた雑音下音声認識(音響処理・話者同定,第10回音声言語シンポジウム)
- 確率モデルに基づく音声区間検出と雑音抑圧の統合法の評価と考察(認識,理解,対話,一般)
- 複数の音声区間検出法の適応的統合の検討と考察(雑音・VAD,第9回音声言語シンポジウム)
- AR-GARCHモデルに基づいた音声区間検出手法の提案(音声,聴覚)
- 複数の音声区間検出法の適応的統合の検討と考察
- 複数の音声区間検出法の適応的統合の検討と考察(雑音・VAD,第9回音声言語シンポジウム)
- 複数の音声区間検出法の適応的統合の検討と考察(雑音・VAD,第9回音声言語シンポジウム)
- 招待講演 複数人会話シーン分析におけるマイクロホンアレイ音声処理 (音声)
- 招待講演 複数人会話シーン分析におけるマイクロホンアレイ音声処理 (信号処理)
- 招待講演 複数人会話シーン分析におけるマイクロホンアレイ音声処理 (応用音響)
- 音声特徴抽出法SPADEを用いたフロントエンドの耐雑音評価標準コーパスによる評価(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 音声特徴抽出法SPADEを用いたフロントエンドの耐雑音評価標準コーパスによる評価(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 音声と雑音両方の状態遷移過程を有する雑音下音声区間検出(第8回音声言語シンポジウム)
- 音声と雑音両方の状態遷移過程を有する雑音下音声区間検出(Session-1 検出,第8回音声言語シンポジウム)
- 音声と雑音両方の状態遷移過程を有する雑音下音声区間検出(Session-1 検出,第8回音声言語シンポジウム)
- Exponential 自己回帰モデルを用いた音声信号分析方法
- 雑音下母音聴取における雑音の調波構造の影響
- 非線形変換フィルタによる音声特徴抽出
- 時間周波数マスクによる実環境でのブラインド音源分離
- 帯域に適した分離手法を用いるサブバンド領域ブラインド音源分離
- サブバンド処理によるブラインド音源分離に関する検討
- 複数人会話シーン分析におけるマイクロホンアレイ音声処理(一般,音声・音響信号処理,音声及び一般)
- 複数人会話シーン分析におけるマイクロホンアレイ音声処理(一般,音声・音響信号処理,音声及び一般)
- 複数人会話シーン分析におけるマイクロホンアレイ音声処理(一般,音声・音響信号処理,音声及び一般)
- 妨害音下母音知覚における母音の各周波数帯域での振幅変動の影響
- フレーム内波形処理による耐雑音スペクトル推定
- 音声のピッチ変動の耐雑音音声認識における効果
- 音声のピッチ変動の耐雑音音性認識における効果
- 音声のピッチ変動の耐雑音音声認識における効果
- 調波複合音下母音知覚における母音の振幅・基本周波数の時間変動の影響
- 白色雑音・調波複合音下での母音知覚特性の比較
- 雑音下母音聴取における雑音のスペクトル構造の影響
- 雑音下母音聴取における雑音のスペクトル構造の影響
- 音声の周期性・非周期性成分比とSwitching Kalman filterに基づく雑音下音声区間検出(音響処理)
- 日本語学習乳児の音声口形マッチングの発達に関する母音/i/を用いた検討
- 劣決定音源分離のための分離音声のケプストラムスムージング
- A-10-9 フルランク空間相関行列モデルに基づく拡散性雑音除去(A-10.応用音響,一般セッション)
- 周波数依存の時間差モデルによる劣決定BSS
- 時変混合重みに基づくパーミュテーション問題のないクラスタリングベース音源分離(音響信号処理,電気音響,信号処理,音声一般)
- 時変混合重みに基づくパーミュテーション問題のないクラスタリングベース音源分離(音響信号処理,電気音響,信号処理,音声一般)