クラスタ選定によるボトムアップ話者ダイアライゼーションの高精度化(ポスターセッション)
スポンサーリンク
概要
- 論文の詳細を見る
従来,ボトムアップアプローチを用いて話者ダイアライゼーションをするとき,殆どの場合話者内の音声類似度の変異が,話者間より小さいことを仮定として扱う.もし実際のデータが仮定を満たさない場合,ボトムアップアプローチは機能しない.本稿では,従来のレベル内類似度評価以外に,クラスタ合併時の時間(レベル間)次元の変化を評価基準として加えるボトムアップクラスタリング法を提案する.実験では,従来のボトムアップクラスタリング法で停止条件を最適に設定した場合の最大可能精度を上回るの結果を得た.
- 一般社団法人電子情報通信学会の論文
- 2012-12-13
著者
-
武田 一哉
名古屋大 大学院情報科学研究科
-
武田 一哉
名古屋大学工学部
-
武田 一哉
日本音響学会:現在,名古屋大学
-
北岡 教英
日本音響学会:現在,名古屋大学
-
陳 伯翰
日本音響学会
-
陳 伯翰
日本音響学会:現在,名古屋大学
関連論文
- 日常会話における発話タイミング分析
- 正十二面体マイクロホンアレイを用いた周波数領域ICAのpermutation問題に対する解決策の検討(音響信号処理/一般)
- 畳み込みHMMに基づく歌声の基本周波数制御モデルの提案とそのパラメータ学習方法(音響分析一般(1))
- 合同特別企画: パネルディスカッション「"音"研究の未来」
- 「日本語音声」データベースの構築 : 中間報告(国語学会2003年度秋季大会研究発表会発表要旨)
- 多視点・多聴点データ取得システムを用いた自由視聴点映像生成(研究速報,三次元・多視点映像処理,画像符号化・映像メディア処理レター)
- 合同特別企画: パネルディスカッション「"音"研究の未来」
- 正十二面体マイクロホンアレイを用いた実環境における音源信号分離の検討(音声,応用音響,一般,音声,応用/電気音響,信号処理,及び一般)
- 正十二面体マイクロホンアレイを用いた実環境における音源信号分離の検討(音声,応用音響,一般,音声,応用/電気音響,信号処理,及び一般)
- 正十二面体マイクロホンアレイを用いた実環境における音源信号分離の検討(音声,応用音響,一般,音声,応用/電気音響,信号処理,及び一般)
- 給電指令電話の音声検索システム
- 端点検出を行わない連続音声認識
- 音声モニタリングによる対話理解方式の検討
- 指向性マイクロホンを用いた波面合成法における波面合成精度
- 波面合成におけるチャネル数の主観的影響 : 音源が正面付近にある場合
- 移動音源がある音場の空間符号化 : 音源抽出による伝送量の削減
- 音場再現におけるマルチチャネル信号の空間符号化
- 移動音源に対するマルチチャンネル音場空間符号化の検討
- 言葉とコミュニケーションの科学技術をささえる : 音声言語情報処理研究会(研究会千夜一夜)
- AS-6-5 分布パラメータのオンライン推定に基づく統計的雑音抑圧(AS-6.実環境における高品質収音のための音声信号処理,シンポジウム)
- AURORA2/CENSREC3による雑音抑圧手法の評価(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- AURORA2/CENSREC3による雑音抑圧手法の評価(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- AURORA2/CENSREC3による雑音抑圧手法の評価(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- [チュートリアル講演]音声コーパスと音声情報処理(音声による環境認識(チュートリアル講演))
- 6. 自動車の中での音声認識(音声情報処理技術の最先端)
- 名古屋大学における音声音響関連研究プロジェクト : 20世紀COEから21世紀COEへ(プロジェクト紹介(1))(第5回音声言語シンポジウム)
- 名古屋大学における音声音響関連研究プロジェクト : 20世紀COEから21世紀COEへ(第5回音声言語シンポジウム : プロジェクト紹介(1))
- マルチメディア情報処理(画像情報工学)(映像情報メディア年報)
- 逆フィルタを用いた空間音響圧縮技術の拡がり感
- 空間情報を利用したマルチチャンネル音響信号の符号化と音源定位
- 主成分分析によるマルチチャンネル音響符号化の検討
- 4-1 マルチメディア情報処理(4.画像情報工学)(映像情報メディア年報)
- 雑談音声の常時認識による楽曲提案システム(一般セッション,福祉と見守りのための画像・音声処理)
- 雑談音声の常時認識による楽曲提案システム(一般セッション,福祉と見守りのための画像・音声処理)
- 自動車内における両耳室内伝達関数を用いた話者と受聴者の位置推定に関する検討(ブラインド信号処理/一般)
- 相平面に描かれるF0の動的変動成分を利用した歌唱様式の自動分類
- Webから収集した楽曲を説明するテキストと楽曲の音響特徴量との関連づけに関する検討(音楽音響信号処理)
- D-11-66 多元多点計測装置の開発 : カメラアレイとマイクロフォンアレイ(D-11.画像工学D(画像処理・計測),一般講演)
- 人間行動理解のための信号処理(学生/教養のページ)
- 名古屋市域における住居の環境騒音暴露量に関する研究
- ブラインド音源分離と頭部伝達関数を用いた音楽演奏を題材とした自由視聴点コンテンツの制作(ブラインド信号処理/一般)
- 受聴位置選択型音場再現のためのブラインド音源分離を用いた多マイクロホンアレー信号の符号化(音響信号及び音声処理、エンハンスメント/一般)
- 主観評価に基づく楽曲間類似度算出モデル
- 二段雑音スペクトルの推定と回帰による車内音声認識
- 二段雑音スペクトルの推定と回帰による車内音声認識
- 二段雑音スペクトルの推定と回帰による車内音声認識
- 二段雑音スペクトルの推定と回帰による車内音声認識(ポスターセッション)(第6回音声言語シンポジウム)
- 二段雑音スペクトルの推定と回帰による車内音声認識(ポスターセッション)(第6回音声言語シンポジウム)
- 音声認識におけるrobustnessの新paradigmをさぐる
- 住居の音環境に対する都市住民の反応に関する研究
- 住環境騒音暴露パターンの解析と住民反応の尺度化に関する研究
- 都市内住居の騒音暴露量に関する分析
- 頭部伝達関数を用いた自由聴点立体音場の構築と評価
- マイクロホンアレーを用いた自由聴点音場再生システムに関する理論的検討(ANC・エコーキャンセラ・ノイズキャンセラ/一般)
- 複数の認識器を選択的に用いる音声認識システムのためのスコア補正法(音声,聴覚)
- 対数スペクトルの重回帰に基づく分散マイクロホン出力の統合(音響と音声処理,音声強調,ロバスト音声認識)
- 頭部近傍におけるHRTFの距離依存特性に関する検討(音響信号及び音声処理、エンハンスメント/一般)
- 日本のアニメの音声に表された感情と性格 : 声のステレオタイプの音声学的研究(感情音声・感情認知I, 感情音声)
- 運転行動データベースの構築とその応用(運転行動信号処理)
- 運転行動信号処理の現状と展望(運転行動信号処理)
- 音声対話システムの発話系列N-gramを利用した課題未達成対話の検出(研究速報)
- 大語彙連続音声認識のための読み上げ文コーパスの構築
- 大語彙連続音声認識のための読み上げ文の選択
- 大語彙連続音声認識研究のためのテキストデータ処理
- 装着型マイクロホンを用いた受音系の検討(音響と音声処理,音声強調,ロバスト音声認識)
- 装着型マイクロホンを用いた受音系の検討(音響と音声処理,音声強調,ロバスト音声認識)
- スペクトルの重回帰に基づく車内音声認識の検討
- スペクトルの重回帰に基づく車内音声認識の検討
- 遠隔マイクロフォン音声の重回帰による音声強調
- 帯域分割型ICAとアルゴリズムダイバーシチに基づくブラインドビームフォーマ
- 車内情報インタフェースに関する国際標準の動向
- 過去の走行データに基づく運転診断・教示システムの構築(MR/ARの実用化に向けたCV/PR技術の課題と展望)
- 過去の走行データに基づく運転診断・教示システムの構築(MR/ARの実用化に向けたCV/PR技術の課題と展望)
- ICA仮想音源の空間分布を用いた室内音場の解析
- MLLR変換行列により制約された音響特徴量生成による頑健な音響モデル(音響モデル・雑音・分析,第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- MLLR変換行列により制約された音響特徴量生成による頑健な音響モデル(音響モデル・雑音・分析,第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- 代替分離行列出力に基づく時変ソフトマスクを用いた低演算量ブラインド音源分離
- 観測信号間のコヒーレンスに基づくICA音源分離の計算量の削減
- 非言語情報を基にしたストレス状態検出の検討(音声・言語・音響教育,一般)
- 時空間周波数分析を用いた頭部インパルス応答に含まれる残響の検知と抑圧(騒音,振動,電子情報通信分野における萌芽的研究論文)
- 反射音の到来方向分布を用いた音源距離推定
- 車載ネットワークを用いた運転データの収集と車種による運転行動の違いの分析(ITS画像処理,映像メディア,視覚及び一般)
- 車載ネットワークを用いた運転データの収集と車種による運転行動の違いの分析(ITS画像処理,映像メディア,視覚及び一般)
- 音声ドキュメント検索におけるクエリ拡張と音節認識の併用の効果(音声処理,時系列パターン認識)
- 音声ドキュメント検索におけるクエリ拡張と音節認識の併用の効果(音声処理,時系列パターン認識)
- ブラインド音源分離の信頼度を用いたマルチバンド音声認識(音声処理,時系列パターン認識)
- ブラインド音源分離の信頼度を用いたマルチバンド音声認識(音声処理,時系列パターン認識)
- ブラインド音源分離の信頼度を用いたマルチバンド音声認識
- ばね質量系を利用した合唱における歌声のF0ダイナミクスのモデル化
- ばね質量系を利用した合唱における歌声のF0ダイナミクスのモデル化
- 楽曲間の類似判定における許容度の推定
- 楽曲間の類似判定における許容度の推定
- 音楽リズムと音声リズムの共通性についての基礎検討
- 音声対話システムの発話・動作タグN-gramを用いた課題未達成のオンライン検出(音声対話,音声翻訳,ヒューマンコミュニケーション〜人にやさしい情報通信社会を実現するコミュニケーション技術〜論文)
- 音声言語情報処理研究会の20年-歴代主査による研究レビュー-
- 音源数評価に基づくFDICA音源分離の計算量削減(ブラインド信号処理,一般)
- 特徴量領域音源分離のためのクロススペクトル抑圧(音声特徴量)
- クラスタ選定によるボトムアップ話者ダイアライゼーションの高精度化(ポスターセッション)
- 空間相関行列の固有値分布に着目した音源別距離推定(電気音響,音響一般,学生論文)
- 非言語情報を基にした過信状態の検出 : 振り込め詐欺誘引通話の検出(オーガナイズドセッション(招待講演),音声アプリケーション,一般)