順位統計量を用いたテキスト独立型話者照合手法(音声,聴覚)
スポンサーリンク
概要
- 論文の詳細を見る
本論文では,順位統計量を用いた話者照合手法を提案する.順位統計量は,入力音声に対する申告話者,多数の背景話者モデル(GMMs)とのゆう度の比較で得られる順位そのものを指す.我々はこの順位統計量に対して,しきい値処理を行い照合する.提案手法ではT-normと同様に背景話者モデル数に比例して計算コストが増える.そこで提案手法の照合コストを下げるためにコホート話者を利用した手法も併せて提案する.評価のために,科学警察研究所が構築した『大規模話者骨導音声データベース』に収録されている男性283名の気導音声を用いて実験を行った.T-normを用いた場合のEER2.24%に対して,提案手法のEERは2.17%だった.また,コホート話者を用いた場合は282名から約80%の人数を削減した平均57名分の順位統計量の計算で,282名の話者を用いた場合と同等の性能を達成した.
- 2011-09-01
著者
-
堀内 靖雄
千葉大学
-
黒岩 眞吾
千葉大学大学院
-
堀内 靖雄
東京工業大学工学部情報工学科
-
堀内 靖雄
千葉大学工学部
-
堀内 靖雄
千葉大学大学院融合科学研究科
-
柘植 覚
大同大学
-
岡本 悠
千葉大学大学院融合科学研究科
-
黒岩 眞吾
(株)ケイディディ研究所
-
柘植 覚
徳島大学大学院ソシオテクノサイエンス研究部情報ソリューション部門
-
Tsuge Satoru
Atr Interpreting Telecommunications Research Laboratories
-
堀内 靖雄
千葉大学 大学院自然科学研究科
-
堀内 靖雄
東京工業大学工学部
-
柘植 覚
大同大学情報学部
-
堀内 靖雄
千葉大学大学院 融合科学研究科 情報科学専攻
関連論文
- 話者交替規則に基づいた日本手話対話の話者交替の分析
- ヒューマンインタフェースシンポジウム2009報告
- ヒューマンインタフェースシンポジウム2007報告
- 日本手話の表現速度の違いによる手動作変化の分析(福祉と音声処理,一般)
- Webページ間の関係に着目した大規模サイトの構造化の調査 : 音声ブラウザ利用におけるアクセシビリティの検討
- 大規模話者骨導音声データベースを用いたテキスト独立型話者照合実験(一般(ポスターセッション),第9回音声言語シンポジウム)
- パネル討論会「コンピュータサイエンスとしての音楽情報処理」の報告 : 第52回全国大会シンポジウム
- 3DCGによる手話文アニメーション合成システムの構築と評価(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- (1)姿勢とチェロ演奏(SIGMUS第27回研究発表会報告・質疑記録)
- 日本語地図課題対話コーパスの設計と特徴
- 5.音声の知見の情報福祉への応用(バリアフリー社会に向けた音声情報処理)
- 大規模話者骨導音声データベースを用いたテキスト独立型話者照合実験(一般(ポスターセッション),第9回音声言語シンポジウム)
- 大規模話者骨導音声データベースを用いたテキスト独立型話者照合実験(一般(ポスターセッション),第9回音声言語シンポジウム)
- 日本手話の後続うなずきの機能に関する検討(福祉情報工学一般)
- 順位統計量を用いた話者照合のためのコホート話者選択方法
- ブレスの合図を認識する伴奏システムの実装と評価(システム)
- 順位統計量を用いた話者照合のためのコホート話者選択方法
- Super-Function に基づく日英機械翻訳における日付・時間表現の抽出
- 位置と動きに基づくマルチストリームHMMを用いた手話認識
- 手の位置と動きに着目したHMMによる手話単語の認識(一般,膨大なデータから学ぶもの)
- 手の位置と動きに着目したHMMによる手話単語の認識(一般,膨大なデータから学ぶもの)
- 順位統計量を用いた話者照合のためのコホート話者選択方法(一般(ポスターセッション),第11回音声言語シンポジウム)
- 音声対話システムにおける発話予測を利用した音声認識
- 3DCGによる手話文アニメーション合成システムの構築と評価(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 3DCGによる手話文アニメーション合成システムの構築と評価(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 書き起こしへの付与を目指した音声とテキストを対象とした発話印象の分析
- 音声認識の信頼度に着目した文境界検出に関する検討(一般(ポスターセッション),第11回音声言語シンポジウム)
- 音声認識の信頼度に着目した文境界検出に関する検討
- 視覚障害者のための意味情報を用いた仮名漢字変換における説明語選択手法の検討(福祉と音声処理,一般)
- 曲中のブレスによる合図を利用した伴奏システム
- 日本手話対話の話者交替時の重複現象の分析
- 日本手話対話の話者交替時の重複現象の分析(一般セッション,コミュニケーション支援,共生コミュニケーション及び一般)
- 日本手話対話の話者交替時の重複現象の分析(一般セッション,コミュニケーション支援,共生コミュニケーション及び一般)
- 日本手話対話の話者交替時の重複現象の分析(一般セッション,コミュニケーション支援,共生コミュニケーション及び一般)
- ブレスによる合図を検出する伴奏システム
- 特集「音楽情報処理」の編集にあたって
- 蓮根:演奏生成システムによるピアノコンクール実施推進のためのワークショップ : 報告とパネルディスカッション
- (3)くし形フィルタによる異楽器音のピッチ推定と演奏楽器推定(SIGMUS第27回研究発表会報告・質疑記録)
- 自然対話におけるジェスチャーの相互的関係の分析
- 音声対話コーパスにおける画像情報のアノテーション手法の検討
- 伴奏システムでのブレス情報利用に関する検討
- 抑揚情報による木構造の準実時間推定
- 先行発話断片の終端部分に存在する次発話者に関する言語的・韻律的要素について
- 自発的音声対話における話者交替の制御に関わる発話末の統語的・韻律的特徴
- 音声認識の信頼度に着目した文境界検出に関する検討 (音声)
- 日本手話におけるうなずきと接続詞の分析(福祉と音声処理,一般)
- 日本手話におけるうなずきと接続詞の分析(福祉と音声処理,一般)
- 日本手話の表現速度の違いによる手動作変化の分析(福祉と音声処理,一般)
- 音声対話コーパスの共有化へ向けて
- K-017 全盲者のウェブサイトのユーザビリティと検索効率に関する考察(教育工学・福祉工学・マルチメディア応用,一般論文)
- 発話予測を利用した手話対話システムに関する検討(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 発話予測を利用した手話対話システムに関する検討(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 発話予測を利用した手話対話システムに関する検討(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- STRAIGHTを用いたF0モデルパラメータの変換・再合成ツールの開発(一般(ポスターセッション),第9回音声言語シンポジウム)
- STRAIGHTを用いたF0モデルパラメータの変換・再合成ツールの開発(一般(ポスターセッション),第9回音声言語シンポジウム)
- STRAIGHTを用いたF0モデルパラメータの変換・再合成ツールの開発(一般(ポスターセッション),第9回音声言語シンポジウム)
- F0モデルを用いた日本語対話における韻律と話者交替の分析(合成,生成,韻律,一般)
- (2)遺伝的アルゴリズムを用いた自動作曲について(SIGMUS第27回研究発表会報告・質疑記録)
- 合奏時の人間の演奏制御の分析・推定(音楽情報科学)
- 合奏における人間の発音時刻制御モデルの推定(音楽情報科学)
- 自然手話対話における話者交替現象の分析(視覚障害/聴覚障害/一般)
- 自然手話対話における話者交替に関する予備的検討(分析、生成と評価)(音声とコミュニケーション及び一般)
- 日本手話対話の話者交替に関する手話言語の特徴
- アクセントフレーズ境界の知覚に関する一考察
- 自然対話におけるうなずきの機能に関する考察(分析、生成と評価)(音声とコミュニケーション及び一般)
- 自然対話における聞き手の反応と話し手のうなずき・言語情報・韻律情報との関係に関する予備的検討(対話)
- 自然対話における聞き手の反応と話し手のうなずき・言語情報・韻律情報との関係に関する予備的検討(対話)
- パーティクルフィルタとHMMによる動画像からの手話認識に関する検討(コミュニケーションの心理及び一般)
- 書き起こしへの付与を目指した発話印象の表現法に関する分析(一般(ポスターセッション),第9回音声言語シンポジウム)
- 書き起こしへの付与を目指した発話印象の表現法に関する分析(一般(ポスターセッション),第9回音声言語シンポジウム)
- 書き起こしへの付与を目指した発話印象の表現法に関する分析(一般(ポスターセッション),第9回音声言語シンポジウム)
- 順位統計量を用いたテキスト独立型話者照合手法(音声,聴覚)
- 低高調波歪みのための対称型E_M級電力増幅器
- 視覚障害者のための意味情報を用いた仮名漢字変換における説明語選択手法の検討(福祉と音声処理,一般)
- Q&Aコーナー(コーヒーブレーク)
- 視覚障害支援のための意味情報に基づく仮名漢字変換(福祉工学)
- Kinectとパーティクルフィルタを用いたHMM手話認識手法の検討(テーマセッション,時系列パターン認識)
- Kinectとパーティクルフィルタを用いたHMM手話認識手法の検討(テーマセッション,時系列パターン認識)
- 日本手話対話と日本語音声対話における話者交替現象の比較分析(福祉情報工学一般,ライフイノベーションのための介護・リハビリ・生活支援技術)
- 隠れマルコフモデルを用いた眼電位認識の研究(一般セッション,時系列パターン認識)
- 隠れマルコフモデルを用いた眼電位認識の研究(一般セッション,時系列パターン認識)
- 隠れマルコフモデルを用いた眼電位認識の研究
- 日本手話対話と日本語音声対話における話者交替現象の比較分析
- Kinect とパーティクルフィルタを用いたHMM手話認識手法の検討
- 手の位置と動きに着目したHMMによる手話単語の認識
- 名演奏家の合奏録音における伴奏者の演奏タイミング制御の分析
- 手の位置と動きに着目したHMMによる手話単語の認識
- Kinect とパーティクルフィルタを用いたHMM手話認識手法の検討
- 発話中の一部区間を用いた感情認識(研究速報)
- コミュニケーション支援のための眼球動作入力音声合成インタフェースの研究(福祉情報工学一般,地域コミュニティと福祉)
- Kinectとパーティクルフィルタによる手話認識手法の検討(聴覚障害,メディア・コミュニケーションの品質と福祉,及び一般)
- Kinectとパーティクルフィルタによる手話認識手法の検討(聴覚障害,メディア・コミュニケーションの品質と福祉,及び一般)
- Kinectとパーティクルフィルタによる手話認識手法の検討(聴覚障害,メディア・コミュニケーションの品質と福祉,及び一般)
- Kinectとパーティクルフィルタによる手話認識手法の検討(聴覚障害,メディア・コミュニケーションの品質と福祉,及び一般)
- ユーザ属性を考慮した字幕付与方法の検討(聴覚障害,メディア・コミュニケーションの品質と福祉,及び一般)
- ユーザ属性を考慮した字幕付与方法の検討(聴覚障害,メディア・コミュニケーションの品質と福祉,及び一般)
- ユーザ属性を考慮した字幕付与方法の検討(聴覚障害,メディア・コミュニケーションの品質と福祉,及び一般)
- ユーザ属性を考慮した字幕付与方法の検討(聴覚障害,メディア・コミュニケーションの品質と福祉,及び一般)
- K-063 Androidを用いた失語症者向け料理名思い出しツール(K分野:教育工学・福祉工学・マルチメディア応用,一般論文)