話者認識におけるロバストネス(<小特集>話者認識に関する研究の動向)

概要

論文の詳細を見る
2013-07-01

著者

網野加苗
科学警察研究所
西田昌史
同志社大学
柘植覚
大同大学
柘植覚
徳島大学大学院ソシオテクノサイエンス研究部情報ソリューション部門
Amino Kanae
Dep. Of Electrical And Electronics Engineering Sophia Univ.
王龍標
長岡技術科学大学

関連論文

日本科学未来館(音の博物館)
電磁オシログラフ(音の博物館)
距離索引VP-treeにおける解絞込みの一改良手法(マルチメディアデータベース,データ工学論文)
日本手話の表現速度の違いによる手動作変化の分析(福祉と音声処理,一般)
Webページ間の関係に着目した大規模サイトの構造化の調査 : 音声ブラウザ利用におけるアクセシビリティの検討
サヌカイト音の出る石(音の博物館)
雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(3)(SIG-SLP内組織の活動報告)
雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(2)(雑音・VAD,第9回音声言語シンポジウム)
雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境 (2)(雑音・VAD,第9回音声言語シンポジウム)
大規模話者骨導音声データベースを用いたテキスト独立型話者照合実験(一般(ポスターセッション),第9回音声言語シンポジウム)
3DCGによる手話文アニメーション合成システムの構築と評価(福祉と知能・情動・認知障害,福祉と音声処理,一般)
日本科学未来館
Perception of speaker identity and its relation to the phonological features (Speech) -- (国際ワークショップ"Asian workshop on speech science and technology")
音韻・韻律情報を用いた両耳融合聴課題に関する検討(言語獲得・学習,合成,生成,韻律,一般)
非負値行列因子分解に基づく多人数会話における話者分類
大規模話者骨導音声データベースを用いたテキスト独立型話者照合実験(一般(ポスターセッション),第9回音声言語シンポジウム)
大規模話者骨導音声データベースを用いたテキスト独立型話者照合実験(一般(ポスターセッション),第9回音声言語シンポジウム)
NMFに基づくクラスタリングを適用したAnchor Modelによる話者認識
異なる認識単位の認識器から得られた信頼度を素性に用いた音声認識
位置と動きに基づくマルチストリームHMMを用いた手話認識
手の位置と動きに着目したHMMによる手話単語の認識(一般,膨大なデータから学ぶもの)
手の位置と動きに着目したHMMによる手話単語の認識(一般,膨大なデータから学ぶもの)
KL情報量によるAnchor modelの階層的クラスタリングに基づく話者認識
書き起こしへの付与を目指した音声とテキストを対象とした発話印象の分析
音声認識の信頼度に着目した文境界検出に関する検討(一般(ポスターセッション),第11回音声言語シンポジウム)
音声認識の信頼度に着目した文境界検出に関する検討
視覚障害者のための意味情報を用いた仮名漢字変換における説明語選択手法の検討(福祉と音声処理,一般)
曲中のブレスによる合図を利用した伴奏システム
日本手話対話の話者交替時の重複現象の分析
日本手話対話の話者交替時の重複現象の分析(一般セッション,コミュニケーション支援,共生コミュニケーション及び一般)
日本手話対話の話者交替時の重複現象の分析(一般セッション,コミュニケーション支援,共生コミュニケーション及び一般)
日本手話対話の話者交替時の重複現象の分析(一般セッション,コミュニケーション支援,共生コミュニケーション及び一般)
ブレスによる合図を検出する伴奏システム
音声認識の信頼度に着目した文境界検出に関する検討 (音声)
日本手話におけるうなずきと接続詞の分析(福祉と音声処理,一般)
日本手話におけるうなずきと接続詞の分析(福祉と音声処理,一般)
日本手話の表現速度の違いによる手動作変化の分析(福祉と音声処理,一般)
音声認識と話者認識を統合した話者の人名付与システム(音声言語情報処理とその応用)
聴取による話者識別における鼻音・口音の非対称性と音響的距離との関連
聴取による話者識別における音韻間の格差と音響的対応(聴覚・音声・言語とその障害, 一般)
部分空間と混合分布モデルを用いた声質変換
自動抽出されたアナウンサー発話に対するニュースディクテーションと記事分類
日本語母語話者・非母語話者による電話番号読み上げ音声の韻律
Effects of the Syllable Structure on Perceptual Speaker Identification (国際ワークショップ Frontiers in Speech and Hearing Research)
Effects of linguistic contents on perceptual speaker identification : Comparison of familiar and unknown speaker identifications
Perception of speaker identity and its relation to the phonological features
言語学のすすめ(ちょっとしたエッセイ,コーヒーブレーク)
Idiosyncrasy of nasal sounds in human speaker identification and their acoustic properties
単音節による雑音下の個人性知覚
D-14-8 ベイズリスク最小化音声認識に基づく大学情報検索システムの構築(D-14.音声,一般セッション)
D-14-5 日本語母語話者を対象としたモデル選択と話者適応に基づく英語音声認識(D-14.音声,一般セッション)
音声入力型大学情報検索システムに対するベイズリスク最小化音声認識の適用
音声入力型大学情報検索システムに対するベイズリスク最小化音声認識の適用
実環境下での話者認識におけるPMC法の効果について
日本語母語話者・非母語話者による電話番号読み上げ音声の韻律(オーガナイズドセッション2,聴覚・音声・言語とその障害/一般)
Speaker individualities conveyed by speech sounds and their interactions with the linguistic-phonological information(Abstracts of Recent Doctoral Dissertations on Acoustics)
ガウス分布から導出される部分空間法による話者照合法の検討
音韻性を抑えた話者空間への射影による話者認識
音韻分散を考慮した空間変換による音声認識法の検討
部分空間分離に基づく音声認識法の検討
音韻空間への射影に基づく話者正規化
話者固有空間における動的・静的特徴統合による話者照合
音韻空間への射影に基づく話者正規化による音素認識
音韻空間への射影に基づく話者正規化による音素認識
音韻空間への射影に基づく話者正規化による音素認識
話者補空間における話者認識
SP2000-12 話者補空間射影による話者認識
部分空間法を用いた話者照合における動的・静的特徴統合 -部分空間次元数の事前設定の検討-
部分空間法を用いた動的・静的特徴統合による話者照合
アナウンサー発話の自動抽出とディクテーションによるニュース記事分類 (音声言語情報処理)
ドラマにおける話者インデキシングの検討
部分空間法による話者照合
Effects of stimulus contents and speaker familiarity on perceptual speaker identification
視覚障害者のための意味情報を用いた仮名漢字変換における説明語選択手法の検討(福祉と音声処理,一般)
自動学習による話者セグメンテーション
ニュース音声中のアナウンサー発話区間の自動切り出し
座談会における話者区間の切り出し
クラウド時代の新しい音声研究パラダイム
視覚障害支援のための意味情報に基づく仮名漢字変換(福祉工学)
D-14-4 音声対話型CALLシステムの認識性能評価(D-14.音声,一般セッション)
発話内分散に基づき動的に生成された話者空間による話者クラスタリング(ポスターセッション,第13回音声言語シンポジウム)
D-14-5 音声対話型CALLシステムでの信頼度評価の検討(D-14.音声,一般セッション)
発話内分散に基づき動的に生成された話者空間による話者クラスタリング(ポスターセッション,第13回音声言語シンポジウム)
発話内分散に基づき動的に生成された話者空間による話者クラスタリング
発話内分散に基づき動的に生成された話者空間による話者クラスタリング
RE-001 GMMの分布選択に基づくアンカーモデルのクラスタリングによる話者認識(音声言語処理,E分野:自然言語・音声・音楽)
話者認識におけるロバストネス(話者認識に関する研究の動向)
音素決定木に基づく対話型CALLシステムに対する有効な音素セットの構築に関する検討
音声入力による音声ドキュメント検索における単語重要度を考慮したベイズリスク最小化音声認識
Swiss German Intonation Patterns-Studies in Language Variation 10-, Adrian Leemann著, John Benjamins Publishing Company, 2012年, ハードカバー, 16.5×24.1cm, 331頁, EUR105.00, USD158.00
RE-002 文単位で分割されたテキストで学習した言語モデルによる単語信頼度を用いた文境界検出(音声言語処理,E分野:自然言語・音声・音楽)
オープンソース音声認識エンジンJuliusへのベイズリスク最小化機能の実装と評価(音声,聴覚,システム開発論文)
話者認識技術の現状と課題(オーガナイズドセッション(パネルディスカッション),音声アプリケーション,一般)
日本人学習者の中国語二声と三声の知覚トレーニングに関する研究(一般セッション,音声・言語・対話,一般)
音声の周期・非周期成分分解に基づく話者認識の検討(一般セッション,音声・言語・対話,一般)
D-14-7 学習者コーパスを利用した音声対話型CALLシステムの開発(D-14.音声)
相互情報量を用いた辞書自動生成に基づく中国語ピンインから文字への変換の改善に関する検討(一般セッション,音声・言語・対話,一般)
A-19-1 視覚障がい者のための重要文書抽出に基づくWeb検索支援(A-19.福祉情報工学)
学習者コーパスを利用した音声対話型CALLシステムにおける想定外発話検出手法(一般セッション,音声・言語・対話,一般)
国立科学博物館「夏休みサイエンススクエア」への出展(寄書,音響教育特集号)

話者認識におけるロバストネス(<小特集>話者認識に関する研究の動向)

スポンサーリンク

概要

著者

関連論文

スポンサーリンク