An Investigation of Hidden Structure Model

概要

論文の詳細を見る
In recent years, we have been working toward a structural representation of speech using contrastive features that are robust to non-linguistic variations. This paper generalizes the structural representation to Hidden Structure Model (HSM) by introducing hidden states and probabilistic calculations. HSM not only can solve miss-alignment problems of events, but also can conduct structure-based decoding, which allows us to apply HSM to general speech recognition tasks. This paper focuses on the fundamental theories of HSM. Different from HMM, HSM accounts for both the absolute and contrastive aspects of an input sequence. We show that the state inference of HSM can be formulated as a quadratical programming problem. We also introduce EM algorithm to estimate the parameters of HSM.
2009-07-10

著者

鈴木雅之
東京大学大学院工学系研究科
Yu Qiao
Graduate School Of Information Science And Technology The University Of Tokyo
鈴木雅之
東京大学
Nobuaki Minematsu
Department Of Information And Communication Engineering The University Of Tokyo
Masayuki SUZUKI
Graduate School of Engineering, The University of Tokyo
Nobuaki MINEMATSU
Graduate School of Information Science and Technology, The University of Tokyo
鈴木雅之
東京大学:(現)日本アイ・ビー・エム(株)東京基礎研究所

関連論文

工夫速算問題の分類と抽象的方略を用いた教授の効果
PE063 工夫速算問題の分類と,方略指導による直接・間接効果の検討
スペクトル領域特徴量を用いた音声の構造的表象に関する実験的考察(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
PG047 数学力コンポーネントを育成する学習法講座の試み : その2:図表利用と論理判断
PG046 数学力コンポーネントを育成する学習法講座の試み : その1:用語理解と工夫速算
構造的特徴量に対する多段階の重回帰分析による発音評価(認識,理解,対話,一般)
音声に含まれる言語的情報を非言語的情報から音響的に分離して抽出する手法の提案 : 人間らしい音声情報処理の実現に向けた一検討(ヒューマンコミュニケーション〜人間中心の情報環境構築のための要素技術〜論文)
アフィン変換不変性を有する局所的特徴量を用いた音声認識(ポスターセッション,第10回音声言語シンポジウム)
アフィン変換不変性を有する局所的特徴量を用いた音声認識(ポスターセッション,第10回音声言語シンポジウム)
アフィン変換不変性を有する局所的特徴量を用いた音声認識(ポスターセッション,第10回音声言語シンポジウム)
空間写像に基づく手の動きを入力とした音声生成系の構築(マルチモーダル)
音声の構造的表象を用いた自動発音評定法の改善
用法の違いを考慮した類似単語の置換による学習データ生成とそれを用いた主題の違いに頑健な言語モデルの構築
用法の違いを考慮した類似単語の置換による学習データ生成とそれを用いた主題の違いに頑健な言語モデルの構築
1U-9 音声の構造的表象と多段階の重回帰を用いた外国語発音分析(音声分析・強調,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
デ-24 発音クリニック : 音声の構造的表象を用いた外国語・方言発音分析(デモセッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
用法の違いを考慮した類似単語の置換による学習データ生成とそれを用いた主題の違いに頑健な言語モデルの構築
スペクトル領域特徴量を用いた音声の構造的表象に関する実験的考察
K146 ルーブリックによる評価基準の教示が学習者に及ぼす影響 : テスト観を媒介にした影響の検討(口頭セッション24 検査・評価)
An Investigation of Hidden Structure Model
音声の構造的表象と多段階の重回帰を用いた外国語発音評価
Eigen-SPLICEを用いた雑音環境下における音声認識
Prosody Conversion for Emotional Mandarin Speech Synthesis Using the Tone Nucleus Model
Prosody Improvement for HMM-based Mandarin Speech Synthesis Using the Tone Nucleus Model
A Preliminary Perceptual Analysis on the Relationship of Phoneme Duration and Speaking Rate
メタ学習への介入法の提案とその効果検証
テスト観とテスト接近-回避傾向が学習方略に及ぼす影響--有能感を調整変数として
音声の構造的表象に基づく学習者分類の検証と発音矯正度推定の高精度化
ルーブリックの提示による評価基準・評価目的の教示が学習者に及ぼす影響 : —テスト観・動機づけ・学習方略に着目して—
チャンス回数が意思決定に及ぼす影響と性差の検討(日本基礎心理学会第27回東北大会,大会発表要旨)
ルーブリックの提示が学習者に及ぼす影響のメカニズムと具体的事例の効果の検討(新時代の学習評価)
SPLICEに基づく音声・口唇画像情報を用いた雑音環境下音声認識 (音声)
SPLICEに基づく音声・口唇画像情報を用いた雑音環境下音声認識 (応用音響)
SPLICEに基づく音声・口唇画像情報を用いた雑音環境下音声認識 (信号処理)
雑音抑圧とSPLICEを組み合わせた雑音環境下音声認識 (音声)
雑音抑圧とSPLICEを組み合わせた雑音環境下音声認識 (応用音響)
雑音抑圧とSPLICEを組み合わせた雑音環境下音声認識 (信号処理)
外国人の郊外団地居住に関する研究 : 多文化共生を軸とした団地再生(推薦理由,優秀卒業論文賞,2006年日本建築学会)
音声の構造的表象と多段階の重回帰を用いた外国語発音評価
雑音抑圧とSPLICEを組み合わせた雑音環境下音声認識(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
雑音抑圧とSPLICEを組み合わせた雑音環境下音声認識(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
雑音抑圧とSPLICEを組み合わせた雑音環境下音声認識(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
SPLICEに基づく音声・口唇画像情報を用いた雑音環境下音声認識(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
SPLICEに基づく音声・口唇画像情報を用いた雑音環境下音声認識(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
SPLICEに基づく音声・口唇画像情報を用いた雑音環境下音声認識(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
スペクトル領域特徴量を用いた音声の構造的表象に関する実験的考察
条件付き確率場を用いた日本語東京方言のアクセント結合自動推定(音声,聴覚,学生論文)
構造的特徴を用いたSVMによる中国語自動発音誤り検出(システム,認識,理解,対話,一般)
26-J-16 認知カウンセリングからみた学習上の問題と基礎研究の展開(自主企画)
日本語アクセント・イントネーションの教育・学習を支援するオンラインインフラストラクチャの構築とその評価(音声,聴覚,システム開発論文)
スーパーベクトルとSVRに基づくMtF話者のための女声度推定(学生ポスターセッション,音声アプリケーション,一般)
識別モデルを用いた英語文発声からの強勢自動検出(一般セッション,音声アプリケーション,一般)
日本語韻律教育の支援を目的としたオンラインアクセント辞書と読み上げチューターの開発(一般セッション,音声アプリケーション,一般)
第47回（2011年度）城戸奨励賞　選考経過および講評
SPLICEに基づく音声・口唇画像情報を用いた雑音環境下音声認識
雑音抑圧とSPLICEを組み合わせた雑音環境下音声認識
雑音抑圧とSPLICEを組み合わせた雑音環境下音声認識
条件付き確率場を用いた日本語東京方言のアクセント結合自動推定
SPLICEに基づく音声・口唇画像情報を用いた雑音環境下音声認識
SPLICEに基づく音声・口唇画像情報を用いた雑音環境下音声認識
雑音抑圧とSPLICEを組み合わせた雑音環境下音声認識

An Investigation of Hidden Structure Model

スポンサーリンク

概要

著者

関連論文

スポンサーリンク