クラスタリングによるHMM間の距離尺度の検討
スポンサーリンク
概要
- 論文の詳細を見る
音声認識手法として広く用いられているHMMの間の距離尺度について検討した。HMMの出力確率分布が単一ガウス分布で表現されるようなものを用い、出力確率分布からユークリッド距離、分散で正規化したユークリッド距離、分布間のKullback Divergenceの3種の距離を定義した。次に以下に述べる2つの方法を用いて距離尺度の良さを調べた。まず音素HMM間の距離関係について定義した距離とモデル間のKullback Divergenceの順序の保存率を用いて比較した。次に音素文脈依存HMMのクラスタリングを各距離尺度を用いて行なった。こうして得た各モデルをモデルの学習サンプルに対する尤度と認識誤り率を用いて比較した。その結果、分布の分散がどれだけクラスタリングに寄与するかを明らかした。
- 社団法人電子情報通信学会の論文
- 1994-06-16
著者
関連論文
- 加速度情報を用いた日常行動認識について(デモ展示・ポスター講演,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- 「日本語音声」データベースの構築 : 中間報告(国語学会2003年度秋季大会研究発表会発表要旨)
- 視覚情報を対話的に学習するマルチモーダル擬人化エージェント
- コンピュータとの対話におけるユーザの振舞いの解析
- 視覚・聴覚・発話機能を有するエージェント型マルチモーダルインタフェースの試作
- 自然な発話を扱うことをめざした音声対話システムの構築
- M-013 3軸加速度センサを用いた隠れマルコフモデルによる人間の行動識別(ユビキタス・モバイルコンピューティング,一般論文)
- 加速度情報を用いた日常行動認識について(デモ展示・ポスター講演,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- 加速度情報を用いた日常行動認識について(デモ展示・ポスター講演,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- 画像特徴量の正規化によるマルチモーダル音声認識の改善(マルチモーダル)
- マルチモーダル音声認識における音声と画像の同期に関する調査(マルチモーダル)
- E-007 Wikipediaのカテゴリを利用したWeb検索結果のフィルタリングの検討(自然言語・音声・音楽,一般論文)
- 2ZD-5 統計的音声区間検出法を用いた加速度センサによる人間の動作検出(動作認識・大画面,学生セッション,インターフェース)
- 音声と画像のconfusion networkを用いたマルチモーダル音声認識
- デジタルペン文字認識システムを用いた在宅看護支援における誤認識自動訂正機能(一般,テキスト情報の要約と掲示に関わる自然言語処理シンポジウム及び一般)
- シソーラス上に動的に構成される標本空間における動詞の多義性解消
- シソーラス上での共起頻度を利用した動詞の多義解消
- 被喩詞の意味と比喩表現の意味との違いを示す指標
- 実例に基づいた入力文と格フレームの類似度
- 視点を考慮した比喩の理解
- ブースティングによるマルチモーダル音声区間検出の結果統合(音声・言語・音響教育,一般)
- 音声合成システム性能評価方法の規格
- 声帯振動の非線形効果パラメータのパタン化
- 人の表情を有し音声対話・視覚機能を備えたマルチモーダルインタフェース
- 複数モデルの統合によるLDAトピックモデルの高精度化とテキスト入力支援への応用
- ARHMMに基づいた音声分析手法と歌声認識による評価(聴覚・音声及び一般)
- 単語発声の複数サンプルを利用した未知語の音韻系列の推定(音声情報処理 : 現状と将来技術論文特集)
- 自動推論 Wizard of OZ システムによる日本語自由発話コーパス
- 複数サンプルを用いた未知語認識
- RWC計画における音声対話データベースの構築
- 対話システム制御における時間の扱い
- サブスペース法を用いた音声強調法とその音声認識への応用(第2報)
- サブスペース法を用いた音声強調法の音声認識への応用
- マルチモーダル音声区間検出を用いたマルチモーダル音声認識の検討(一般セッション,クロスモーダル)
- マルチモーダル音声区間検出を用いたマルチモーダル音声認識の検討(一般セッション,クロスモーダル)
- マルチモーダル音声区間検出を用いたマルチモーダル音声認識の検討(一般セッション,クロスモーダル)
- マルチモーダル音声区間検出を用いたマルチモーダル音声認識の検討(一般セッション,クロスモーダル)
- マルチモーダル医療支援システムの開発
- E-021 映像コンテンツ理解支援のためのキーワード表示方式の検討(自然言語・音声・音楽,一般論文)
- 身振りと発話のマルチモーダルデータベース
- E-020 見出しにおける文の成分に関する調査(自然言語・音声・音楽,一般論文)
- IE2000-22 / PRMU2000-47 / MVE2000-51 ジェスチャ認識システム評価用ジェスチャデータベースの開発
- IE2000-22 / PRMU2000-47 / MVE2000-51 ジェスチャ認識システム評価用ジェスチャデータベースの開発
- IE2000-22 / PRMU2000-47 / MVE2000-51 ジェスチャ認識システム評価用ジェスチャデータベースの開発
- EM法を用いた複数情報源からの概念獲得
- EM法を用いた複数情報源からの概念獲得
- 単語アクセントパターン識別におけるモーラ単位HMMの語彙独立性の評価と検討
- オフィス移動ロボットJijo-2 の音声対話システム
- 事情通ロボットの音声対話インターフェース
- 論争支援マルチモーダル実験システム MrBengo
- 論争支援のマルチモーダル実験システム
- 音声・視覚・画像をもつインタラクションシステム
- D-024 レシピの自動生成に向けた調味料推定の評価(データベース,一般論文)
- Multimodal Interaction System that Integrates Speech and Visual Information (特集 RWC研究--実世界知能の実現を目指して) -- (第2部 実世界知能研究推進センターの最新の研究成果)
- 実世界視覚情報を対話的に学習・管理する人間型ソフトウェアロボット (知能情報メディア論文特集)
- 人間型マルチモーダルエージェントによる実世界情報の学習と管理
- 実空間中の人物や物体を認識して対話するマルチモーダル擬人化エージェント
- 音声補完 : 音声入力インタフェースへの新しいモダリティの導入(インタラクティブシステムとソフトウェア)
- 音声補完 : 単語補完機能の評価
- マルチモーダル機能(「RWC-実世界知能」)
- 音声補完の評価
- 音声補完の評価
- 音声補完: 音声ワイルドカード補完機能の実現
- 自然発話中の有声休止箇所のリアルタイム検出システム(音声情報処理 : 現状と将来技術論文特集)
- 音声補完:単語補完ができる新たな音声入力インターフェース
- 2000-SLP-32-16 音声補完 : "TAB"on speech
- 有声休止箇所のリアルタイム検出システムの評価
- 自然発話中の言い淀み箇所のリアルタイム検出システム
- E-047 会議録自動作成システムに向けた話者識別技術の検討(自然言語・音声・音楽,一般論文)
- 時間の扱いを考慮した対話システム制御手法
- マンマシン対話における言語表現の多様性の解析
- クラスタリングによるHMM間の距離尺度の検討
- A Speech Database and Acoustic-Phonetic Knowledge Base for Speech Recognition (自然言語対話システムに関する研究)
- 日本音響学会研究用連続音声データベース (<小特集>出揃った音声データベース)
- 電総研の研究用音声データベース (<小特集>出揃った音声データベース)
- 連続DPによる連続単語認識実験とその考察
- 日本語対話処理研究に必要なもの
- 音声対話システム構築のための実対話データ収録実験
- 高度対話システムの実現のためのヒューマンファクタの解析
- 音声対話システムの研究と実用化の動向 (<小特集>音声によるコンピュータとの対話を目指して)
- 「音声研究者電子メールアドレス帳」について
- 音声の音響音声的変動パターンの類型化 : データベースと生成領域からの類推の利用 : 視聴覚技術 : 聴覚、音声関係および一般
- 音声の変動記述のための知識ベースについて
- 音声の音素片ネットワーク表現と時系列のセグメント化法を用いた自動ラベリング手法
- マルチモーダル情報統合システムの研究動向
- 話者方向同定と雑音抑制による音声認識性能の改善 ( 音響信号処理による音声認識性能の改善)
- 遅延和アレイを用いた音源方向同定/雑音抑制システムの試作とその音声認識への応用
- 新聞記事の言語情報を用いた対話音声のキーワード抽出
- 音声対話システムにおけるシステムとユーザ間の相互作用と応答戦略
- 相槌挿入のための韻律パターンの認識
- GIF-SP : 汎用・識別的な特徴量を用いた音声認識性能の改善(耐雑音処理,第13回音声言語シンポジウム)
- GIF-SP : 汎用・識別的な特徴量を用いた音声認識性能の改善(耐雑音処理,第13回音声言語シンポジウム)
- スパース表現を用いた実環境における喀痰検出(ポスター講演,ポスターショートオーラル,時系列パターン認識)
- スパース表現を用いた実環境における喀痰検出(ポスター講演,ポスターショートオーラル,時系列パターン認識)
- スパース表現を用いた実環境における喀痰検出
- E-027 汎用・識別的特徴量を用いた音声区間検出(音声情報処理,E分野:自然言語・音声・音楽)
- スパース表現を用いた実環境における喀痰検出
- 雑音環境下における静的・動的情報を用いた音響モデル適応(雑音下音声認識,認識,理解,対話,一般)
- RO-008 検索新聞 : 新聞形式型検索情報提示システムにおけるマイクロブログを用いたユーザ適応(情報検索,O分野:情報システム)
- 高精度なマルチモーダル音声認識の実現に向けた取り組み(オーガナイズドセッション)