単語セットの音声認識難易度推定 : 記号領域における単語間距離計算の応用
スポンサーリンク
概要
- 論文の詳細を見る
This paper presents a between-word distance(BWD)calculation in a symbolic domain and discusses its typical application in estimating the degree of the speech recognition difficulty for given word sets. The first part of the paper describes a method for the distance calculation which employs matching by DP(dynamic programming)on subphonemic segment sequences to take phonemic-context-dependent characteristics into account. In order to test the usefulness of the method, two types of word sets are composed using a distance-based clustering technique. Vocabularies of one type have dense sample distributions while the others have sparse sample distributions in a BWD sense. Speaker-independent word recognition is examined for these word sets using a common phone-HMM-based speech recognition technique. We compare the recognition results and the statistical characteristics of individual word sets, and present criteria for relative order of the recognition difficulty of given word sets. One criterion using between-word distance distributions of n-nearest neighbor words provides a reasonable index for the recognition diffculty.
- 社団法人日本音響学会の論文
著者
-
田中 和世
筑波大学図書館情報学系
-
児島 宏明
産業技術総合研究所
-
田中 和世
Electrotechnical Laboratory
-
児島 宏明
Electrotechnical Laboratory
関連論文
- 軽い音声認識システムの開発と課題(若手研究者育成レクチャーシリーズ,認識,理解,対話,一般)
- 三軸マイクロフォンアレイを用いた三次元ポインティング音声インタフェースの開発(福祉と音声処理,一般)
- 会議音声データの収録とデータファイル化
- ニュース音声コーパスの構築
- 視覚情報を対話的に学習するマルチモーダル擬人化エージェント
- 調音の構造的制約を考慮した音声特徴抽出の検討
- 声帯振動の非線形効果パラメータのパタン化とその評価
- 声帯振動の非線形効果パラメータのパタン化
- ホルマントと調音パラメータノモグラムを用いた音声の低ビット符号化法
- 声帯振動の非線形効果を考慮した合成音声とその評価
- 共通中間音声符号系を用いた音声認識方式
- 音声文書検索のための多言語音素片セグメントの応用(第5回音声言語シンポジウム : ポスターセッション)
- 音声文書検索のための多言語音素片セグメントの応用(第5回音声言語シンポジウム : ポスターセッション)
- 音声認識技術とその応用,現状と課題
- 利得適応型AR-HMM分解法を用いた音響モデルの雑音適応化の検討(音響と音声処理,音声強調,ロバスト音声認識)
- 利得適応型AR-HMM分解法を用いた音響モデルの雑音適応化の検討(音響と音声処理,音声強調,ロバスト音声認識)
- 汎用音声符号系への符号化と音声処理システムの構築
- 言語に共通な音声符号系を用いた音声検索システム
- ARHMMに基づいた音声分析手法と歌声認識による評価(聴覚・音声及び一般)
- 対話型英語学習システムにおける日本人英語音声認識精度の検討
- 日本人英語の特性に基づく音声認識を用いた英会話学習支援システム
- 言語に共通な音声符号系とその音響セグメントモデルの作成
- 単語発声の複数サンプルを利用した未知語の音韻系列の推定(音声情報処理 : 現状と将来技術論文特集)
- 自動推論 Wizard of OZ システムによる日本語自由発話コーパス
- 被覆率を重視した大語彙連続音声認識用統計的言語モデル
- 人の間, ものの間のインタフェース
- WOZシステムで収録した自由発話音声の対話データベース
- 音声認識用統計的言語モデルのための形態素解析済みテキストの後処理
- ノンバーバル情報を導入した音声・画像統合対話システムでの初期データ収録
- ノンバーバル情報を導入した音声・画像統合対話システムの設計
- 複数サンプルを用いた未知語の音韻系列の推定
- 複数サンプルを用いた未知語認識
- RWC計画における音声対話データベースの構築
- 休止を単位とした漸進的対話処理
- 対話システム制御における時間の扱い
- ユビキッキ : オフィス活動支援のための分散配置型ポータブルロボット(複合現実感,仮想都市,及び一般)
- 三軸マイクロフォンアレイを用いた三次元ポインティング音声インタフェースの開発(福祉と音声処理,一般)
- 音素上の文字列カーネルを用いた重度障害者の不明瞭音声コマンド認識(聴覚・音声・言語とその障害,一般)
- 音素上の文字列カーネルを用いた重度障害者の不明瞭音声コマンド認識
- HLAC尺度に依存した非定常信号処理 : 音素識別の性能評価(一般)
- 音素片と文字列カーネルを用いた語彙制約のないトピック分割について
- 音素片のカーネル主成分分析を用いたトピックセグメンテーション(セッション : 一般(知識処理), 「社会システムにおける知能」及び一般)
- 音素片のカーネル主成分分析を用いたトピックセグメンテーション
- 音素片のカーネル主成分分析を用いたトピックセグメンテーション(一般(知識処理), 「社会システムにおける知能」及び一般)
- マン・マシン対話データのピッチパターン分類に関する検討
- セグメント単位の音声符号列からのレキシコンの生成
- 区分線形セグメントラティスによる日英混合音声の認識
- 言語混合単語音声認識に関する実験的検討
- 区分線形セグメントラティスにおける音韻的チャンクの抽出
- 中間符号系と記号列間距離計算に基づく音声処理の提案
- 区分線形セグメントラティス音韻モデルにおけるクラスタリング
- 単語セットの音声認識難易度推定 : 記号領域における単語間距離計算の応用
- 記号領域における単語間距離の計算と音声認識難易度
- 区分線形セグメント列からの音素的構造の抽出
- 音声スペクトルからの識別的特徴抽出に関する実験的検討
- 音韻モデル獲得のための区分線形セグメントラティスの学習
- 時間の扱いを考慮した対話システム制御手法
- 区分線形セグメントラティスを用いた単語モデルの自動生成
- マンマシン対話における言語表現の多様性の解析
- MF143 表情筋および頸部の筋電位信号を利用した日本語母音の識別(MF14 情報・コミュニケーション支援,あたり前のことを知る)
- サポートベクターマシンを用いた筋電位信号からの日本語母音の識別(一般)
- 頸部から計測した筋電位信号を利用した発話認識
- 「話せばわかる」は「あたり前」?("あたり前"について考えたこと-福祉工学シンポジウム2007実行委員寄稿集-,あたり前のことを知る)
- 「音声研究者電子メールアドレス帳」について
- 単語音声サンプルからの音韻概念の獲得
- 認知症者とロボットの対話のための相槌認識における話者依存性の分析と話者適応の効果について(オーガナイズドセッション「人にやさしい音声情報処理」,福祉と音声処理,一般)
- 認知症者とロボットの対話のための相槌認識における話者依存性の分析と話者適応の効果について(オーガナイズドセッション「人にやさしい音声情報処理」,福祉と音声処理,一般)
- 軽度認知症高齢者のための情報支援システムにおける不適格発話に頑健な談話行為識別 (一般セッションと「ワークショップにおける学びの共有化」に関する特別セッション)