音声の変動記述のための知識ベースについて
スポンサーリンク
概要
- 論文の詳細を見る
音声認識システムの性能向上のカギは、そこで用いられる知識の質と量にある。この知識のうち特に重要なものは、音声の変動記述のための知識である。これは、同じ音素に相当する音声の音響的特性が音素コンテキスト、話者、発声速度などの要因により変動し、その変動が性能向上の大きなネックとなっているからである。本報告の目的は、筆者らが開発中の不特定話者大語彙単語音声認識システムにおいて用いられている変動記述のための知識を例として、知識ベースによる変動記述について考察することである。
- 一般社団法人情報処理学会の論文
- 1989-03-15
著者
関連論文
- デコンボルーションによる声道形の推定と適応型音声分析システム
- 視覚情報を対話的に学習するマルチモーダル擬人化エージェント
- コンピュータとの対話におけるユーザの振舞いの解析
- 視覚・聴覚・発話機能を有するエージェント型マルチモーダルインタフェースの試作
- 逆対称声道関数と母音特徴抽出
- Estimated Values of the Vocal Tract Crosssectional Area Functions-1-
- 声帯振動の非線形効果パラメータのパタン化
- 共通中間音声符号系を用いた音声認識方式
- 声帯振動の非線形効果を考慮した音声合成法とその評価
- ホルマント・ノモグラムによる音声パラメータの調音解析の検討
- 声帯振動の非線形性を考慮した音声合成法とその評価実験
- 基本波フィルタリング法による精細ピッチパターンの抽出
- 人の表情を有し音声対話・視覚機能を備えたマルチモーダルインタフェース
- 座談会 : 音声研究 (音声研究)
- ARHMMに基づいた音声分析手法と歌声認識による評価(聴覚・音声及び一般)
- 言語に共通な音声符号系とその音響セグメントモデルの作成
- 単語発声の複数サンプルを利用した未知語の音韻系列の推定(音声情報処理 : 現状と将来技術論文特集)
- 自動推論 Wizard of OZ システムによる日本語自由発話コーパス
- 人の間, ものの間のインタフェース
- 複数サンプルを用いた未知語認識
- RWC計画における音声対話データベースの構築
- 休止を単位とした漸進的対話処理
- 対話システム制御における時間の扱い
- サブスペース法を用いた音声強調法とその音声認識への応用(第2報)
- サブスペース法を用いた音声強調法の音声認識への応用
- EA2000-40 HMMによる音源のモデリングと高基本周波数に頑健な声道特性抽出法
- 身振りと発話のマルチモーダルデータベース
- IE2000-22 / PRMU2000-47 / MVE2000-51 ジェスチャ認識システム評価用ジェスチャデータベースの開発
- IE2000-22 / PRMU2000-47 / MVE2000-51 ジェスチャ認識システム評価用ジェスチャデータベースの開発
- IE2000-22 / PRMU2000-47 / MVE2000-51 ジェスチャ認識システム評価用ジェスチャデータベースの開発
- EM法を用いた複数情報源からの概念獲得
- EM法を用いた複数情報源からの概念獲得
- 単語アクセントパターン識別におけるモーラ単位HMMの語彙独立性の評価と検討
- 区分線形セグメントラティスにおける音韻的チャンクの抽出
- 中間符号系と記号列間距離計算に基づく音声処理の提案
- 区分線形セグメントラティス音韻モデルにおけるクラスタリング
- 記号領域における単語間距離の計算と音声認識難易度
- オフィス移動ロボットJijo-2 の音声対話システム
- 事情通ロボットの音声対話インターフェース
- 論争支援マルチモーダル実験システム MrBengo
- 論争支援のマルチモーダル実験システム
- 音声・視覚・画像をもつインタラクションシステム
- Multimodal Interaction System that Integrates Speech and Visual Information (特集 RWC研究--実世界知能の実現を目指して) -- (第2部 実世界知能研究推進センターの最新の研究成果)
- 実世界視覚情報を対話的に学習・管理する人間型ソフトウェアロボット (知能情報メディア論文特集)
- 人間型マルチモーダルエージェントによる実世界情報の学習と管理
- 実空間中の人物や物体を認識して対話するマルチモーダル擬人化エージェント
- 音声補完 : 音声入力インタフェースへの新しいモダリティの導入(インタラクティブシステムとソフトウェア)
- 音声補完 : 単語補完機能の評価
- マルチモーダル機能(「RWC-実世界知能」)
- 音声補完の評価
- 音声補完の評価
- 音声補完: 音声ワイルドカード補完機能の実現
- 自然発話中の有声休止箇所のリアルタイム検出システム(音声情報処理 : 現状と将来技術論文特集)
- 音声補完:単語補完ができる新たな音声入力インターフェース
- 2000-SLP-32-16 音声補完 : "TAB"on speech
- 有声休止箇所のリアルタイム検出システムの評価
- 自然発話中の言い淀み箇所のリアルタイム検出システム
- 区分線形セグメント列からの音素的構造の抽出
- 音声スペクトルからの識別的特徴抽出に関する実験的検討
- 音韻モデル獲得のための区分線形セグメントラティスの学習
- 時間の扱いを考慮した対話システム制御手法
- 区分線形セグメントラティスを用いた単語モデルの自動生成
- マンマシン対話における言語表現の多様性の解析
- クラスタリングによるHMM間の距離尺度の検討
- 日本音響学会研究用連続音声データベース (<小特集>出揃った音声データベース)
- 電総研の研究用音声データベース (<小特集>出揃った音声データベース)
- 休止を区切りとした対話処理
- 音声対話システム構築のための実対話データ収録実験
- 高度対話システムの実現のためのヒューマンファクタの解析
- 音声対話システムの研究と実用化の動向 (<小特集>音声によるコンピュータとの対話を目指して)
- 「音声研究者電子メールアドレス帳」について
- 音声の音響音声的変動パターンの類型化 : データベースと生成領域からの類推の利用 : 視聴覚技術 : 聴覚、音声関係および一般
- 実音声の音素片ラベリングに基づいた音響音声的変動パタ-ンの類型化と自動認識への応用
- CVC-Based Network Representation of Phoneme Sequences with Applications to Spoken Word Recognition (音声)
- Phonetic Network Representation of Phoneme Sequences Based on CVC-Unit Concatenation (音声)
- Hierarchical Representation of Speech in Symbolic Domain and Fine Phonetic Labeling (音声)
- Word Recognition System Using Network Representation of Acoustic Phonetic Segments (音声)
- 音声の変動記述のための知識ベースについて
- 音声の音響的変動記述の一般化について (新しい音声処理技術特集)
- 音素片ネットワ-クによる音声の音響的変動の記述と単語認識実験
- 音声の音素片ネットワーク表現と時系列のセグメント化法を用いた自動ラベリング手法
- マルチモーダル情報統合システムの研究動向
- 推定された母音声道面積関数の多変量解析
- 声道断面積関数の多変量解析による調音運動の線形表現
- 話者方向同定と雑音抑制による音声認識性能の改善 ( 音響信号処理による音声認識性能の改善)
- 遅延和アレイを用いた音源方向同定/雑音抑制システムの試作とその音声認識への応用
- 単語音声サンプルからの音韻概念の獲得