音響セグメントネットワークを用いた大語い音声認識
スポンサーリンク
概要
- 論文の詳細を見る
音素は音声認識でよく用いられる音声単位であるが,自動認識の単位として問題点をもつ.本論文では,この問題点を考慮し新たに定義した音声単位である音響セグメントを用いた認識方式を紹介する.また,大語い単語音声認識におけるこの方式の評価について述べる.音響セグメントは,既存の音声知識と大量の音声の観察に基づき,日本語の音声認識を目的として我々が定義したもので,固有のスペクトルと単語内位置に応じた継続時間長をもつ111種類の音声単位である.単語認識においては,単語の音素表記に音素-音響セグメント変換ルールを適用することにより自動生成した音響セグメントネットワークを単語テンプレートとして使用した.音響セグメントのスペクトルは,28種類のカテゴリーをもち,各カテゴリーごとに複数の音響テンプレートで記述した.音響テンプレートは話者ごとの184単語の登録発声から自動抽出した.また,各音響セグメントの継続時間長については,その平均と標準偏差を,男性10名の合計10,000文節発声から求めた.男女各5名による特定話者1,000単語認識において本方式を評価した結果,平均認識率98.0%が得られ,その有効性が確認できた.
- 社団法人電子情報通信学会の論文
- 1994-03-25
著者
関連論文
- 喉頭全摘術後の音声機能喪失患者のための新しい発声システムの開発 : 口腔内振動子を用いた人工喉頭と術前の音声合成による術後の会話のためのPDA(医工連携)
- コーパスベース音声合成実用化上の課題(チュートリアル: 音声収録から始めるコーパスベース音声合成, 一般, チュートリアルレクチャー)
- 文型-韻律データベースを用いた定型文音声合成システム
- 失語症在宅リハビリ支援システムの開発と評価
- 感情音声合成における声質と韻律の制御の効果
- 高品質音声合成技術 (特集 音声合成・認識技術)
- 日本語音声合成システムのための住所データベースの開発
- 日本語テキスト音声合成を利用した歌唱合成システム
- パソコン用のテキストから顔動画像へのメディア変換システム : 画像通信技術,オフィスシステムおよび一般 : 画像通信システム
- パソコン用のテキストから顔動画像へのメディア変換システム
- コンピュータ音声認識技術を利用した発語明瞭度自動検査システムの開発
- 音響セグメントネットワークを用いた大語い音声認識
- 音声技術の社会化
- 耳鼻咽喉科領域の医工融合 : 音声合成技術
- PD-2-4 話者認証の実用化事例
- 声紋認証 (特集 自動認識--バイオメトリクスの最前線(part 2))
- 文法情報を用いた音声認識装置の言語処理方法
- 雑音環境下における音声認識技術 (特集 音声合成・認識技術)
- 日本語連続文音声認識における探索手法の検討
- 音声認証技術とセキュリティシステムへの応用 (特集2 最新バイオメトリクス技術とセキュリティシステムへの適用事例)
- 音声による個人認証 (特集 最近のほんもの確認技術)
- ユビキタスコンピューティングで注目されるバイオメトリクス技術 (特集 バイオメトリクスを中心としたセキュリティシステム)
- 音声合成・認識技術の進展 (特集 音声合成・認識技術)
- ソフトウェア音声認識・合成技術 (最先端の研究開発--マルチメディアに向けた要素技術とシステム)
- PC向け音声認識技術(富士通) (特集 応用製品も登場、いよいよ実用化時代へ 99音声認識探検隊) -- (応用事例)
- 第104回日本耳鼻咽喉科学会総会シンポジウム : 耳鼻咽喉科領域の医工融合 : 音声合成
- バイオメトリック認証技術について
- 失語症在宅リハビリ支援システムの開発と評価(福祉とVR)
- 声帯内ヒアルロン酸注入術
- コールセンターにおける音声技術の利用〜音声のパラ言語情報・非言語情報を含めた活用〜