不特定話者・連続音声向き単語音声の識別 (<小特集>パターン情報処理)
スポンサーリンク
概要
- 論文の詳細を見る
As a sub-system of the speech understanding system, we developed a classification method of spoken words in continuous speech for many speakers. Speech wave is converted into a time series of short time spectra by 20-channel filter bank and is segmented into four groups: silence, unvoiced-nonfricative, unvoiced-nonplosive, and voiced group. The unvoiced groups are classified into a unit of phoneme by heuristic algorithms and voiced group by Bayes rule. To normalize the variation of reference patterns among speakers, vowel patterns are learned by the non-supervised learning method. The optimum matching between a just recognized phoneme string and a phoneme string of a given word in the word dictionary is performed by utilizing the phoneme similarity matrix and Dynamic Programming. According to the results tested upon 1,500 samples of isolated digits, spoken by 20 male speakers, about 97% were correctly recognized and, in case of the system adapting for each speaker,98% correctly recognized.
- 一般社団法人情報処理学会の論文
- 1976-07-15
著者
関連論文
- 1992年音響・音声・信号処理国際会議(ICASSP-92)報告
- ニュース音声の認識とその要約・検索による検討
- 機械学習を用いた複数の大語彙連続音声認識モデルの出力の混合 : 旅行会話音声における評価
- Spoken Term Detection のためのテストコレクション構築とベースライン評価
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- 座談会 : 音声研究 (音声研究)
- Spoken Term Detection のためのテストコレクション構築とベースライン評価
- ここまでできるぞ音声/言語処理技術 : 音声編
- 部分パターンによる漢字の合成
- 図面の論理構造マッチング手法
- 色再現を考慮した擬似フルカラー表現方式
- 画像特徴を利用した文書画像の蓄積・検索方式
- ニュース音声認識システムの検討
- 座談会「これからの人間と機械」
- SD-2-1 日本語音声教育のための音声データベース
- 将来の入出力装置
- 音声による対話システムにおける発話の確認方法
- 音声スペクトルの時間軸・周波数軸・強度軸の同時非線形伸縮に基づく不特定話者の単語音声の認識
- 音声自動認識に関する情報工学的諸考察
- 日本語算術文の音声認識におけるピッチパタ-ンの利用
- 日本語音声スペクトルの特徴分析および音声認識・話者認識への考察
- 個人差の種々の学習機能をもつ実時間単語音声識別システム
- 不特定話者・連続音声向き単語音声の識別 (パターン情報処理)
- 自然な発話を対象としたパソコン/ワークステーション用連続音声認識ソフトウェア
- 日本人話者による英語文・単語音声データベースの構築
- KUKPNET システム(分散処理)
- 発話位置依存ケプストラム平均正規化に基づくGMMと話者適応化音節HMMの併用による遠隔発話の話者認識
- NTCIR-3音声入力ウェブ検索タスクにおける複数音声認識モデル混合の評価
- SVMを用いた複数の大語彙連続音声認識モデルの出力の混合
- インハウス・コンピュータ・ネットワークとHOSTコンピュータ
- 濃淡図形からの線要素の抽出とパターンの認識
- 最近の言語処理研究について
- 情報処理の最近の進歩
- 文字読取装置と音声用装置
- 7p-L-3 音声の機械認識
- ヨーロッパの計算機の現状について
- それぞれの役割(ちょっとしたエッセイ,コーヒーブレーク)
- ボトムアップ制御とトップダウン制御の組合わせによる領域解析
- 領域分割処理によるカラー画像情報の構造化
- ディジタル画像情報の会話型処理システム
- 2-1 概説(2.コンピューターによる画像処理 画像とコンピューター)
- 機械による会話音声の認識・理解研究の動向
- 合法パターン頻度分布に基づく9か国文字の類別
- 第28回全国大会にあたって : 会長あいさつ
- 第27回全国大会にあたって : 会長あいさつ
- 動的領域割付けによる部分パターンからの文字, 設計図面の合成
- ニュー・フォーラム
- 二値線図形に対する画質判定と雑音除去法
- 基礎と応用 (輪廻が技術革新)
- 人工知能への期待 (人工知能とデータベース : 関西支部セミナーより)
- コンピュータ・ネットワークと情報処理
- 発想の転換
- 17-20 漢字入出力システムの実験
- 13. 機械翻訳の模型と方式
- 人工カラー画像の領域の特徴を利用した符号化
- 実時間画像貼り合わせ機能を持つハンドスキヤン型文書画像入力装置
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 色マーク手書き記入による図面の自動編集・校正
- 音声ドキュメント処理ワーキンググループ活動報告
- 「人工知能学会」発足によせて
- 情報システムにおける音声の認識と合成
- 1980年代の画像処理 (イメージプロセッシング)
- 日本語と機械