複合音響特徴平面に基づく音声認識のための局所特徴抽出法(音声情報処理 : 現状と将来技術論文特集)
スポンサーリンク
概要
- 論文の詳細を見る
音声認識システムの特徴抽出器を設計する新しい枠組みについて述べる.複合音響特徴平面(MAFP)に基づく特徴抽出は, 複数の音響特徴平面がスペクトル時系列上の特徴的な幾何学構造を分担して抽出することで, 高い性能を得ることを目指す.特徴抽出器は, スペクトル時系列の濃度パターンに隠された構造を, 3×3近傍に対する写像演算子を用いて抽出する.写像演算子は, 最初に3×3近傍の直交基底の形で音声から直接抽出し, 次に, これを単純化して使用する.連続音声から切り出した日本語の音声セグメントを対象とする不特定話者認識実験を通して, 後段の特徴選択器(KLT, LDA)と組み合わせた提案手法が, 少ない特徴ベクトル次元数で高い認識性能を達成できることを示す.
- 社団法人電子情報通信学会の論文
- 2000-11-25
著者
-
松浦 博
静岡県立大学経営情報学部
-
正井 康之
株式会社東芝研究開発センター
-
新田 恒雄
豊橋技術科学大学大学院工学研究科知識情報工学専攻
-
新田 恒雄
豊橋技術科学大学大学院工学研究科
-
井上 雄
東芝コンピュータエンジニアリング株式会社
-
松浦 博
(株)東芝
-
正井 康之
(株)東芝マルチメディア技術研究所
-
新田 恒雄
豊橋技術科学大学
-
松浦 博
(株)東芝 マルチメディア技術研究所
関連論文
- 日本語発話の発音誤り検出における留学生と日本人学生との対比 : 音声セグメント技術による「じ」と「ち」の弁別を中心として
- 音声認識応用に関する学会試行標準
- 幼児エージェントにおけるバイアスの形成と言語の構造化
- スライド共有による質疑応答機能を組み込んだ講義システムの開発(e-Learningコンテンツ/一般)
- 音声認識による発語機能評価システムを用いた健常歯列者の発語分析
- 3.上顎義歯の口蓋形態の違いが発語機能に及ぼす影響(一般口演,第35回学術大会)
- 3.上顎義歯の口蓋形態の違いが発語機能に及ぼす影響(一般口演II)
- チェアサイドで使用可能な発語評価のための音声認識の開発(産学連携論文)
- ウェブブラウザ上で動作可能なマルチモーダル対話システム(プラットフォーム)
- 音声対話技術コンソーシアム(ISTC)の活動成果報告(SIG-SLP内組織の活動報告)
- 2ZJ-6 動画視聴時の注目点を考慮した動画推薦方法の提案(人間行動,障害等支援,学生セッション,コンピュータと人間社会)
- 3ZA-7 デフォルメ地図の地上座標系へのマッピングを利用した現地情報提供システム(ITSネットワーク・地図情報,学生セッション,ネットワーク)
- DS-2-5 共有信念に基づく発話場面の推定(DS-2. 共生コンピューティング,シンポジウムセッション)
- DS-1-11 Cellプロセッサを用いた音声検索エンジンの高速化(DS-1. COMP-NHC学生シンポジウム,シンポジウムセッション)
- 生徒の検索情報を利用した講義の重要語抽出
- 幼児の学習バイアスを利用したエージェントによる語意学習の効率化
- 語彙学習エージェントにおけるバイアスの自律調整について
- 因果性に基づく信念形成モデルとN本腕バンディット問題への適用
- マルチモーダル対話システムのための階層的アーキテクチャの提案
- 重要語句に対する関連スライド群抽出法の検討(オープンソースソフトウェアの教育利用/一般)
- エージェントによる語意学習効率化のための対話戦略獲得
- Agent-Agent 対話により獲得した戦略に対する人間-Agent 対話からの実験評価
- 語意自動獲得における学習バイアスの効果
- 音素弁別特徴ベクトルの対数正規分布近似を用いた雑音環境下音声認識(認識・理解・対話)
- 音素HMMを環境適応的に選択して用いた競合モデルによる環境雑音のリジェクション
- 留学生による日本語発話におけるモーラタイミングの音声セグメント技術による評価 (特集 リズムとタイミング)
- 調音運動HMM音声合成における調音特徴--声道パラメータ変換と音源の改良 (音声)
- 調音運動HMM音声合成における調音特徴--声道パラメータ変換と音源の改良 (言語理解とコミュニケーション)
- 文字正解精度との相関の高い補正パープレキシティの算出法
- 東芝パソコンの音声認識 / 合成ソフトウェア
- パソコン用音声認識ソフトウェアの応用
- 音声認識/合成OCXの開発
- 予備選択とA^*探索による大語彙単語認識
- 単語スポッティングに適した語頭・語尾モデルの検討
- 東芝における最近の音声合成・認識の応用
- SBusカードを用いたWSベース大語彙音声認識システム
- 環境騒音の違いが音声認識に与える影響
- 音声認識のための周辺特徴の検討
- 音声認識のための周辺特徴の検討
- 音声認識のための周辺特徴の検討
- 調音運動HMM音声合成における調音特徴-声道パラメータ変換と音源の改良
- 上顎義歯の大連結子の走行が発語機能に及ぼす影響
- 東芝の音声認識・合成ソフトウエアの紹介
- パソコン用文音声合成ソフトウェアエンジンの開発
- 発話意図理解と回答誘導による異言語間会話支援ツールの試作(マルチモーダルインタフェース,インタラクション技術の原理と応用)
- 階層型アーキテクチャに基づいたWebベースMMIシステムの開発 (音声)
- 静的・動的情報を利用したMMIシステムの設計と実装(検索・対話)
- 受講情報を利用した学習支援機能付き講義再現システムの開発(遠隔教育/一般)
- 背景雑音を対象とした特徴パラメータ正準化法(ポスターセッション)(第6回音声言語シンポジウム)
- 背景雑音を対象とした特徴パラメータ正準化法(ポスターセッション)(第6回音声言語シンポジウム)
- 背景雑音を対象とした特徴パラメータ正準化法(ポスターセッション)(第6回音声言語シンポジウム)
- 音声認識のための特徴パラメータ正準化法の検討(認識・理解・対話)
- 音声認識のための特徴パラメータ正準化法の検討(認識・理解・対話)
- 音素弁別特徴間距離に基づくキーワード検出における音節単位サブワードモデルの検討(ポスターセッション)(第5回音声言語シンポジウム)
- 頑健な音声認識のための音素弁別特徴ベクトル直交化方式の検討(ポスターセッション)(第5回音声言語シンポジウム)
- 音素弁別特徴間距離に基づくキーワード検出における音節単位サブワードモデルの検討(第5回音声言語シンポジウム : ポスターセッション)
- 頑健な音声認識のための音素弁別特徴ベクトル直交化方式の検討(第5回音声言語シンポジウム : ポスターセッション)
- 音素弁別特徴間距離に基づくキーワード検出における音節単位サブワードモデルの検討(第5回音声言語シンポジウム : ポスターセッション)
- 頑健な音声認識のための音素弁別特徴ベクトル直交化方式の検討(第5回音声言語シンポジウム : ポスターセッション)
- 直交化音素弁別特徴ベクトルを用いた雑音に頑健な音声認識
- 音素弁別特徴ベクトルを用いた頑健な音声認識の検討
- 音声処理モジュールのプログラミングインタフェースとアプリケーション開発環境
- 音声合成/認識APIと応用ソフト開発環境の動向
- 音声入出力のタッチパネルを用いたマルチモーダル対話システムの試作
- 音声言語インタフェースのための情報処理学会試行標準
- 音声認識読み記号および音声関連ソフトウエアに係わる用語の試行標準案
- 音声言語情報処理に関する情報処理学会の試行標準策定活動
- 音声言語情報処理に関する情報処理学会の試行標準策定活動
- 複合音響特徴平面に基づく音声認識のための局所特徴抽出法(音声情報処理 : 現状と将来技術論文特集)
- マルチモーダルUIにおけるモダリティ制御統一のためのモデル化手法 (音声言語情報処理)
- ラピッドプロトタイピングツールMuseのCASEへの適用(マルチモーダルIF (3),「マルチモーダルと音声HI」およびヒューマンインタフェース/音声言語情報処理一般)
- ラピッドプロトタイピングツールMuseのCASEへの適用
- SIG-SLP/SIG-NL合同セッションここまでできるぞ音声/言語処理技術 : 音声編
- ここまでできるぞ音声/言語処理技術 : 音声編
- ラピッドプロトタイピングツールMuseの開発
- オブジェクト指向モデリングおよび設計を用いたラピッドプロトタイピングツールMuseの開発
- ラピッドプロトタイピングツールMuse(1)
- 社会情報システムのためのラピッドプロトタイピングツールMuseの開発
- 社会情報システムのためのラピッドプロトタイピングツールMuseの開発
- マルチモーダルUIとラピッドプロトタイピング
- マルチモーダルUIとラピッドプロトタイピング
- マルチモーダルUIデザイン支援ツールの開発
- マルチーモーダル対話システムのためのUI設計支援ツール
- マルチモーダル対話システムMultiksDial
- マルチモ-ダル対話の社会情報システムへの応用 (ヒュ-マンインタフェ-ス)
- 音声入出力とタッチパネルを用いたマルチモーダル対話システムの評価
- 階層型アーキテクチャに基づいたWebベースMMIシステムの開発(一般セッション,クロスモーダル)
- 階層型アーキテクチャに基づいたWebベースMMIシステムの開発(一般セッション,クロスモーダル)
- Windows PC用音声認識ソフトウェア
- KL展開と一般化確率降下法によるセグメント量子化の高速化
- 高速版SMQ/HMMによる不特定話者音声認識
- カテゴリごとの部分空間を埋め込んだニューラルネットワークによる不特定話者音声認識
- チェアサイドで補綴治療時の発語機能評価が可能な音声認識装置の開発
- SMQ/HMM方式に基づく不特定話者大語彙単語認識
- 音声認識へのニュ-ラルネット応用 (ニュ-ラルネット利用技術)
- 不特定話者の連続音声認識に対する調音パラメ-タの有効性--母音認識実験による検討
- SMQ/HMM方式に基づく不特定話者大語い単語認識
- 直交化音声セグメント符号帳を用いたHMMに基づく不特定話者単語認識
- K-L変換に基づく話者適応と高速辞書照合を用いた大語い単語音声認識 (新しい音声処理技術特集)
- 留学生による日本語発話におけるモーラタイミングの音声セグメント技術による評価(リズムとタイミング)