HMM及びケプストラム係数特徴による筋電信号を用いた無発声音声認識(福祉と音声処理及び一般)(音声)
スポンサーリンク
概要
- 論文の詳細を見る
筋電信号による無発声音声認識を実現するため、筋電信号の時系列信号をHMMで処理する方法を提案する。また筋電信号に対しLPC分析を適用し、ケプストラム係数を特徴量として用いる手法を提案する。日本語の孤立数字認識タスクで提案する手法を評価する。一人話者の14個数字の発声データ(筋電信号)に対し認識実験を行った。発声の長さが変動するような筋電時系列信号に対するHMM適用の可能性を示した。またケプストラム係数を特徴とし用いて、振幅(パワー)だけを特徴とする手法との比較を行い、オープンとクローズの二種類の実験平均で認識精度を9.3%向上し、提案手法の有効性を確認した。
- 社団法人電子情報通信学会の論文
- 2003-10-24
著者
-
張 志鵬
NTTドコモマルチメディア研究所
-
杉村 利明
NTTドコモ マルチメディア研究所
-
杉村 利明
(株)NTTドコモマルチメディア研究所
-
真鍋 宏幸
(株)nttドコモマルチメディア研究所
-
真鍋 宏幸
NTTドコモ総合研究所
-
堀越 力
NTTドコモ マルチメディア研究所
-
杉村 利明
Ntt Docomo マルチメディア研究所:nttヒューマンインタフェース研究所
-
真鍋 宏幸
Nttドコモ先進技術研究所
関連論文
- 頑健な区間検出とモデル適応に基づく雑音下音声認識(雑音下音声処理)(第6回音声言語シンポジウム)
- 区分線形変換による雑音適応法のための木構造クラスタリング法の検討
- 区分線形変換による雑音適応法における木構造クラスタリング法の検討
- 尤度最大化規準による雑音適応
- 雑音重畳音声に対する各種適応手法の検討
- 話者クラスタに基づく初期モデルを用いた話者適応
- 常時装用インタフェースの実現を目指したイヤホンによる視線検出技術 (ユーザインタフェース研究特集--ケータイの新たなカタチ)
- 携帯電話機搭載カメラを用いた読取り条件にロバストなID読取り方式(画像認識、コンピュータビジョン)
- 複数カメラを用いたテレプレゼンスシステムに関する検討
- モバイル環境下における携帯端末を用いたID読取方式の検討
- I-56 携帯端末付属カメラを用いた低品質画像のカラーセグメンテーションに関する基礎検討(画像応用,I.画像認識・メディア理解)
- 筋電信号のインタフェースへの応用(生体信号計測の人工知能分野への応用)
- 周囲から知覚されない微小動作による認証:AwareLESS認証 (新たな入力方式の提案)
- NTTドコモ 総合研究所
- モバイルコミュニケーションメディア : 現在と未来(MoMuCセッション,超高速モバイル通信時代のマルチメディアアプリケーション及び一般)
- モバイルコミュニケーションメディア : 現在と未来
- 未来のモバイルマルチメディア
- 時間粒度に着目した状況の獲得
- メガネ型インタフェースで可能になるデバイス選択の自由
- AS-7-4 フレームレートと動き量に基づく映像のジャーキネスに関する検討(AS-7. イメージメディアクウォリティ, 基礎・境界)
- HMM及びケプストラム係数特徴による筋電信号を用いた無発声音声認識
- HMM及びケプストラム係数特徴による筋電信号を用いた無発声音声認識(福祉と音声処理及び一般)(音声)
- HMM及びケプストラム係数特徴による筋電信号を用いた無発声音声認識(福祉と音声処理及び一般)
- 実世界情報基盤に向けた人間活動情報の獲得と利用
- 映像中のテロップ表示フレーム検出方法
- D-12-10 映像中に挿入された部分画像検出方法
- 映像中の静止/ロールテロップの検出方法
- PC版映像中テロップ認識システム
- ライン単位の二値化による映像中文字領域の抽出方法
- モバイルコミュニケーションメディア : 現在と未来(MoMuCセッション,超高速モバイル通信時代のマルチメディアアプリケーション及び一般)
- 無発声音声認識 : 筋電信号を用いた声を伴わない日本語5母音の認識(マルチメディア処理)
- K-27 無発声音声認識のための指輪型電極の提案(ヒューマンインタフェース(HI)1,K.ヒューマンコミュニケーション&インタラクション)
- K-16 顔と口唇に特化したロボットを介した表情再現型通信(ヒューマンコミュニケーション基礎(2),K.ヒューマンコミュニケーション&インタラクション)
- New Technology Report 無発声によるコミュニケーション技術
- K-31 日常生活空間におけるユーザ支援システムとトラッキングによるアプリケーションの実現(マルチメディア・仮想環境基礎1,K.ヒューマンコミュニケーション&インタラクション)
- 実世界情報基盤に向けた人間活動情報の獲得と利用
- 画質劣化にロバストな映像中テロップ文字認識
- 画質劣化を考慮した映像中文字認識
- モバイル環境雑音に強い音声認識技術
- B-26 待ち受けiアプリの設計と評価(Webアプリケーション,B.ソフトウェア)
- 2P2-K7 ケータイマルチメディアによるマン・マシンコミュニケーションの実現 : iモード対応Javaを用いたロボットの遠隔操作(32. ネットワークロボティクス・メカトロニクスにおけるマルチメディアネットワークI)
- 9.携帯電話向けコンテンツ記述言語の動向(モバイル社会を支える先端技術 : 小型化と使いやすさを極める)
- ケータイコンピューティングへの展望(モバイル・ウェアラブルインテリジェンス)
- アドホックネットワークによるユビキタスインターネットアクセス
- アドホックネットワークによるユビキタスインターネットアクセス
- アドホックネットワークによるユビキタスインターネットアクセス
- アドホックネットワークによるユビキタスインターネットアクセス
- アドホックネットワークによるユビキタスインターネットアクセス
- 小型多眼立体ディスプレイ方式
- ニュース音声認識のための言語モデルと音響モデルの検討
- ニュース音声認識のための言語モデルと音響モデルの検討
- ニュース音声認識のための言語モデルと音響モデルの検討
- 電気刺激触覚ディスプレイを用いた感覚閾値実験
- 分身インタフェース技術--実体のあるロボット通信端末でコミュニケーションをリッチに (新概念通信特集)
- 生体情報インタフェース技術 (特集 モバイルコミュニケーションスタイルを変革する新インタフェース技術)
- モバイルマルチメディア最新技術(3)モバイル環境に向けた音声認識技術の現状
- ニュース音声認識の話者適応法の検討
- 頑健な区間検出とモデル適応に基づく雑音下音声認識(雑音下音声処理)(第6回音声言語シンポジウム)
- 頑健な区間検出とモデル適応に基づく雑音下音声認識(雑音下音声処理)(第6回音声言語シンポジウム)
- 区分線形変換による尤度最大化雑音適応法の検討
- 尤度最大化規準による雑音適応
- MLLRにおける適応データの量に応じたクラスタ数の選択法
- アドホックネットワーク上のコミュニティのためのグループ通信プロトコル (ITSとモバイルコンピューティング)
- 生体情報インタフェース技術 (新概念通信特集)
- Bluetooth Beaconsによる歩行者ナビゲーションの一検討
- Bluetooth Beaconsによる歩行者ナビゲーションの一検討
- アドホックネットワークによるユビキタスインターネットアクセス
- シームレスサービス実現のためのモバイルマルチメディアミドルウェア
- シームレスサービス実現のためのモバイルマルチメディアミドルウェア
- 携帯機とテレロボットのヒューマンコミュニケーションのコンセプト
- 分身インタフェース技術 (特集 モバイルコミュニケーションスタイルを変革する新インタフェース技術)
- Techno Box モバイルマルチメディア最新技術(1)ケータイIFからウェアラブルIFへ--携帯環境で使いやすいインタフェースとは?
- ヘッドホンを用いたEOG法による視線入力インタフェース
- モバイルマルチメディア最新技術(その2)ロボット進化の予想と実体のあるロボットによる新しいヒューマンコミュニケーションスタイル
- 常時装用インタフェース技術--思考支援を目指して (新概念通信特集)
- I-37 全方位画像の動きベクトルを利用したカメラ位置姿勢推定手法に対する誤差要因の影響(全方位画像解析・ロボットビジョン,I.画像認識・メディア理解)
- 全方位画像の動きベクトル解析によるカメラ位置姿勢推定手法の一検討
- 全方位画像の動きベクトル解析によるカメラ位置姿勢推定手法の一検討
- 全方位画像の動きベクトル解析によるカメラ位置姿勢推定手法の一検討
- Headphone Taps:通常のヘッドホンへのタップ入力