音声認識技術の利用形態とその性能評価に関する一検討
スポンサーリンク
概要
- 論文の詳細を見る
音声認識技術は、ハードウェアの進歩と共に発達し、最近では種々の分野で多くの商品が販売されるようになっている。また、現在のようなブロードバンド社会では、情報端末機器の小型化や携帯化を考慮して音声認識技術の利用形態も広まっている。しかし、音声認識技術の利用形態は、認識率、耐雑音性あるいは音声応用という特異性等から応用分野が限られているのも現状である。本報告では、音声認識技術のより最適な利用形態(出口)を模索するために次の検討を行った。(1)音声認識技術の利用実態調査、(2)電話系とマイク系の代表的な音声認識エンジンの基本性能評価、(3)実環境における評価、(4)音声認識技術の利用形態に関する考察。
- 一般社団法人情報処理学会の論文
- 2002-02-01
著者
関連論文
- 再帰的画面分割を用いた肢体不自由者向けポインティング補助手法の開発と評価(肢体障害・聴覚障害,HCGシンポジウム)
- 1Y-9 Google Mapsを利用した調査支援システムの開発(ユーザインタフェース,学生セッション,インタフェース)
- TKA術前計画における骨参照情報を利用したレジストレーション手法(一般セッション,映像ハンドリング技術とその応用)
- 2Y-5 円周分割入力方式における入力切り替え方式の検討(入出力インタフェース,学生セッション,インタフェース)
- 1Y-7 画面拡大による高齢者のためのポインティング操作支援手法に関する研究(ユーザインタフェース,学生セッション,インタフェース)
- 3Q-5 携帯電話のメール機能を利用した生活音識別システムの検討(音声の分析・合成,学生セッション,人工知能と認知科学)
- 生活音識別システムにおける識別結果呈示法に関する研究(識別・同定,システムLSIの応用と要素技術,プロセッサ,DSP,画像処理技術及び一般)
- 事前登録型生活音自動識別システム(聴覚・音響信号処理/一般)
- 6ZC-2 被写体を想起させる映像の時間的低解像度化に関する検討(コミュニケーション,学生セッション,インターフェース)
- 5ZC-3 円周分割入力方式における誤入力を許容する候補語選択に関する研究(モバイル,学生セッション,インターフェース)
- 5ZC-2 円周分割入力方式におけるサウンドフィードバックの効果の検証(モバイル,学生セッション,インターフェース)
- 5ZC-1 円周分割入力方式における精度向上のための拡大調整機能の検討(モバイル,学生セッション,インターフェース)
- 5ZL-3 注視情報に基づく画像理解のための着目領域の抽出に関する研究(視線解析,学生セッション,人工知能と認知科学)
- 2W-1 カラライゼーションにおけるLuPCモデルの有効性に関する検討(画像処理基礎,学生セッション,人工知能と認知科学)
- 2S-7 地方都市における犯罪多発地域に基づく地区の類型化(科学データベースとメディア,学生セッション,データベースとメディア)
- 2S-4 Google Mapによる水稲危機情報の効果的な提示に関する研究(科学データベースとメディア,学生セッション,データベースとメディア)
- 身体特徴と声質との関連性に関する一検討
- D-14-28 身体特徴と声質との関連性に関する一検討
- D-11-128 Hough空間における投票ヒストグラムを利用したFAX帳票識別(D-11.画像工学D)
- D-11-97 フィルムの粒状感に基づいたディジタル画像の質感改善(D-11.画像工学D)
- ラジオとインターネットのメディア連携に関する一考察(セッション2:放送とネットワーク技術)
- ラジオとインターネットのメディア連携に関する一考察
- D-12-168 最頻動きベクトルを利用したニュース速報テロップの除去(D-12. パターン認識・メディア理解B)
- D-14-2 MRI 解析を利用した顔画像からの声道長推定
- 講義のユニバーサルデザインを目指した情報提示方法に関する検討(障害者教育/一般)
- 2S-3 GISによる琵琶湖への河川流入負荷量推定シミュレーション(科学データベースとメディア,学生セッション,データベースとメディア)
- TKA術前計画における骨参照情報を利用したレジストレーション手法(一般セッション,映像ハンドリング技術とその応用)
- TKA術前計画における骨参照情報を利用したレジストレーション手法(一般セッション,映像ハンドリング技術とその応用)
- ラジオとインターネットのメディア連携に関する一考察(セッション2:放送とネットワーク技術)
- CT画像からの立位三次元膝関節モデルの生成手法
- 1U-2 気導と骨導の加算処理を利用した環境騒音低減法に関する一検討(音声分析・強調,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 回帰面による輝度画像のエッジ抽出法
- D-11-88 濃淡画像からの色相領域分割における領域形状の客観的評価(D-11.画像工学D)
- 音声コミュニケーションに関わるバリアフリー(音支援(音バリアフリー)を考える)
- 1N-8 周期的な動作を伴う機械の異常診断システムに関する一検討(システム評価,学生セッション,ソフトウェア科学・工学,情報処理学会創立50周年記念)
- K-021 携帯メール機能を用いた事前登録型生活音自動識別システム(教育工学・福祉工学・マルチメディア応用,一般論文)
- E-048 ウイグル語単音節の出現頻度とその特徴分析(自然言語・音声・音楽,一般論文)
- 生活音識別システムにおける識別結果呈示法に関する研究(識別・同定,システムLSIの応用と要素技術,プロセッサ,DSP,画像処理技術及び一般)
- 生活音識別システムにおける識別結果呈示法に関する研究(識別・同定,システムLSIの応用と要素技術,プロセッサ,DSP,画像処理技術及び一般)
- DSP処理を目的とした簡便な雑音抑圧処理に関する検討
- D-14-1 声道特性(声道長)が個人性知覚に及ぼす影響
- 音声認識技術の利用形態とその性能評価に関する一検討
- 音声認識技術の利用形態とその性能評価に関する一検討
- 音声と非音声の識別処理に基づく定常雑音抑圧方式
- 事前登録型生活音自動識別システム
- 聴覚障害者支援を目的とした生活音識別システム
- 気導音と骨導音の蝸牛加算モデルに関する一検討
- メディカル CT画像からの立位三次元膝関節モデルの生成手法
- 回帰面を用いた高精度なエッジ抽出法
- D-14-4 声道模型を用いた個人性知覚に関する検討(D-14. 音声・聴覚)
- D-14-4 聴知覚特性に基づく自動音量制御法
- ユビキタスネットワーク社会とアクセシビリティ
- 聴覚障害者支援を目的とした生活音識別法に関する検討