パソコン向け音声認識ソフトウェア
スポンサーリンク
概要
- 論文の詳細を見る
近年、パソコン(PC)のCPU性能が大きく向上し、またA/Dコンバータが標準的に搭載されるようになるにつれて、PC上で特別のハードウエアを使わず動作する音声認識ソフトウェアの実現が可能になってきている。PCに音声認識機能を搭載することによって種々のアプリケーションソフトヘの音声入力インタフェースの付加が容易になる。また、ソフトウエアでの実現によって、音声認識機能を低コストで提供できる、CPUの速度向上に従って語彙サイズ・処理速度など認識性能の向上が可能であるという利点が生まれる。しかしながら、高度な音声認識処理の実現には現在のCPUの処理能力はなお十分ではない。このため、これまで実現されているPC上の音声認識ソフトウエアの多くは、単語単位の標準パターンを用いるものであり、話者の発声による単語登録の負担が大きく、また不特定話者に対して安定した認識精度を得ることが困難であった。筆者らは、これらの問題を解決するために、半音節認識単位を用いた不特定話者単語音声認識ソフトウェアをPC上に実現したので報告する。
- 一般社団法人情報処理学会の論文
- 1993-09-27
著者
-
篠田 浩一
Necマルチメディア研究所
-
渡辺 隆夫
日本電気(株)中央研究所
-
服部 浩明
Nec メディア情報研究所
-
磯 健一
Necメディア情報研究所
-
服部 浩明
NEC情報メディア研究所
-
渡辺 隆夫
NEC情報メディア研究所
-
畑崎 香一郎
NEC情報メディア研究所
-
山田 栄子
Nec・マルチメディア研究所
-
篠田 浩一
NEC情報通信メディア研究本部
-
水野 正典
NEC情報システムズ
-
磯 健一
NEC情報メディア研究所
-
野口 淳
NEC情報メディア研究所
-
高木 啓三郎
Nec 情報メディア研究所
-
山田 栄子
NEC情報メディア研究所
-
高木 啓三郎
NEC情報メディア研究所
-
EHSANI Farzad
NEC情報メディア研究所
-
坂井 信輔
NEC情報メディア研究所
-
水野 正典
NEC技術情報システム開発(株)
-
畑崎 香一郎
Necメディア情報研究所
-
野口 淳
NEC・マルチメディア研究所
-
篠田 浩一
Nec情報メディア研究所
関連論文
- シンボル列化したシーンの学習と2種のプレイ種相関度による野球放送映像プレイ種識別(画像・映像処理)
- SIFT混合ガウス分布と音響特徴を用いた映像からの高次特徴検出(テーマセッション関連,一般物体認識・画像特徴量)
- CHLAC特徴と隠れマルコフモデルを用いたGait認識(一般セッション2,複合現実感のためのパターン認識・理解)
- 統計的モデル選択によるシーン数の自動推定を用いた動画要約(一般セッション3,複合現実感のためのパターン認識・理解)
- 耐雑音音声認識のためのハフ変換による基本周波数情報抽出の高速化
- 音声とペン入力の同時入力に対する認識方式の検討(認識・理解・対話・一般)
- C&Cの夢,自動通訳の実現に向けて : 受賞業績 携帯端末など組込み機器向け多言語自動音声翻訳システムの実用化技術の開発(平成20年度喜安記念業績賞紹介)
- 数値列化したイベントシーンの学習と試合進行状況情報による制約条件を用いた野球映像イベント識別(パターン認識・メディア理解のための学習理論とその周辺)
- 基本周波数情報を用いたダイナミックベイジアンネットワークによる音声認識(聴覚・音声・言語とその障害,一般)
- 音声と手書き文字の同時入力インターフェース(マルチモーダル, コーパス・言語モデル)
- 弁別素性のグラフィカルモデリングによる音声認識
- 十分統計量を用いた教師なし話者適応における話者選択法(一般(ポスターセッション),第9回音声言語シンポジウム)
- 局所的な特徴と大局的な特徴を用いた監視カメラ映像からの行動イベント検出(一般,First Person Visionのための認識・理解)
- 携帯端末向け大語彙連続音声認識システム(音声,聴覚)
- 大語彙姓離散発声電話音声認識の検討
- コンパクトなディクテーションの開発
- D-14-6 コンパクト日本語ディクテーションの開発
- 音声による文章入力のための言語モデル適用法の検討
- F-9 大語彙音声認識を用いたPDA向け音声UIの試作(音声・音声言語情報処理,F.音声・音楽)
- PDAで動作する旅行会話向け日英双方向音声翻訳システム
- 木構造辞書とネットワーク文法を用いたコンパクト大語彙連続音声認識エンジン
- ビームサーチを用いた大語彙音声認識方式の検討
- LE-1 自由文通訳と例文選択型通訳を統合した自動通訳システム(E. 自然言語・文書)
- 音響モデル学習のための相対エントロピーを用いた学習文選択
- PDAで動作する旅行会話向け日英双方向音声翻訳システム
- 自動通訳システムINTERTALKERにおける日本語音声合成
- 音声と手書き文字の同時入力インターフェース(マルチモーダル, コーパス・言語モデル)
- AS-1-3 低消費電力マルチコアプロセッサで動作する大語彙連続音声認識とその応用(AS-1.マルチコアプロセッサ技術,シンポジウム)
- 十分統計量を用いた教師なし話者適応における話者選択法(一般(ポスターセッション),第9回音声言語シンポジウム)
- 十分統計量を用いた教師なし話者適応における話者選択法(一般(ポスターセッション),第9回音声言語シンポジウム)
- 音声認識における確率モデルの重み係数の自動推定(音声認識・識別,第9回音声言語シンポジウム)
- 音声認識における確率モデルの重み係数の自動推定(音声認識・識別,第9回音声言語シンポジウム)
- 音声認識における確率モデルの重み係数の自動推定(音声認識・識別,第9回音声言語シンポジウム)
- 音声認識のための高速最ゆう推定を用いた音道長正規化(音声情報処理 : 現状と将来技術論文特集)
- 音声認識のための高速最ゆう推定を用いた声道長正規化
- 音声認識のための高速最ゆう推定を用いた声道長正規化
- 音声認識のための高速最ゆう推定を用いた声道長正規化
- 局所的な特徴と大局的な特徴を用いた監視カメラ映像からの行動イベント検出(一般,First Person Visionのための認識・理解)
- 局所的な特徴と大局的な特徴を用いた監視カメラ映像からの行動イベント検出(一般,First Person Visionのための認識・理解)
- パソコン向け音声認識合成プラットフォームの構築とアプリケーションの試作
- 音声認識・合成ソフトウェアを利用した音声I/Fを持つ電子メールシステムの試作
- 音声認識/合成ソフトウェアのAPI開発
- 階層的Eigen Voice法による話者適応化(音声,聴覚)
- 階層的主成分分析を用いた木構造話者適応
- HMMの変分ベイズ学習によるテキスト文書の話題分割法(認識・理解・対話)
- HMMの変分ベイズ学習によるテキスト文書の話題分割法(認識・理解・対話)
- 概念表現を用いた自動通訳システムINTERTALKER
- 音声認識のためのスペクトルの調波構造の利用
- SNRの変動を考慮したスペクトルサブトラクションの検討
- 種々の電話機による音声認識性能の評価
- 環境変動を考慮した電話音声認識方式の種々の電話機による評価
- 雑音環境を考慮した自律型話者適応化
- 雑音環境の変動を考慮した話者適応化
- 音声認識のための高速環境適応
- 高速環境適応におけるコンパクト化の検討
- 雑音環境の変動に強い音声認識 (音声/オ-ディオ信号処理) -- (音声認識)
- 音声認識のための高速環境適応
- パソコン向け音声認識ソフトウェア
- 自動通訳システムINTERTALKERにおける音声認識
- 話し言葉認識に向けた基本技術と応用(抽出と解析)
- 話し言葉認識に向けた基本技術と応用(抽出と解析)
- F-10 2.5G携帯電話向け音声/Web連動型マルチモーダルUI(音声・音声言語情報処理,F.音声・音楽)
- 話者照合における連続音節認識による登録パターン作成方法
- 認識対象語彙の音素環境を考慮した半音節を用いた音声認識
- 音素環境を考慮した半音節を単位とする音声認識方式の検討
- 半音節単位に基づく単語認識のためのワードスポッティング
- 半音節を用いたワードスポッティングによる単語認識
- バンドルサーチ法を用いた連続音声認識の高速化
- 日英双方向自動通訳システムINTERTALKER
- 自動通訳システム (音声ヒューマンインタフェース特集)
- 連続音声認識からの概念表現の作成
- MDL基準を用いたHMMサイズの削減
- 音声認識のためのMDL基準を用いた効果的なガウス数削減
- 音声認識のためのMDL基準を用いた効果的なガウス数削減
- 音声認識における自律的なモデル複雑度制御を用いた話者適応化(論文賞贈呈)
- 音声認識における自律的なモデル複雑度制御を用いた話者適応化
- 情報量基準を用いた音声認識単位の自動生成
- 記述長最小原理を用いた話者適応化
- パソコン向けソフトウェア連続音声認識システム
- パソコンソフト連続音声認識
- 木構造化された確率分布を用いた話者適応化
- 大語彙音声入力装置の開発
- 音声認識のためのスペクトル内挿を用いた話者適応化
- 発話同時理解に基づく音声対話
- 音声認識システム
- 音素記号と特徴ベクトルの同時出力確率を用いた音声認識
- 音声インターフェースを用いたWeb新聞へのアクセス
- 音声インターフェースを用いたWeb新聞へのアクセス
- 話し言葉認識技術とその応用 (ユビキタス環境を活用し,企業競争力を向上させる「UNIVERGE」特集) -- (ソリューション)
- 半音節を単位とするHMMを用いた不特定話者音声認識
- 音声入力パソコンネットワーク旅客機空席案内試作システム
- 音声インタフェースを用いたパソコンネットフライト空席案内
- 音声認識におけるパタンマッチングの手法
- D-14-5 コンパクトな音声合成用テキスト解析エンジンの開発
- 決定木を利用した代表ピッチパタンの自動獲得
- 音声合成 (音声ヒューマンインタフェース特集)
- 音声入力を用いたパソコンネット旅客機空席案内システム
- パソコン音声認識ソフトウエアを用いた音声ダイヤラの試作
- マルチメディア検索 マルチモーダルWebアクセス (リッチメディア・コンテンツ・マネジメント特集)
- ニュ-ラル予測モデルを用いた不特定話者音声認識 (ニュ-ロコンピュ-ティング論文)