音声認識・合成カスタムコントロールの開発
スポンサーリンク
概要
- 論文の詳細を見る
音声認識・合成技術が広く利用されるためには、アプリケーション(AP)を簡単に開発できる環境提供が必要である。一方、現在WindowsなどのGUI OS上でのAP開発ツールとして、Visual BasicなどのVisualプログラミング環境が脚光を浴びている。Visual Basicでは、標準のコントロール(リストボックス、ボタン等)以外の機能はカスタムコントロール(VBX)として提供される。プログラマは、必要とされる機能に応じてVBXを入手し、利用することにより、効率良くAPを作成することができる。そこで、今回Visual Basic上の音声認識・合成VBXを作成したので報告する。筆者らはこれまでに、パソコン上のソフトウェアによる音声認識・合成エンジンを開発した。この認識・合成エンジンは、APと音声認識とをより密接に結び付け、APによる音声認識の柔軟な制御を可能とするアプリケーション・プログラミング・インターフェース(API)を持つ。今回作成した認識・合成VBXは、このAPIを利用することにより認識・合成機能を実現している。認識・合成VBXを利用することにより、C言語にてAPIを利用しAPを作成する場合に比べて、非常に短期間で音声認識・合成応用APが開発できる。
- 社団法人電子情報通信学会の論文
- 1996-03-11
著者
-
岩田 和彦
Nec
-
岩田 和彦
NEC 情報メディア研究所
-
野口 淳
NEC 情報メディア研究所
-
畑崎 香一郎
NEC 情報メディア研究所
-
畑崎 香一郎
Necメディア情報研究所
-
野口 淳
NEC・マルチメディア研究所
-
岩田 和彦
早稲田大学理工学部電気工学科
関連論文
- パソコン向け音声合成ソフトウェア
- F-9 大語彙音声認識を用いたPDA向け音声UIの試作(音声・音声言語情報処理,F.音声・音楽)
- ビームサーチを用いた大語彙音声認識方式の検討
- 自動通訳システムINTERTALKERにおける日本語音声合成
- 距離感を与える音声の特徴分析と合成(一般(ポスターセッション),第11回音声言語シンポジウム)
- 距離感を与える音声の特徴分析と合成(一般(ポスターセッション),第11回音声言語シンポジウム)
- パソコン向け音声認識合成プラットフォームの構築とアプリケーションの試作
- 音声認識・合成ソフトウェアを利用した音声I/Fを持つ電子メールシステムの試作
- 音声認識・合成カスタムコントロールの開発
- 音声認識/合成ソフトウェアのAPI開発
- パソコン向け音声合成ソフトウェアを利用したコミュニケーション支援装置の試作
- マルチメディア・パソコンにおけるテキスト音声合成の利用
- 音声合成 (日本語処理技術特集) -- (マルチモ-ダルインタフェ-ス技術)
- 概念表現を用いた自動通訳システムINTERTALKER
- SNRの変動を考慮したスペクトルサブトラクションの検討
- パソコン向け音声認識ソフトウェア
- 自動通訳システムINTERTALKERにおける音声認識
- 話し言葉認識に向けた基本技術と応用(抽出と解析)
- 話し言葉認識に向けた基本技術と応用(抽出と解析)
- F-10 2.5G携帯電話向け音声/Web連動型マルチモーダルUI(音声・音声言語情報処理,F.音声・音楽)
- バンドルサーチ法を用いた連続音声認識の高速化
- 日英双方向自動通訳システムINTERTALKER
- 連続音声認識からの概念表現の作成
- パソコン向けソフトウェア連続音声認識システム
- パソコンソフト連続音声認識
- 大語彙音声入力装置の開発
- 音声認識技術 音声認識技術とその応用 (認識と制御技術特集)
- 電話音声認識応答装置DS-X(T) (音声ヒューマンインタフェース特集)
- 音声認識の応用装置・システム (認識と制御技術 特集)
- 大語彙音声認識技術と音声応答技術 (認識と制御技術 特集)
- 音声合成のための単語の強調表現の規則化
- 話し言葉認識技術とその応用 (ユビキタス環境を活用し,企業競争力を向上させる「UNIVERGE」特集) -- (ソリューション)
- 音声入力パソコンネットワーク旅客機空席案内試作システム
- 音声インタフェースを用いたパソコンネットフライト空席案内
- 音声入力を用いたパソコンネット旅客機空席案内システム
- パソコン音声認識ソフトウエアを用いた音声ダイヤラの試作
- 電話音声対話システムビルダの開発
- マルチメディア検索 マルチモーダルWebアクセス (リッチメディア・コンテンツ・マネジメント特集)
- ロボットとの柔軟な対話を目的とした音声入出力システム : ―WABOT-2における会話系―
- 終助詞とその音調とによって聞き手に伝わる発話意図の分析(一般セッション,福祉と音声処理,一般)