Proxy-Agentを用いた音声認識対応ウェブアプリケーション開発フレームワークの提案と実装(音声基盤技術・インタフェース)
スポンサーリンク
概要
- 論文の詳細を見る
Proxy-Agent[1]に対する拡張機能として開発した音声認識システムと,HTML+JavaScriptベースのウェブアプリケーションとの連携を可能にする枠組みを紹介する.Proxy-Agentは,音声認識システムに対してプラグインの枠組みを導入し,汎用的な機能拡張を可能にするソフトウエアコンポーネントである。提案手法では,Proxy-Agentと音声認識エンジンをネットワーク経由で動的に配信・起動する.また,Proxy-AgentがHTTPベースのブラウザ連携の枠組みを提供し,ブラウザ側とのJavaScriptでの連携を可能にする.本稿ではさらに,提案手法のプロトタイプとして開発したネットワーク配信型音声認識システムと,それを用いたウェブアプリケーション開発手法について紹介する.
- 一般社団法人情報処理学会の論文
- 2008-02-08
著者
-
小林 哲則
早稲田大学理工学術院
-
藤江 真也
早稲田大学高等研究所
-
中野 鐵兵
早稲田大学
-
小林 哲則
早稲田大学情報理工学科
-
小林 哲則
早稲田大学理工学部電気電子情報工学科
-
小林 哲則
早稲田大学
-
中野 鐵兵
早稲田大学理工学術院情報理工学科
-
藤江 真也
早稲田大学
関連論文
- 音声認識実用化技術の展開(総合報告)
- 複数情報の統合による人物の性別・年齢層の推定法(顔とジェスチャの認識)
- クラス距離を重みとする局所保存射影とその顔画像による年齢推定への応用(テーマ関連セッション2)
- 会話ロボットとその聴覚機能
- 音声シフト : 音高の意図的な変化を利用した音声入力インタフェース(音声, 聴覚)
- 音声シフト : "SHIFT"on Speech
- I-062 監視カメラ映像からの実時間顔検出手法の一検討(I.画像認識・メディア理解)
- 複数情報の統合による人物の性別・年齢層の推定法
- 探索空間のエントロピーに基づく特徴量ストリームの動的な統合(音声認識・識別,第9回音声言語シンポジウム)
- 集合知に基づく語彙情報を用いたトピック依存言語モデリング(理解)