音声認識機能を有するWebアプリケーションの実装と評価
スポンサーリンク
概要
- 論文の詳細を見る
PC やモパイル端末を問わず,Web ブラウザのみでサーバークライアント型音声認識機能を実現する方式の提案とその実用性について報告する.我々が提案する方式では,クライアントで実行される JavaScript のみで音声認識機能の利用が可能となるため,ブラウザさえインストールされていれば端末を問わず音声認識機能を利用することができる.具体的には,クライアントのブラウザ上で実行される JavaScript にて音声データの取得と圧縮,Web サーバへのストリーミング送信を実施し,音声区間検出器 (Voice Activity Detector; VAD) は,音声認識処理とともにサーバに構築して実施する.これによりクライアントでの計算コストを削減し,Web ブラウザのみでの音声認識を実現する.本稿では,提案する方式のシステム構成について述べた上で,ブラウザや端末の対応状況,クライアントでのリサンプリングと音声データの圧縮処理速度の計測,モバイル回線での音声認識処理時間の計測を行い,その実用性について述べる.検証の結果,ノイズなし音声サンプルでの本システムの認識処理速度は実時間係数で平均で 1.26, 文字正解精度は平均で 94.8[%] であり,実用に耐えうる音声認識機能の実現が可能であることがわかった.
- 2014-05-08
著者
-
山田 智広
日本電信電話株式会社NTTサイバーソリューション研究所
-
藤村 考
日本電信電話株式会社nttサービスエボリューション研究所|現在 大妻女子大学社会情報学部
-
藤村 滋
曰本電信電話株式会社NTTサービスエポリューション研究所
-
槙 優一
曰本電信電話株式会社NTTサービスエポリューション研究所
-
鎌土 記良
NTTメディアインテリジェンス研究所
-
青野 裕司
NTTメディアインテリジェンス研究所
-
中山 丈二
曰本電信電話株式会社NTTサービスエポリューション研究所
-
阪内 澄宇
NTTメディアインテリジェンス研究所
-
山田 智広
曰本電信電話株式会社NTTサービスエポリューション研究所
関連論文
- コメント・トラックバック分析に基づくブログ記事の影響度判定(Webマイニング,情報爆発論文)
- 集合的なライフログの利用を可能とするシステムアーキテクチャの検討(ライフインテリジェンス,ライフログ活用技術,グループウェアとネットワーク,オフィス情報システム,ライフインテリジェンス,一般)
- 階層的オートタギングによるQ&Aコミュニティの知識整理
- 音楽嗜好の拡大を促すアーティスト推薦(ライフインテリジェンス,デジタルドキュメント,一般2,知識の共有・伝承・知的活用に関するシステム・技術,一般)
- D-9-11 時刻情報を含む特徴滞在パターンを用いた行動予測方式の検討(D-9. オフィスインフォメーションシステム,一般セッション)
- D-9-10 誤差情報を考慮した同行判定の最適化方法(D-9. オフィスインフォメーションシステム,一般セッション)
- GPS未計測区間における移動手段判定手法の検討(セッション2)
- 滞在地遷移情報からの行動パターン抽出方式の検討(セッション3)
- 誤差情報を考慮した同行判定手法(セッション3)
- ライフログのための位置情報ログデータからの移動モード判定の検討(ライフログ活用技術とその課題,オフィス情報システム,デジタルドキュメント,一般)
- BLOGRAGNER TGに装備されたブログマイニング技術と可視化技術(「Webインテリジェンス」及び一般)
- D-4-2 大規模タグクラウドを地形図として可視化するTopigraphy(D-4. データ工学,一般セッション)
- QAコミュニティの成長パターンに基づく回答者への質問推薦
- ブログ記事の反響特性分析 (特集 いまだかつてない検索サービス実現に向けたWebコンピューティング技術)
- QAサイトにおける質問応答グラフの成長パターン分析(セッション7a:Web解析)
- QAサイトにおける質問応答グラフの成長パターン分析
- コンテンツ検索のインタフェース
- ライフログサービスのための脈拍を用いた平常・非平常ラベルの検討(ライフログ,ライフログ活用技術,オフィス情報システム,ライフインテリジェンス)
- 比較評価情報を用いたオブジェクトのランキング手法 (特集 いまだかつてない検索サービス実現に向けたWebコンピューティング技術)
- 目的指向型ブログ検索システムBLOGRANGERの提案およびユーザ評価
- グラフ分析を利用した文書集合からの話題構造マイニング(テキストマイニング,データ工学論文)
- D-9-9 ライフログサービスにおける情報提示タイミング判定手法の検討(D-9. オフィスインフォメーションシステム,一般セッション)
- 音楽嗜好の拡大を促すアーティスト推薦
- マルチファセット型ブログ検索システムBLOGRANGERの開発(オフィスインフォメーションシステム及び一般)
- 大規模テキストからの経験マイニング(テキストマイニング,データ工学論文)
- 3H-1 ベッド上の人の起き上がり動作の検知を目的としたセンサ情報処理の検討(医療分野への応用(2),一般セッション,コンピュータと人間社会)
- A-19-14 離床行動モデルに基づく転倒転落事故予防ベッドの性能評価(A-19.福祉情報工学,一般セッション)
- 権利流通プラットフォームの開発および評価
- ライフログのための位置情報ログデータからの移動モード判定の検討(ライフログ活用技術とその課題,オフィス情報システム,デジタルドキュメント,一般)
- QAコミュニティにおける複数情報源を用いた効果的な質問推薦
- Topigraphy Project (特集 「見る・見せる」技術の最先端)
- ブログに記述された不満表現からの潜在ニーズの発見 (ライフインテリジェンスとオフィス情報システム)
- 固有楕円ポテンシャルを利用したラベル付きグラフ可視化の座標計算
- 固有楕円ポテンシャルを利用したラベル付きグラフ可視化の座標計算
- 固有楕円ポテンシャルを利用したラベル付きグラフ可視化の座標計算
- ブログマイニングによるマーケットシェア推定 : ブログと既存統計指標の関係の分析(オフィスインフォメーションシステム,グループウェア及び一般)
- ブログマイニングによるマーケットシェア推定 : ブログと既存統計指標の関係の分析(オフィスインフォメーションシステム,グループウェア及び一般)
- レビュー記事群を用いた消費行動要因のマイニング
- POSデータの仮想地形図による可視化(不均質なライフログからのデータマイニング及び一般)
- B-6-4 SIP端末の網接続試験効率化に関する検討(B-6.ネットワークシステム,一般セッション)
- D-9-8 ライフログサービス実現のためのプラットフォームの検討(D-9. オフィスインフォメーションシステム,一般セッション)
- ブログに記述された不満表現からの潜在ニーズの発見
- 写真共有サイトにおけるジオタグ情報を利用したトラベルルート推薦(不均質なライフログからのデータマイニング及び一般)
- ソーシャルメディアのマイニングと可視化 (第17回社会情報システム学シンポジウム ソーシャルメディア)
- 複数観点提示による書籍検索インタフェースを用いた書籍探索行動の分析 (第17回社会情報システム学シンポジウム ソーシャルメディア) -- (一般セッション講演 ソーシャルメディア)
- 4D-1 ライフログサービスのための平常・非平常ラベルの検討(人工知能(2),一般セッション,人工知能と認知科学)
- 2000-CSEC-10-34 権利を階層的に定義可能な権利情報定義言語:XML Ticket
- ISEC2000-56 権利を階層的に定義可能な権利情報定義言語:XML Ticket
- ロボットインタフェースを利用した非同期コミュニケーションの保育への適用及びその評価(ライフログ活用技術とその課題,オフィス情報システム,デジタルドキュメント,一般)
- ロボットインタフェースを利用した非同期コミュニケーションの保育への適用及びその評価(ライフログ活用技術とその課題,オフィス情報システム,デジタルドキュメント,一般)
- 1S-6 電子チケット流通制御方式
- O-021 ライフログ利用サービスにおける開示情報制御方式に関する基礎検討 : ライフログ提供に関する意識調査(情報システム,一般論文)
- 6E-3 4W (When, Where, Who, What)情報の組合せを考慮したライフログ開示支援方法に関する一考察(セキュリティと社会,一般セッション,セキュリティ)
- ユーザによる開示/非開示判断をサポートするライフログ可視化の検討
- ユーザによる開示/非開示判断をサポートするライフログ可視化の検討
- コンテンツ視聴により形成される動的なコミュニティにおけるユーザ行動特性の分析
- Blogのタグ間類似度のスコアリング
- リスト構造の種類に着目した非構造的な羅列型Webページからの情報抽出(オフィスインフォメーションシステム及び一般)
- コミュニティ抽出のためのクエリ共起語のクラスタリングに関する一考察(オフィスインフォメーションシステム及び一般)
- ネット上のコミュニティにおける情報の評判計算アルゴリズムEigenRumor(コミュニティウェア)
- ネット上のコミュニティにおける情報の評判計算アルゴリズムEigenRumor(セッション2 : コミュニティウェア)
- マルチメディアサ-ビスのサ-ビスオ-ダ管理機能の設計と実装 (マルチメディアサ-ビスを開発するための共通プラットフォ-ム)
- コンテンツ属性情報を利用したコミュニティ形成方法の評価
- 動画コンテンツの特性に応じた電子透かし埋め込み制御方法の評価
- 動画コンテンツの特性に応じた電子透かし埋め込み方法の評価(セッション4 : 著作権保護)
- トランザクション・スクリプト記述言語STDL
- ユーザによる情報投稿/評価実績を利用した情報信用度評価方式
- 電子権利流通基盤のための汎用的な原本性保証方式(21世紀のコンピュータセキュリティ技術)
- 柔軟な電子商取引を実現する権利流通システム (特集論文2 暗号--応用技術)
- 拡張トランザクションモデルに基づくサービス連携方式
- マーカレス拡張書籍のための2次元文字ブロック検索手法
- ディジタルコンテンツの著作権管理・保護プラットフォーム:著作権流通プラットフォーム (特集 HIKARIビジョンの実現に向けた情報流通プラットフォームの高度化(その3)安全なコンテンツ流通を実現する権利流通プラットフォーム)
- 転倒転落事故の予防を目的とした見守りベッドシステム
- 要因語辞書と出現位置を用いた消費行動要因分析
- 複数観点からのコンテンツ列挙型書籍検索インタフェース
- 転倒転落事故予防に向けた入院患者の起き上がり動作分析(第2報)
- 転倒転落事故の予防を目的とした見守りベッドシステム(生体工学)
- 2A1-C03 人の非平常状態の判定方法に関する検討および脈拍データを用いた評価
- ブログに記述された不満表現からの潜在ニーズの発見
- ビジネスオブジェクトのサービスオペレーションへの適用
- 要因語辞書と出現位置を用いた消費行動要因分析(ログ活用・情報検索,グループウェアとネットワーク,ライフログ活用技術,一般)
- Web検索ログを用いた特定の話題における関心事分析(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 文書クラスタリングアルゴリズムと基準の比較(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- Web検索ログを用いた特定の話題における関心事分析(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 文書クラスタリングアルゴリズムと基準の比較(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- ソーシャルメディアを用いた個人向け旅行プランの自動生成(デジタルドキュメント,ライフログ活用技術,オフィス情報システム,一般)
- コンテンツ検索のインタフェース
- データ圧縮によるツイート話題分類
- 競合学習を用いた情報理論的クラスタリング(人工知能,データマイニング)
- 階層的オートタギング技術とその応用
- マーカレス拡張書籍のための2次元文字ブロック検索手法 (特集 インタラクションの基盤技術、デザインおよび応用)
- ソーシャルグラフを利用したユーザ属性の推定によるTwitterからのブランド特徴分析(ライフログと分析,グループウェアとネットワーク,ライフログ活用技術,オフィス情報システム,セキュリティ心理学とトラスト,一般)
- 行動範囲と興味の同時推定モデルによる地域情報推薦
- HTML5を用いたストリーミングデータのグラフ可視化(「Webインテリジェンス」及び一般)
- モニター調査型ログ収集による競合サイト間の比較分析(ログ分析と推定,ライフログ活用技術,オフィスインフォメーションシステム,ライフインテリジェンス,及び一般)
- 音声認識機能を有するWebアプリケーションの実装と評価
- 音声認識機能を有するWebアプリケーションの実装と評価