Google N-gramを用いた音声認識のタスク汎用性評価の試み (音声)
スポンサーリンク
概要
- 論文の詳細を見る
- 2009-12-21
著者
-
三宅 純平
奈良先端科学技術大学院大学情報科学研究科情報処理学専攻
-
川波 弘道
奈良先端科学技術大学院大学
-
川波 弘道
電総研
-
久保 慶伍
奈良先端科学技術大学院大学情報科学研究科
-
Hiromichi Kawanami
Department of Statistical Modeling, The Institute of Statistical Mathematics
-
KAWANAMI HIROMICHI
Graduate School of Information Science, Nara Institute of Science and Technology
-
川波 弘道
Nara Institute of Science and Technology
関連論文
- ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理技術の総合開発(総合報告)
- 括弧表現に基づくWebテキストマイニングを用いた流行語への自動読み付与の提案
- NAMセグメントを用いた個人認証法における未知話者データに対する頑健性の評価(聴覚・音声/一般)
- 実環境向け音声対話ロボット「キタちゃん」の開発
- 音声対話システムにおけるWeb検索タスクの発話分析とWeb検索のための大規模単語コーパスの検討(言語モデル)
- Google N-gramを用いた音声認識のタスク汎用性評価の試み (音声)
- 3Q-3 NAMマイクによる心音の収録とその明瞭化(音声の分析・合成,学生セッション,人工知能と認知科学)
- 多対多最小パターンアライメントアルゴリズムの提案と自動読み付与による評価
- Stacked Generalization for Topic Classification of Spoken Inquiries
- Google N-gram を用いた音声認識のタスク汎用性評価の試み
- 4L-3 ハンズフリーロボット対話実験システムの構築(リーディングプロジェクト e-society:自然な音声対話処理技術(2),一般セッション,リーディングプロジェクト e-society)
- 3L-1 音声情報案内システム「たけまるくん」の運用(リーディングプロジェクト e-society:自然な音声対話処理技術(1),一般セッション,リーディングプロジェクト e-society)
- 音響モデルと言語モデルに基づく音声区間検出を用いたハンズフリー音声認識アルゴリズムの評価(雑音・VAD,第9回音声言語シンポジウム)
- 未知語認識のための仮名・漢字単位の構築手法と性能評価
- Google N-gramを用いた音声認識のタスク汎用性評価の試み
- Google N-gramを用いた音声認識のタスク汎用性評価の試み(一般(ポスターセッション),第11回音声言語シンポジウム)
- 広告音声に見られる韻律的特徴とその制御要因に関する考察
- 3L-5 音声入力Webシステムによる音声認識アプリケーションの構築技術(リーディングプロジェクト e-society:自然な音声対話処理技術(1),一般セッション,リーディングプロジェクト e-society)
- 音声入力・認識機能を有するWebシステムw3voiceの開発と運用
- E-072 音声入力機能を有する対話型Webアプリケーションの公開試験(E分野:自然言語・音声・音楽)
- 単語の頻度と音響の特徴を利用したSVMによる無効入力の棄却
- 音声情報案内システムにおけるSVMを用いたタスク外発話の検出
- GMMに基づく声質変換への尤度基準学習の適用(聴覚・音声・言語とその障害)
- 実画像データベースを用いた発話顔画像合成の検討
- 駅構内音声案内システム「キタちゃん」「キタちゃんロボット」の開発(認識・理解・対話・一般)
- Designing Target Cost Function Based on Prosody of Speech Database(Speech Synthesis and Prosody, Corpus-Based Speech Technologies)
- Cross-language Voice Conversion Evaluation Using Bilingual Databases (特集 音声言語情報処理とその応用)
- 音声情報案内システムにおける質問応答データベース構築コスト削減の検討
- 3L-2 音声情報案内システム「キタロボ」と「キタちゃん」の運用(リーディングプロジェクト e-society:自然な音声対話処理技術(1),一般セッション,リーディングプロジェクト e-society)
- 音声案内システムにおける質問応答データベースの最適化 : 音声認識結果を用いた質問応答データベースによる応答生成と最適化(システム,第9回音声言語シンポジウム)
- 音声案内システムにおける質問応答データベースの最適化 : 音声認識結果を用いた質問応答データベースによる応答生成と最適化(システム,第9回音声言語シンポジウム)
- 音響モデルと言語モデルに基づく音声区間検出を用いたハンズフリー音声認識アルゴリズムの評価(雑音・VAD,第9回音声言語シンポジウム)
- NAMから通常音声への変換における基本周波数推定の検討
- Leave-one-out交差検定法に基づく質問応答データベースの最適化(認識,理解,対話,一般)
- 音響モデルと言語モデルに基づく音声区間検出を用いたハンズフリー音声認識アルゴリズムの評価(雑音・VAD,第9回音声言語シンポジウム)
- 実環境ハンズフリー音声認識のための音響モデルと言語モデルに基づく音声区間検出と認識アルゴリズム(認識,理解,対話,一般)
- 「たけまるくん」実環境音声案内システムのデータベース整備と「キタちゃん」へのポータビリティーの検討(第8回音声言語シンポジウム)
- 「たけまるくん」実環境音声案内システムのデータベース整備と「キタちゃん」へのポータビリティーの検討(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 「たけまるくん」実環境音声案内システムのデータベース整備と「キタちゃん」へのポータビリティーの検討(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 「たけまるくん」実環境音声案内システムのデータベース整備と「キタちゃん」へのポータビリティーの検討
- 音声情報案内システム「たけまるくん」および「キタちゃん」の開発(特別企画「音声認識デベロッパーズフォーラム」)
- 音声情報案内システムにおける質問応答データベース最適化手法の検討(検索・対話)
- 韻律的に多重な音声データベースを活用した韻律制御時の品質劣化低減手法の検討(聴覚・音声・言語とその障害)
- Development, Long-Term Operation and Portability of a Real-Environment Speech-Oriented Guidance System
- Inquiry Classification in a Speech-Oriented Guidance System Using Discriminative Learning
- 統計的機械翻訳の手法を用いた音声情報案内システムのための応答文生成手法の検討
- GMMに基づく声質変換を用いた感情音声合成
- 韻律的に多重化した音声データベースの設計と発話速度におけるその評価(音声,聴覚)
- 発話速度の異なるデータベースを用いた音声合成手法の検討
- 音声案内システムにおける質問応答データベースの最適化 : 音声認識結果を用いた質問応答データベースによる応答生成と最適化(システム,第9回音声言語シンポジウム)
- コードブックを用いた実時間処理CMNの実装と評価
- 公共音声対話システムにおけるN-gramとGrammarの融合によるタスク拡張(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 公共音声対話システムにおけるN-gramとGrammarの融合によるタスク拡張(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 公共音声対話システムにおけるN-gramとGrammarの融合によるタスク拡張(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- F_0コーパスを用いた韻律変換システムの提案
- 韻律的に多重なデータベースの設計と評価
- CHATR出力音声へのSTRAIGHTを用いた韻律制御
- 音声情報案内システムにおけるBag-of-Wordsを特徴量とした無効入力の棄却
- 携帯端末用の音声情報案内システム開発に向けたネットワークサービスの検討
- D-9-36 多様な利用環境における音声情報案内サービスソフトウェアの開発(D-9.ライフインテリジェンスとオフィス情報システム,一般セッション)
- 音声情報案内システムにおけるBag-of-Wordsを用いた無効入力の棄却
- 日本語の未知語に対する発音付与のための多対多アライメント
- Comparison of Methods for Topic Classification of Spoken Inquiries (Preprint)
- 10年間の長期運用を支えた音声情報案内システム「たけまるくん」の技術(音声対話システムの実用化に向けて)
- 10年間の長期運用を支えた音声情報案内システム「たけまるくん」の技術