ネットワーク型音声対話システム開発ツール : WFSTDMビルダー(音声対話,認識,理解,対話,一般)
スポンサーリンク
概要
- 論文の詳細を見る
我々は,拡張性,移植性の高い対話制御プラットフォームとして,重み付き有限状態トランスデューサに基づく対話制御法WFSTDMを提案している.WFSTDMでは,音声言語理解WFSTを用いて認識結果からユーザの発話意図を推定し,対話シナリオWFSTを用いてユーザへの応答となるシステムアクションを決定する.本枠組みでは,音声言語理解,対話シナリオはWFSTの形式で統一的に記述され,さらに各WFSTとシステムアクションプログラムがそれぞれ独立している事から,異なるタスクのWTFSTの入れ替えや組み合わせ,さらにWFST演算を用いて各WFSTを合成する事により新たな対話システムを簡便に再構築する事ができる.本稿では,京都観光案内タスクのルールベース音声対話システムに音声対話コーパスから学習した人間対人間の対話様式を組み合わせる事により,人間対人間の対話を模した音声対話システムへと拡張した例を示す.さらに我々は,このようなWFSTDMの移植性,拡張性の高さを生かし,システム開発者が言語理解WFSTや対話シナリオWFSTを相互に利用する事により,簡便に音声対話システムを構築するプラットフォームの構築を目指している.本稿では,情報通信研究機構で構築されているネットワーク型音声対話開発ツールWFSTDMビルダーを紹介する.本対話制御プラットフォームは,開発者がネットワークを介してWFSTDMサーバで対話制御WFSTを作成し対話システムを駆動し,ユーザは対話クライアントからWFSTDMサーバにアクセスすることで音声対話を実現する.
- 2011-07-14
著者
関連論文
- 京都観光案内対話コーパスにおける対話行為タグの設計と分析(理解)
- 同調的対話システム構築のための音声対話コーパスの構築(「ユニバーサルコミュニケーションを実現するための言語処理技術」シンポジウム)
- 京都観光案内タスクにおける観光地情報を推薦する音声対話システムの構築と実験
- テレビ視聴環境を利用した顔認識のための変動学習
- 音楽情報検索向け類似テキスト検索システムの試作(音楽情報検索)
- 統計的対話モデルを用いたWFSTに基づく音声対話システム
- 同調的対話を実現するプロトタイプシステムの開発(対話・インタフェース・インタラクション)
- B-6-57 総合音声伝送品質率に基づくヘッダ圧縮処理の制御に関する一検討(B-6.ネットワークシステム,一般講演)
- 転送特性が非対称なワイヤレスリンクにおけるヘッダ圧縮性能向上に関する検討(Webサービスベースのオフィスアプリケーション・ネットワーキング・マネジメント及び一般)
- 分散型音声認識の商用システム構築(特別企画「音声認識デベロッパーズフォーラム」)
- 音声翻訳システムのための声質変換法と日中英語間における評価
- 節の始境界検出に基づく独話文の係り受け解析
- 携帯型端末を用いた音声自動翻訳システムとフィールド実験
- 多言語音声の合成
- QAシステムのための音声入力インターフェース
- 音声認識の信頼度・複数候補を利用したWFST対話システムの評価
- 相談型対話のモデル化と対話戦略の最適化
- 科学技術コミュニケーションにおける対話のデザイン : 自律型対話の実践に向けて(実践的多人数インタラクションの動向と展望)
- 発話連鎖からみた情報要求発話の機能(分析、生成と評価)(音声とコミュニケーション及び一般)
- 発話連鎖からみた情報要求発話の機能
- 用例ベース翻訳の確率的モデル化
- 多言語パラレルコーパスを利用した言い換え表現グループの構築と分析
- 対話者の社会的役割を利用した訳し分け手法
- 音声対話システム構築のための発話行為・意味内容タグの設計
- 固有表現抽出器を用いた、非直訳文書対からの固有表現翻訳対獲得(対訳表現獲得)
- 少数マイクロホンを用いた音声入力手法の検討(立体音響・トランスデューサ/一般)
- 大規模コーパスを用いた音声合成システムXIMERA(音声,聴覚)
- 音声合成システムXIMERAにおける日本語合成音の自然性劣化要因の分析
- 階層化言語モデルによる音声ドキュメントの検索(言語モデル)
- 4.ライフログに基づく実世界でのコンテンツ利活用(ライフログ)
- 独話データのポーズ単位を利用した節境界判定(言語解析, 対話)
- 文脈素性のベクタ空間モデルを用いた日英翻訳選択 : SENSEVAL-2 日本語翻訳タスク参加システムの開発
- 節の始端検出に基づく独話文の係り受け解析(一般(ポスターセッション),第9回音声言語シンポジウム)
- 節の始端検出に基づく独話文の係り受け解析(一般(ポスターセッション),第9回音声言語シンポジウム)
- 節の始端検出に基づく独話文の係り受け解析(一般(ポスターセッション),第9回音声言語シンポジウム)
- 節境界に基づく独話の漸進的係り受け解析(自然言語処理)
- 同時的な独話音声要約に基づくリアルタイム字幕生成(要約・分割)
- 節境界単位での漸進的な独話係り受け解析
- 節境界に基づく独話文係り受け解析の効率化(仮名漢字変換・形態素構文解析)
- 日本語節境界検出プログラムCBAPの開発と評価
- 用例ベース翻訳のための日英アライメント確信度語類似度を用いた訳語選択
- 単語類似度の尺度比較支援ツールの作成(言語知識・解析・言い換え)
- ATR-SLTシステム-SENSEVAL-2日本語翻訳タスク
- A-10-7 2段階DOA推定法に基づく音源分離手法の評価(A-10.応用音響,一般講演)
- 波形接続型音声合成における素片選択遅延時間の短縮(音声,聴覚)
- 素片接続型音声合成における最良優先探索に基づく素片選択(一般, STRAIGHTスペシャルセッション(SS))
- 音声認識を利用した携帯電話サービスの開発(パネルディスカッション「音声認識技術の実用化」)
- 日英バイリンガル・コーパスを用いた知覚的話者空間の推定
- 意志決定を支援する音声対話システムの構築と評価
- 音声対話型観光案内システムにおける誤応答リカバリー効果の評価
- 2010年度喜安記念業績賞紹介 : 第3世代携帯電話向けの分散型音声認識システムの実用化
- 第21回 ピッツバーグとボストンに暮らして(グローバル・アイ)
- 言語獲得ロボットによる発話理解確率の推定に基づく物体操作対話
- Network-based spoken dialog system development platform: WFSTDM builder (音声)
- Web時代の音声・言語技術
- 日英バイリンガル・コーパスを用いた知覚的話者空間の推定(オーガナイズドセッション2,聴覚・音声・言語とその障害/一般)
- ネットワーク型音声対話システム開発ツール : WFSTDMビルダー(音声対話,認識,理解,対話,一般)
- ユーザの相づち・うなずきを喚起する音声対話システム(対話生成,人とエージェントのインタラクション論文)
- 日本語ユーザ発話を用いた英語音声対話システム用統計的言語理解部の準教師つき学習
- 個人性を考慮した異言語音声合成に対する知覚評価
- 観光案内への音声対話システムの活用 (特集 情報が観光を創る・磨く・鍛える)
- 音声対話による観光案内システムAssisTra
- 音声対話による観光案内システムAssisTra
- 観光案内への音声対話システムの活用
- 音声対話による観光案内システムの開発と多言語化 : 音声対話システムAssisTraの研究開発から得られた知見と課題(音声対話システムの実用化に向けて)
- 個人性を考慮した異言語音声合成に対する知覚評価(オーガナイズドセッション「音声知覚生成インタラクション・音声認識合成統合技術」,音声知覚生成/聴覚コミュニケーション,一般)
- 音声対話システムログデータの翻訳結果の選択による統計的言語理解部の言語間移植コストの削減(音声,聴覚)
- 多言語音声翻訳システム"VoiceTra"の構築と実運用による大規模実証実験(音声,聴覚,システム開発論文)
- 音声対話による意思決定支援システムの実験的評価(音声,聴覚,システム開発論文)
- rospeex:クラウド型音声コミュニケーションを実現するROS向けツールキット(オープンソースソフト/ハードとサービスを繋ぐクラウドネットワークロボティクス)
- 音声対話による観光案内システムの開発と多言語化 : 音声対話システムAssisTraの研究開発から得られた知見と課題
- カーネル写像を用いた最小分類誤り学習法(人体・動作の認識と理解,福祉と共生,国際会議報告)
- 僅かに長い間(ま),または自然な間(ま)のある話を傾聴している時の脳活動の差異 : MEG・MRI情報からの活動源の推定(認知・心理・基礎,コミュニケーションの心理とライフステージ,及び一般)
- 最小分類誤り基準に基づく多クラスサポートベクターマシン(人体・動作の認識と理解,福祉と共生,国際会議報告)
- カーネル写像を用いた最小分類誤り学習法(人体・動作の認識と理解,福祉と共生,国際会議報告)
- クラス共通損失関数平滑度の自動設定法を伴う最小分類誤り学習法(人体・動作の認識と理解,福祉と共生,国際会議報告)