スクリプト言語を用いたマルチモーダル対話記述の試み(マルチモーダルIF (1),<小特集>「マルチモーダルと音声HI」およびヒューマンインタフェース/音声言語情報処理一般)
スポンサーリンク
概要
- 論文の詳細を見る
システム設計者が、人と機械の間のマルチモーダル対話を容易に設計しテストすることができる枠組みについて述べる。MILES(Multi-modal Interaction LEading Script)は、マルチモーダル対話システムのための対話モデルを記述する言語である。MILESは、ユーザにとって自然で役に立つマルチモーダル対話を実現するために、対話中のイベントの時間関係と割り込みなどを始めとする対話性について注意を払って設計した。MILESで記述したスクリプトは、アプリケーションプログラムとは切り放して実装された対話管理モジュールによって解釈・実行される。対話管理の領域依存性はアプリケーションプログラム毎に用意されたスクリプトによって表される。したがって、提案する枠組みはどんな領域のマルチモーダル対話も、システムの再構築なしに、動作させることができる。本稿では、MILESで記述を試みたいくつかのマルチモーダル対話タスクについて報告する。
- 一般社団法人情報処理学会の論文
- 1998-10-16
著者
関連論文
- ジェスチャインタフェースのための指先動作軌跡の統計的分割と正規化(信号処理,知的マルチメディアシステム,及び一般)
- ジェスチャインタフェースのための動作軌跡信号の統計的分割と認識(セッション4 : 理解るインタフェース : 手+足+触覚)
- 多様な音響環境下における音声認識システム利用時のデータ収集システム(音声,聴覚)
- 自動車運転のマルチモーダル信号収録装置の開発(マルチモーダルシステム,システム開発論文)
- 運転操作信号のケプストラム分析に基づく運転者識別
- 視覚情報を対話的に学習するマルチモーダル擬人化エージェント
- コンピュータとの対話におけるユーザの振舞いの解析
- 視覚・聴覚・発話機能を有するエージェント型マルチモーダルインタフェースの試作
- 有声・無声休止区間の自動検出を考慮したデコーディングによる自由発話音声認識の性能改善(音声,聴覚)
- デモンストレーション:若手による研究紹介IV
- 6U-7 音響情報を用いたライフログデータのインデキシング(ネットワーク応用,学生セッション,ネットワーク)
- 音響情報を用いたライフログデータのクラスタリング
- スペクトル情報を用いたライフログ映像のシーン検出
- 楽曲検索音声対話システムの評価 (感性)
- 人の表情を有し音声対話・視覚機能を備えたマルチモーダルインタフェース
- 非言語的現象の分析と対話処理 : 電子メール討論(音声対話システムの実力と課題)
- スペクトル分析を用いた運転行動信号に含まれる個人性のモデル化(マルチメディア処理)
- LL-007 ケプストラム分布を用いた実環境下の運転行動信号に含まれる個人性のモデル化(L分野:ネットワークコンピューティング)
- 自動車走行観測信号に含まれる個人性のモデル化(信号処理, 符号化とそれらを用いた知的マルチメディアシステム, 一般)
- 自動車走行観測信号に含まれる個人性のモデル化(信号処理, 符号化とそれらを用いた知的マルチメディアシステム, 一般)
- 自動車走行観測信号に含まれる個人性のモデル化(信号処理, 符号化とそれらを用いた知的マルチメディアシステム, 一般)
- 単語発声の複数サンプルを利用した未知語の音韻系列の推定(音声情報処理 : 現状と将来技術論文特集)
- 複数サンプルを用いた未知語認識
- 休止を単位とした漸進的対話処理
- 対話システム制御における時間の扱い
- 5T-7 音声認識を用いた歌声追尾歌詞表示システム(音楽信号処理,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 3L-4 多様な利用環境における楽曲検索音声対話システムのフィールドテストと評価(リーディングプロジェクト e-society:自然な音声対話処理技術(1),一般セッション,リーディングプロジェクト e-society)
- 楽曲検索システムにおけるプレイリストに適応した音響モデル構築手法に関する検討(音響・音韻モデル)
- 汎用PC上で利用された音声対話システムによる音声収集と評価(第8回音声言語シンポジウム)
- 汎用PC上で利用された音声対話システムによる音声収集と評価(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 汎用PC上で利用された音声対話システムによる音声収集と評価(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 長期間の音声対話インタフェース利用時における学習効果の評価
- 日本語ディクテーション基本ソフトウェア(99年度版)
- 日本語ディクテーション基本ソフトウェア : 98年度版
- 日本語ディクテーション基本ソフトウェア(97年度版)
- 運転者の発話と運転行動を用いた危険な状況の検出(認識・検出)
- 6U-5 1/fゆらぎを用いた癒し効果のある音の生成(音声・歌声合成,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 相平面に描かれる歌声の基本周波数軌跡:歌唱者の意図する音高目標値系列の推定とハミング検索への応用
- AS-5-2 相平面を利用した歌声のF0軌跡の新しい表現方法(AS-5. 音響信号のモデリングと表現,シンポジウムセッション)
- 歌声の旋律と動的変動を特徴付けるための確率的な表現手法に関する検討(音楽音響信号処理 (1))
- 音声だけでシームレスにハミング検索と曲名検索が可能な楽曲検索システム
- スペクトル包絡と基本周波数の時間変化を利用した歌声と朗読音声の識別(音楽情報,情報処理技術のフロンティア)
- 単語の共起関係と構文情報を利用した単語階層関係の統計的自動識別
- 局所的・大局的な特徴を利用した歌声と朗読音声の識別
- 1U-6 コンテンツ制作における収録音編集のための音声強調(音声分析・強調,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 日本語ディクテーションシステムにおける被覆率の高い言語モデル(音声情報処理 : 現状と将来技術論文特集)
- 日本語ディクテーションシステムにおける「読み」言語モデルの利用
- 「読み」情報を利用した大語彙連続音声認識
- 事情通ロボットの音声対話インターフェース
- 論争支援マルチモーダル実験システム MrBengo
- 論争支援のマルチモーダル実験システム
- 複数の認識器を選択的に用いる音声認識システムのためのスコア補正法(音声,聴覚)
- 音声・視覚・画像をもつインタラクションシステム
- 1U-5 高齢者向け音声強調(音声分析・強調,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 1U-4 音声強調を用いたホームビデオの音質改善(音声分析・強調,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 自然発話中の有声休止箇所のリアルタイム検出システム(音声情報処理 : 現状と将来技術論文特集)
- 2000-SLP-32-16 音声補完 : "TAB"on speech
- 自然発話中の言い淀み箇所のリアルタイム検出システム
- ジェスチャインタフェースのための指先動作軌跡の統計的分割と正規化(信号処理,知的マルチメディアシステム,及び一般)
- ジェスチャインタフェースのための指先動作軌跡の統計的分割と正規化(信号処理,知的マルチメディアシステム,及び一般)
- D-14-12 学習データの分布に従う揺らぎのあるHMM音声合成(D-14.音声・聴覚,一般講演)
- ジェスチャインタフェースのための動作軌跡信号の統計的分割と認識(セッション4 : 理解るインタフェース : 手+足+触覚)
- 両耳間音圧差の包絡を用いたガウス分布モデルに基づく音源方向推定
- 統計モデルを用いた音源方向推定(応用音響研究会創設50周年記念号)
- 頭部近傍のHRTF計測用小型12面体スピーカの開発および評価(音響・超音波サブソサイエティ合同研究会)
- バイク走行時収録音声データベースの構築及び評価
- 6ZF-8 アニメーション作品における声優の感情発声の自動分類(知的ヒューマンインタフェース,学生セッション,インタフェース,情報処理学会創立50周年記念)
- 日本のアニメの音声に表された感情と性格 : 声のステレオタイプの音声学的研究(感情音声・感情認知I, 感情音声)
- 時間の扱いを考慮した対話システム制御手法
- マンマシン対話における言語表現の多様性の解析
- 1ZD-8 音響ライフログへのアノテーションのための話者と場所の自動分類(位置・コンテキスト推定(1),学生セッション,ネットワーク,情報処理学会創立50周年記念)
- 5U-7 携帯端末への話者照合を用いたセキュリティロック(音声インタフェース・システム,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 5U-5 Flashコンテンツ操作のための音声認識インタフェース(音声インタフェース・システム,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- E-049 声優の発話の音響特徴量分析及び確率モデルの作成(自然言語・音声・音楽,一般論文)
- 大語彙連続音声認識研究のためのテキストデータ整備
- LK_013 指先の動きを利用した仮想ボタン入力インタフェースの検討(K分野:ヒューマンコミュニケーション&インタラクション)
- ぺた語義:高度情報処理技術者の基礎力育成を目指した学部教育
- バイノーラルマイクを用いた音源方向推定による危険予測
- 音声を用いた農作業日誌システムの構築
- 正準 LR 表を用いた文脈自由文法の perplexity 計算法の提案と評価
- 音声認識の視点から見たLR構文解析法 : 文法知識と統計知識の統合とperplexity計算への応用
- 音声認識における精度と効率の制御を可能とする確率的ビームサーチ法
- 人手による認識用言語モデル構築についての考察
- スクリプト言語を用いたマルチモーダル対話記述の試み(マルチモーダルIF (1),「マルチモーダルと音声HI」およびヒューマンインタフェース/音声言語情報処理一般)
- スクリプト言語を用いたマルチモーダル対話記述の試み
- マルチモーダル対話記述言語MILES
- 時間関係と対話性を考慮したマルチモーダル対話記述用スクリプト
- 時間関係と対話性を考慮したマルチモーダル対話記述用スクリプト
- 時間関係と対話性を考慮したマルチモーダル対話記述用スクリプト
- マルチモーダル対話記述用スクリプトとその処理系
- 休止を単位とした発話の文法
- 休止を区切りとした対話処理
- 休止を処理の区切りとした自由発話理解
- 音声対話データの分析と発話理解への応用
- 音声対話システム構築のための実対話データ収録実験
- 高度対話システムの実現のためのヒューマンファクタの解析
- 対話システムにおける音声認識
- 音素長伸縮による対話音声認識性能の向上手法
- HMMに基づく連続指文字認識・合成用コーパスの構築(信号処理, 符号化とそれらを用いた知的マルチメディアシステム, 一般)
- HMMに基づく連続指文字認識・合成用コーパスの構築(信号処理, 符号化とそれらを用いた知的マルチメディアシステム, 一般)