ノンバーバル情報を導入した音声・画像統合対話システムの設計

概要

論文の詳細を見る
1997-03-01

著者

田中和世
筑波大学図書館情報学系
長谷川修
産業技術総合研究所
伊藤克亘
電総研
田中和世
電総研
吉村隆
電総研
長谷川修
電総研
速水悟
電総研
長谷川修
電子技術総合研究所知能情報部

関連論文

ジェスチャインタフェースのための指先動作軌跡の統計的分割と正規化(信号処理,知的マルチメディアシステム,及び一般)
ジェスチャインタフェースのための動作軌跡信号の統計的分割と認識(セッション4 : 理解るインタフェース : 手+足+触覚)
軽い音声認識システムの開発と課題(若手研究者育成レクチャーシリーズ,認識,理解,対話,一般)
多様な音響環境下における音声認識システム利用時のデータ収集システム(音声,聴覚)
自動車運転のマルチモーダル信号収録装置の開発(マルチモーダルシステム,システム開発論文)
運転操作信号のケプストラム分析に基づく運転者識別
運転行動信号に含まれる個人性のモデル化(自動車・交通におけるコミュニケーション&インタフェース及び一般)
会議音声データの収録とデータファイル化
ニュース音声コーパスの構築
高次相関特徴によるテクスチャ解析の試み
視覚情報を対話的に学習するマルチモーダル擬人化エージェント
コンピュータとの対話におけるユーザの振舞いの解析
視覚・聴覚・発話機能を有するエージェント型マルチモーダルインタフェースの試作
有声・無声休止区間の自動検出を考慮したデコーディングによる自由発話音声認識の性能改善(音声,聴覚)
デモンストレーション:若手による研究紹介IV
メディア処理(メディア情報,映像情報メディア年報)
調音の構造的制約を考慮した音声特徴抽出の検討
声帯振動の非線形効果パラメータのパタン化とその評価
声帯振動の非線形効果パラメータのパタン化
ホルマントと調音パラメータノモグラムを用いた音声の低ビット符号化法
声帯振動の非線形効果を考慮した合成音声とその評価
音声文書検索のための多言語音素片セグメントの応用(第5回音声言語シンポジウム : ポスターセッション)
音声文書検索のための多言語音素片セグメントの応用(第5回音声言語シンポジウム : ポスターセッション)
音声認識技術とその応用,現状と課題
利得適応型AR-HMM分解法を用いた音響モデルの雑音適応化の検討(音響と音声処理,音声強調,ロバスト音声認識)
利得適応型AR-HMM分解法を用いた音響モデルの雑音適応化の検討(音響と音声処理,音声強調,ロバスト音声認識)
広告音声に見られる韻律的特徴とその制御要因に関する考察
音声認識における特徴ベクトルの信頼度尺度
電総研のマルチモーダル対話システム
6U-7 音響情報を用いたライフログデータのインデキシング(ネットワーク応用,学生セッション,ネットワーク)
音響情報を用いたライフログデータのクラスタリング
スペクトル情報を用いたライフログ映像のシーン検出
人の表情を有し音声対話・視覚機能を備えたマルチモーダルインタフェース
音声・視覚・画像を統合した対話システムの試作
ARHMMに基づいた音声分析手法と歌声認識による評価(聴覚・音声及び一般)
対話型英語学習システムにおける日本人英語音声認識精度の検討
日本人英語の特性に基づく音声認識を用いた英会話学習支援システム
言語に共通な音声符号系とその音響セグメントモデルの作成
単語発声の複数サンプルを利用した未知語の音韻系列の推定(音声情報処理 : 現状と将来技術論文特集)
自動推論 Wizard of OZ システムによる日本語自由発話コーパス
被覆率を重視した大語彙連続音声認識用統計的言語モデル
人の間, ものの間のインタフェース
WOZシステムで収録した自由発話音声の対話データベース
音声認識用統計的言語モデルのための形態素解析済みテキストの後処理
ノンバーバル情報を導入した音声・画像統合対話システムでの初期データ収録
ノンバーバル情報を導入した音声・画像統合対話システムの設計
複数サンプルを用いた未知語の音韻系列の推定
複数サンプルを用いた未知語認識
RWC計画における音声対話データベースの構築
休止を単位とした漸進的対話処理
対話システム制御における時間の扱い
身振りと発話のマルチモーダルデータベース
手の表面情報認識による人物同定
EM法を用いた複数情報源からの概念獲得
EM法を用いた複数情報源からの概念獲得
マン・マシン対話データのピッチパターン分類に関する検討
セグメント単位の音声符号列からのレキシコンの生成
区分線形セグメントラティスによる日英混合音声の認識
言語混合単語音声認識に関する実験的検討
区分線形セグメントラティスにおける音韻的チャンクの抽出
中間符号系と記号列間距離計算に基づく音声処理の提案
区分線形セグメントラティス音韻モデルにおけるクラスタリング
単語セットの音声認識難易度推定 : 記号領域における単語間距離計算の応用
記号領域における単語間距離の計算と音声認識難易度
インタラクションのための計測・認識 : ビジョンの特長を生かせるか?
インタラクションのための計測・認識 : ビジョンの特長を生かせるか?
論争支援マルチモーダル実験システム MrBengo
論争支援のマルチモーダル実験システム
音声・視覚・画像をもつインタラクションシステム
インタフェース研究と脳科学
インタフェース研究と脳科学
インタラクションのための計測・認識 : ビジョンの特長を生かせるか?
学習による不特定環境下の顔の追跡と向きの推定
Multimodal Interaction System that Integrates Speech and Visual Information (特集 RWC研究--実世界知能の実現を目指して) -- (第2部実世界知能研究推進センターの最新の研究成果)
実世界視覚情報を対話的に学習・管理する人間型ソフトウェアロボット (知能情報メディア論文特集)
人間型マルチモーダルエージェントによる実世界情報の学習と管理
実空間中の人物や物体を認識して対話するマルチモーダル擬人化エージェント
部分画像からの物体の認識と切り出し手法の提案
「顔」の情報処理
「顔」の情報処理
ディベート : 「仮想ネットワーク社会に自律擬人化エージェントは必要か」の主旨と論点
高次局所自己相関特徴とKL展開による3次元物体のビューベース画像認識
マルチモーダル対話システムのための人間型CGエージェントの構築
区分線形セグメント列からの音素的構造の抽出
音声スペクトルからの識別的特徴抽出に関する実験的検討
音韻モデル獲得のための区分線形セグメントラティスの学習
時間の扱いを考慮した対話システム制御手法
区分線形セグメントラティスを用いた単語モデルの自動生成
マンマシン対話における言語表現の多様性の解析
解説マルチモーダル研究の現状と展望--フレーム問題の擬似的解決と実世界知能
マルチモーダル研究の現状と展望 : フレーム問題の疑似的解決と実世界知能
生体の視覚に学ぶコンピュータビジョン
空間指示語と想起される認知領域の基礎的研究
Multinomial Logit Modelによるオフライン手書き文字認識
マルチモーダル対話における視覚の役割とその応用
マルチモーダル対話における視覚の役割とその応用
擬人化エージェントによるマルチモーダルインタフェース
2-2 顔画像からの個人識別(2.認識技術の現状)(人体と顔の画像処理)
対話しながら学習するマルチモーダル対話システムを目指して
マルチモーダル対話

ノンバーバル情報を導入した音声・画像統合対話システムの設計

スポンサーリンク

概要

著者

関連論文

スポンサーリンク