EM法を用いた複数情報源からの概念獲得

概要

論文の詳細を見る
画像や音声といった複数の情報源をもつマルチモーダルなシステムがそれらの情報を統合して概念を学習するための枠組みについて考察する. 画像に対する複数の属性のうちの一つを音声で教えて, 属性の種類と分類を自動的に獲得する. これを隠れ変数を含む統計的な学習法であるEM法を用いて行う. 特徴抽出レベルでは, YIQ画像に対する多重解像度相関特徴を提案し, 概念獲得のために必要な特徴を抽出するための正準相関分析を行い, 最終段でEM法を用いた多値回帰による概念獲得を行うモデルを提案し, 実際の画像と音声を用いた学習実験の結果を紹介する.
社団法人電子情報通信学会の論文
1997-09-25

著者

長谷川修
産業技術総合研究所
長谷川修
電子技術総合研究所
速水悟
電子技術総合研究所
麻生英樹
電子技術総合研究所
赤穂昭太郎
電子技術総合研究所
吉村隆
電総研
長谷川修
電子技術総合研究所知能情報部
吉村隆
電子技術総合研究所
長谷川修
東京工業大学大学院理工学研究科像情報工学研究施設:産業技術総合研究所脳神経情報研究部門:科学技術振興事業団さきがけ研究21

関連論文

IT野ニューロン集団の時間相関を取り入れたクラスタリング
29pXH-7 側頭葉の顔応答ニューロンの混合正規分布解析(29pXH ニューラルネットワーク(神経系のモデルを含む),領域11(統計力学,物性基礎論,応用数学,力学,流体物理))
頑健なヤコビ核主成分分析に向けて(テーマ関連セッション5,コンピュータビジョンとパターン認識のための学習理論)
頑健なヤコビ核主成分分析に向けて(テーマ関連セッション5)
主成分曲線のあてはめによる放射対称歪曲の較正(一般セッション1,移動カメラ画像処理におけるパターン認識とメディア理解)
高次相関特徴によるテクスチャ解析の試み
視覚情報を対話的に学習するマルチモーダル擬人化エージェント
コンピュータとの対話におけるユーザの振舞いの解析
視覚・聴覚・発話機能を有するエージェント型マルチモーダルインタフェースの試作
人の表情を有し音声対話・視覚機能を備えたマルチモーダルインタフェース
音声・視覚・画像を統合した対話システムの試作
ARHMMに基づいた音声分析手法と歌声認識による評価(聴覚・音声及び一般)
単語発声の複数サンプルを利用した未知語の音韻系列の推定(音声情報処理 : 現状と将来技術論文特集)
自動推論 Wizard of OZ システムによる日本語自由発話コーパス
ノンバーバル情報を導入した音声・画像統合対話システムでの初期データ収録
ノンバーバル情報を導入した音声・画像統合対話システムの設計
複数サンプルを用いた未知語認識
RWC計画における音声対話データベースの構築
対話システム制御における時間の扱い
サブスペース法を用いた音声強調法とその音声認識への応用(第2報)
サブスペース法を用いた音声強調法の音声認識への応用
身振りと発話のマルチモーダルデータベース
会議報告 : IJCAI99
手の表面情報認識による人物同定
IE2000-22 / PRMU2000-47 / MVE2000-51 ジェスチャ認識システム評価用ジェスチャデータベースの開発
IE2000-22 / PRMU2000-47 / MVE2000-51 ジェスチャ認識システム評価用ジェスチャデータベースの開発
IE2000-22 / PRMU2000-47 / MVE2000-51 ジェスチャ認識システム評価用ジェスチャデータベースの開発
EM法を用いた複数情報源からの概念獲得
EM法を用いた複数情報源からの概念獲得
単語アクセントパターン識別におけるモーラ単位HMMの語彙独立性の評価と検討
インタラクションのための計測・認識 : ビジョンの特長を生かせるか?
インタラクションのための計測・認識 : ビジョンの特長を生かせるか?
オフィス移動ロボットJijo-2 の音声対話システム
事情通ロボットの音声対話インターフェース
論争支援マルチモーダル実験システム MrBengo
論争支援のマルチモーダル実験システム
音声・視覚・画像をもつインタラクションシステム
インタフェース研究と脳科学
インタフェース研究と脳科学
インタラクションのための計測・認識 : ビジョンの特長を生かせるか?
学習による不特定環境下の顔の追跡と向きの推定
Multimodal Interaction System that Integrates Speech and Visual Information (特集 RWC研究--実世界知能の実現を目指して) -- (第2部実世界知能研究推進センターの最新の研究成果)
実世界視覚情報を対話的に学習・管理する人間型ソフトウェアロボット (知能情報メディア論文特集)
人間型マルチモーダルエージェントによる実世界情報の学習と管理
実空間中の人物や物体を認識して対話するマルチモーダル擬人化エージェント
部分画像からの物体の認識と切り出し手法の提案
「顔」の情報処理
「顔」の情報処理
ディベート : 「仮想ネットワーク社会に自律擬人化エージェントは必要か」の主旨と論点
音声補完 : 音声入力インタフェースへの新しいモダリティの導入(インタラクティブシステムとソフトウェア)
音声補完 : 単語補完機能の評価
マルチモーダル機能(「RWC-実世界知能」)
音声補完の評価
音声補完の評価
音声補完: 音声ワイルドカード補完機能の実現
自然発話中の有声休止箇所のリアルタイム検出システム(音声情報処理 : 現状と将来技術論文特集)
音声補完:単語補完ができる新たな音声入力インターフェース
2000-SLP-32-16 音声補完 : "TAB"on speech
有声休止箇所のリアルタイム検出システムの評価
自然発話中の言い淀み箇所のリアルタイム検出システム
高次局所自己相関特徴とKL展開による3次元物体のビューベース画像認識
マルチモーダル対話システムのための人間型CGエージェントの構築
RWC自律学習機能 : オフィスロボットJijo-2わ中心として
ブラインド信号分離におけるPCAフィルタの効果
サブスペース法と空間逆フィルタを用いた音源分離
時間の扱いを考慮した対話システム制御手法
マンマシン対話における言語表現の多様性の解析
ニューラルネットワークによる話者認識
ニューラルネットワークによる話者認識
マイクロホンアレイを用いた音声認識方向辞書の精度が認識率に及ぼす影響
周波数領域のInfomaxとサブスペース法を併用した音響信号のブラインド分離
クラスタリングによるHMM間の距離尺度の検討
日本音響学会研究用連続音声データベース (<小特集>出揃った音声データベース)
電総研の研究用音声データベース (<小特集>出揃った音声データベース)
音声対話システム構築のための実対話データ収録実験
高度対話システムの実現のためのヒューマンファクタの解析
解説マルチモーダル研究の現状と展望--フレーム問題の擬似的解決と実世界知能
マルチモーダル研究の現状と展望 : フレーム問題の疑似的解決と実世界知能
生体の視覚に学ぶコンピュータビジョン
ベイジアンネットの学習の知能システムへの応用
音声対話システムの研究と実用化の動向 (<小特集>音声によるコンピュータとの対話を目指して)
「音声研究者電子メールアドレス帳」について
音声の音響音声的変動パターンの類型化 : データベースと生成領域からの類推の利用 : 視聴覚技術 : 聴覚、音声関係および一般
音声の変動記述のための知識ベースについて
音声の音素片ネットワーク表現と時系列のセグメント化法を用いた自動ラベリング手法
マルチモーダル情報統合システムの研究動向
空間指示語と想起される認知領域の基礎的研究
Multinomial Logit Modelによるオフライン手書き文字認識
マルチモーダル対話における視覚の役割とその応用
マルチモーダル対話における視覚の役割とその応用
話者方向同定と雑音抑制による音声認識性能の改善 ( 音響信号処理による音声認識性能の改善)
遅延和アレイを用いた音源方向同定/雑音抑制システムの試作とその音声認識への応用
擬人化エージェントによるマルチモーダルインタフェース
統計的推論とAIの推論 (AIの手法と周辺の基礎理論)
多層パーセプトロンの学習における中間層に付加したノイズの影響とネットワークの構造化
独立なノイズの付加による多層パーセプトロンの構造化学習
2-2 顔画像からの個人識別(2.認識技術の現状)(人体と顔の画像処理)
対話しながら学習するマルチモーダル対話システムを目指して
マルチモーダル対話
2. 理論基盤の研究 ( リアルワールドコンピューティング研究計画)

EM法を用いた複数情報源からの概念獲得

スポンサーリンク

概要

著者

関連論文

スポンサーリンク