SOSとマイクロフォンアレイの統合による会議記録システムの開発
スポンサーリンク
概要
- 論文の詳細を見る
会議を記録する場合、録音機器を用いて録音することが考えられるが、発言した話者の特定が困難であり、視覚的に話者を識別することもできない。そこで本稿では、話者画像と音声情報を取得し、後に発話の有無や話者画像を表示し、会議を再現するシステムを構築した。全方向のカラー画像と3次元情報をリアルタイムに取得できるSOS(Stereo Omnidirectional System)と、3次元空間でリアルタイムに音源方向を推定できるマイクロフォンアレイを統合し、リアルタイムで音源方向を推定し、全方向画像上に音源位置を示した。また、会議を模擬した状況で話者を特定する精度を検証した。
- 一般社団法人情報処理学会の論文
- 2006-10-20
著者
-
田村 哲嗣
岐阜大学工学部
-
田村 哲嗣
岐阜大学大学工学部 応用情報学科
-
速水 悟
岐阜大学大学工学部 応用情報学科
-
山本 和彦
岐阜大
-
速水 悟
岐阜大学工学部応用情報学科
-
木村 文彦
岐阜大学大学院工学研究科
-
近藤 功一
岐阜大学大学院工学研究科
-
山本 和彦
岐阜大学大学院工学研究科
-
近藤 功一
岐阜大学
-
木村 文彦
東京大学大学院工学系研究科
-
木村 文彦
法政大学理工学部機械工学科
-
木村 文彦
東大 工
-
木村 文彦
東大 大学院工学系研究科
-
木村 文彦
東京大
-
田村 哲嗣
岐阜大学大学院工学研究科応用情報学専攻
-
速水 悟
岐阜大学大学院工学研究科応用情報学専攻
-
田村 哲嗣
岐阜大
関連論文
- マルチモーダル情報処理の研究動向(マルチモーダル)
- 手振り動作認識のPC入力インタフェースへの応用
- ジェスチャー認識へ向けたリアルタイム近赤外肌検出法のハードウェアへの実装
- 画像入力・計測技術の新展開 : 三次元画像計測技術を中心として(実世界における画像技術の応用)
- 加速度情報を用いた日常行動認識について(デモ展示・ポスター講演,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- 画像情報コントロールによるおいしさ要因抽出アンケート方法(若葉研究者の集い5,サマーセミナー(若葉研究者の集い))
- 近赤外肌検出法を用いた手振りインタフェースシステムの構築(若葉研究者の集い2,サマーセミナー(若葉研究者の集い))
- 局所領域照合を用いた背景差分による移動物体検出
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(3)(SIG-SLP内組織の活動報告)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(2)(雑音・VAD,第9回音声言語シンポジウム)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境 (2)(雑音・VAD,第9回音声言語シンポジウム)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(第8回音声言語シンポジウム)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(Session-1 検出,第8回音声言語シンポジウム)
- 飛騨牛のたんぱく質評価
- 周辺視野における人の気配の認識についての一考察
- 解像度変化を用いた情報抽出によるお弁当画像のおいしさ認識解析
- 周辺視野における気配の認識能力についての研究 : 単眼における空間認識能力についての解析(セッション2,サマーセミナー(若葉研究者の集い))
- ネイルカメラシステムの文字認識性能向上に向けた特徴量の考察 : 特徴表現方法の比較(セッション4,サマーセミナー(若葉研究者の集い))
- 手振り動作周波数解析による指示ジェスチャの認識(テーマセッション,映像ハンドリング技術とその応用)
- 習字教育支援システムのための Horizon View Camera を用いた筆あと計測手法の提案と実装
- 適正な情報提示のための驚き表情における時空間解析
- 近赤外画像を用いた食品の成分分布解析手法(DIA推薦論文)
- SOSを用いた移動物体の全天球追跡手法 (第14回 知能メカトロニクスワークショップ講演論文集)
- 味覚刺激による表情変化に関する研究(サマーセミナー(若葉研究者の集い)「最先端ビジョン技術が拓く画像応用の新境地」)
- 方向特徴を用いた抽出対象の文字部分にのみ注目した認識手法に関する考察(サマーセミナー(若葉研究者の集い)「最先端ビジョン技術が拓く画像応用の新境地」)
- 救急災害領域における情報支援システム(わが国における救急・災害医療の将来)
- D-11-101 近赤外領域の分光反射特性を利用した物体識別(D-11.画像工学,一般セッション)
- LH-002 近赤外光を用いた肌領域検出について有効性の考察(画像認識・メディア理解)
- 視覚・聴覚・発話機能を有するエージェント型マルチモーダルインタフェースの試作
- 近赤外3波長によるマテリアル検出手法の考察
- マシンビジョンの実利用を促進するための技術展望
- 反射的表情の時空間解析
- ブースティングによるマルチモーダル音声区間検出の結果統合 (音声)
- M-013 3軸加速度センサを用いた隠れマルコフモデルによる人間の行動識別(ユビキタス・モバイルコンピューティング,一般論文)
- 加速度情報を用いた日常行動認識について(デモ展示・ポスター講演,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- 加速度情報を用いた日常行動認識について(デモ展示・ポスター講演,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- 画像特徴量の正規化によるマルチモーダル音声認識の改善(マルチモーダル)
- マルチモーダル音声認識における音声と画像の同期に関する調査(マルチモーダル)
- E-007 Wikipediaのカテゴリを利用したWeb検索結果のフィルタリングの検討(自然言語・音声・音楽,一般論文)
- 2ZD-5 統計的音声区間検出法を用いた加速度センサによる人間の動作検出(動作認識・大画面,学生セッション,インターフェース)
- 音声と画像のconfusion networkを用いたマルチモーダル音声認識
- SOSとマイクロフォンアレイの統合による会議記録システムの開発
- デジタルペン文字認識システムを用いた在宅看護支援における誤認識自動訂正機能(一般,テキスト情報の要約と掲示に関わる自然言語処理シンポジウム及び一般)
- 画像学習システムMIRACLE-IVにおける機能的特徴と視覚的特徴の対応付け
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(2)(雑音・VAD,第9回音声言語シンポジウム)
- 地域特産食品のおいしさの評価 -牛肉の場合-
- UNIX環境下でのコンパクトな画像処理支援ツールIV-Box
- 概念学習を題材とした画像理解と記号処理の統合の試み
- ブースティングによるマルチモーダル音声区間検出の結果統合(音声・言語・音響教育,一般)
- 雑音下マルチモーダル音声認識評価基盤CENSREC-1-AVの構築
- 人の表情を有し音声対話・視覚機能を備えたマルチモーダルインタフェース
- 音声・視覚・画像を統合した対話システムの試作
- D-12-42 歩容における左右バランスに着目した自主的リハビリテーション支援システムの提案(D-12.パターン認識・メディア理解,一般セッション)
- 手振り動作周波数解析による指示ジェスチャの認識(テーマセッション,映像ハンドリング技術とその応用)
- 手振り動作周波数解析による指示ジェスチャの認識(テーマセッション,映像ハンドリング技術とその応用)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(Session-1 検出,第8回音声言語シンポジウム)
- 組み込み中核人材プロジェクトにおける大学等での取り組み
- マルチモーダル音声区間検出を用いたマルチモーダル音声認識の検討(一般セッション,クロスモーダル)
- マルチモーダル音声区間検出を用いたマルチモーダル音声認識の検討(一般セッション,クロスモーダル)
- マルチモーダル音声区間検出を用いたマルチモーダル音声認識の検討(一般セッション,クロスモーダル)
- マルチモーダル音声区間検出を用いたマルチモーダル音声認識の検討(一般セッション,クロスモーダル)
- E-021 映像コンテンツ理解支援のためのキーワード表示方式の検討(自然言語・音声・音楽,一般論文)
- 身振りと発話のマルチモーダルデータベース
- ムーン・スペンサーの美度公式における個人感性反映の試み
- 動画像による嚥下運動解析 (第13回 知能メカトロニクスワークショップ講演論文集)
- 一般化 Horizon View Camera の考察
- マルチバンド画像センシングとその展開 : 自動車からセキュリティまで
- D-12-126 間合いロボット実現のための人物認識(D-12.パターン認識・メディア理解,一般講演)
- D-12-125 間合いロボット実現のための人物検出(D-12.パターン認識・メディア理解,一般講演)
- エネルギー最小化(ものぐさ)モデルを考慮したヒューマノイドロボット (第12回知能メカトロニクスワークショップ講演論文集)
- 近赤外画像を用いた食品のおいしさ分析について (メディア工学)
- 視覚障害者支援モバイルシステムの提案--視覚と操作の統合 (メディア工学)
- 動き情報を利用した角膜内皮細胞画像の評価と平滑化
- 画像学習システムMIRACLE-IV (コンピュ-タ・ビジョン技術に関する研究)
- 動的な網のモデルActive Netとその領域抽出への応用(画像処理-アルゴリズムとシステム-)
- Active Net : 動的な網のモデルの提案
- 目視検査のための画像処理ソフトウェア技術 (目視検査の自動化)
- 手の表面情報認識による人物同定
- 音声・視覚・画像をもつインタラクションシステム
- D-024 レシピの自動生成に向けた調味料推定の評価(データベース,一般論文)
- E-047 会議録自動作成システムに向けた話者識別技術の検討(自然言語・音声・音楽,一般論文)
- 非整備環境におけるハト追跡システムの構築について
- 音声・画像のモダリティ間の相互作用に着目した音声認識のモデル適応 (音声)
- 味覚刺激による表情表出過程の解析
- 空間指示語と想起される認知領域の基礎的研究
- キーワード抽出による映像コンテンツの理解支援の検討
- 音声・画像のモダリティ間の相互作用に着目した音声認識のモデル適応(音声・言語・音響教育,一般)
- 肺音の情報処理と応用 (特集 生体・医用における先端画像処理技術)
- 雑音環境下にける静的・動的情報を用いた音響モデル適応 (音声)
- GIF-SP : 汎用・識別的な特徴量を用いた音声認識性能の改善(耐雑音処理,第13回音声言語シンポジウム)
- GIF-SP : 汎用・識別的な特徴量を用いた音声認識性能の改善(耐雑音処理,第13回音声言語シンポジウム)
- スパース表現を用いた実環境における喀痰検出(ポスター講演,ポスターショートオーラル,時系列パターン認識)
- スパース表現を用いた実環境における喀痰検出(ポスター講演,ポスターショートオーラル,時系列パターン認識)
- 肺音の情報処理と応用
- スパース表現を用いた実環境における喀痰検出
- E-027 汎用・識別的特徴量を用いた音声区間検出(音声情報処理,E分野:自然言語・音声・音楽)
- スパース表現を用いた実環境における喀痰検出
- 雑音環境下における静的・動的情報を用いた音響モデル適応(雑音下音声認識,認識,理解,対話,一般)
- RO-008 検索新聞 : 新聞形式型検索情報提示システムにおけるマイクロブログを用いたユーザ適応(情報検索,O分野:情報システム)
- 高精度なマルチモーダル音声認識の実現に向けた取り組み(オーガナイズドセッション)