動画像情報の音声知覚ヘの影響
スポンサーリンク
概要
- 論文の詳細を見る
人間が音声知覚するとき、耳から聞こえる音だけでなく、視覚の影響も受けていることが知られている。たとえば、「ぱ」という音声と「が」と言っている口の動きの画像とを合わせて提示すると、他の音一一たとえば「だ」ーーに知覚される(McGurk効果)。本稿では、音声知覚に影響を与えるのは動画像情報の中のどんな要素なのか、画像のフレームレートなどを変化させ、聴取実験をおこなうことによって議論する。文献において、フレームレートが変わると、McGurk効果によって異聴が生じる度合が変わることを示した。しかし、フレームレートの変動によって生じるどのような視覚的刺激の変化要因が音声知覚に影響を与えたのか、真の原因を特定するまでには至らなかった。ここでは、その要因として、(1)画像の動きがとびとびに不自然になることによって聴覚に与える影響を阻害する、(2)動画像のコマを間引くことによって音韻の決定をする上で重要な特定の視覚的刺激を持った画像(コマ)が落ちる、の2つを考える。この特定のコマとは、唇音と非唇音の間で異聴が顕著に見られることから、「唇を閉じた瞬間」の画像であると予想できる。そこで、今回は、口を閉じた状態から「ば」と1回だけの発声したデータと、その前に「あ」の音をつけた発声したデータの2種類を用意した。(前者を"ba-type"、後者を"aba-type"と呼ぶ)そして、音声波形を見ながら、「ぱ」の音の立上りの瞬間からちょうど1秒前を開始点とし、そこから2秒間を刺激データの素材として切り出すことによって、刺激ごとの時間軸を正規化した。[figre1]この素材をもとに、30fps,15fps,10fps,5fps,3fpsの刺激データをダウンサンプルした。これによって、どの刺激データも音の立上りの瞬間の画像を含むことなる。さらに、aba-typeの刺激については、フレームレートが十分低いときに[figre1]に示したようにサンプルするフレームを半分ずらすと、口を閉じる瞬間がまったく入っていない刺激が作れる。(こうして作った刺激データを"15fps-Shift"と呼ぶ)これらの刺激データを使って、提示、聞き取りの実験を行った。
- 一般社団法人情報処理学会の論文
- 1994-09-20
著者
関連論文
- ゲーム課題の遂行時における作業負荷の生理指標および心理指標による評価(HCGシンポジウム)
- R&Dホットコーナー ソリューション 外国人旅行者や聴覚障がい者のためのコミュニケーション支援技術VUTE
- ユニバーサルなピクトグラムデザインのためのCLとジェスチャの分析
- 聴覚障害者支援技術研究のレビューと将来への展望(支援技術研究のレビューと将来への展望)
- 5.音声の知見の情報福祉への応用(バリアフリー社会に向けた音声情報処理)
- VUTE:動画ピクトグラムによる緊急時コミュニケーション補助システム(手話・聴覚障害,HCGシンポジウム)
- 外国人や聴覚障害者の緊急時ユニバーサルコミュニケーション支援技術に関する検討(福祉情報工学,ヒューマンコミュニケーション〜人間中心の情報環境構築のための要素技術〜論文)
- 遅延のある手話画像による対話の定量的分析
- ユニバーサルデザインのための日本手話版NASA-TLXの開発と評価
- 動画ピクトグラムによるコミュニケーション補助のための手話表現の分析(手話・聴覚障害,HCGシンポジウム)
- 聴覚障害者にとっての文字情報提示の有用性
- 聴覚障害者に対する情報保障手段の検討 : 手話と文字情報とを比較する(福祉と音声処理,一般)
- 聴覚障害者に対する情報保障手段の検討 : 手話と文字情報とを比較する(福祉と音声処理,一般)
- 線形時間非決定性ボトムアップピラミッドセルオ-トマトンの受理能力
- 手話文読み取り時の語彙認知に関する基礎検討
- 手話シャドーイングの分析にもとづく手話の時間的特徴の検討
- 手話シャドーイングの分析にもとづく手話の時間的特徴の検討(コミュニケーション支援及び一般)
- 手話シャドーイングの分析にもとづく手話の時間的特徴の検討(コミュニケーション支援及び一般)
- 遅延手話対話における話者交替時の信号表出に関する解析的検討(福祉情報工学一般)
- 遅延手話対話における頷きの時間的特長と差異分析(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- 遅延環境における対話の単語の表出と発話時間の検討(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- 映像遅延が手話対話へ及ぼす影響の定量化手法(聴覚補助,情報福祉論文)
- 遅延環境下における映像対話のメンタルワークロードの評価
- 遅延手話における頷きが話者交替に与える影響について
- 駅での会話を支援するコミュニケーションエイドの評価実験と改良 (マルチメディア・仮想環境基礎)
- 駅での会話を支援するコミュニケーションエイドの評価実験と改良 (画像工学)
- Digital Encoding Applied to Sign Language Video(Service and System,Human Communication II)
- 動きベクトルを用いた手話単語分類(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- オンライン手話通訳における機器類の配置に関する検討
- ディジタル符号化された手話動画像の品質評価について(マルチメディア処理)
- シャドーイングと遅延フィードバック発話による手話の時間的特性の分析(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- 遅延を含む手話対話のターンテイキング解析
- 手話動画像通信に関する研究(パターン理解,人工知能分野における博士論文)
- 駅での会話を支援するコミュニケーションエイドの評価実験と改良(五感メディアの品質,コミュニケーションデザイン,画像符号化,食メディア,一般)
- 駅での会話を支援するコミュニケーションエイドの評価実験と改良(五感メディアの品質,コミュニケーションデザイン,画像符号化,食メディア,一般)
- 手話動画像の評価実験 : 画面サイズ, フレームレート, 量子化幅等の影響(視覚障害/聴覚障害/一般)
- 手話通信における遅延の影響と遅延検知限の評価(福祉と知能・認知障害/一般)
- 手話通信における遅延の影響と遅延検知限の評価(福祉と知能・認知障害/一般)
- 手話対話の映像遅延に及ぼす影響の基礎的な検討(視覚障害/聴覚障害/一般)
- 手話動画像用デジタル符号化法の提案と評価
- デジタル符号化された手話動画像の品質評価(2) : オピニオン試験による評価(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- デジタル符号化された手話動画像の品質評価(1) : 書き取り試験による評価(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- 動きベクトルを利用した手話動画像からの動き抽出
- キ-ワ-ド自動抽出システム(INDEXER) (知能処理技術の応用)
- 手話動画像の効率的符号化について
- 知覚特性を利用した低ビットレート動画像提示法
- 動画像のフレームレートと音声知覚との関係について
- 動画像情報の音声知覚ヘの影響
- マルチメディア通信における動画像フレームレートの音声知覚への影響
- 並列計算のモデルとしてのニューラルネット
- 86-29 合流式に基づく定性的物理学
- 外国人や聴覚障害者のための駅での会話支援ツール