雑音環境下における合成発話アニメーションの評価(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
筆者らは、すでに自然な発話アニメーションの合成手法を提案してきた.しかし,その評価は主観評価実験によるところが大きかった.本稿では,発話アニメーションの客観的評価尺度を含む新しい評価手法について提案する.この評価手法では,発話アニメーションの性能は以下の3つの要素によって評価される.読唇が可能か.視覚的に自然か.音声と正確に同期しているか.読唇の可能性は,まず雑音環境下において顔アニメーションと音声とを被験者に提示し,発話単語がどの程度正しく聞き取ることができたかという実験により判断する.次に,発話アニメーションの視覚的な自然さと発話口形変化の滑らかさをMOS5段階評価する.音声との自然な同期に関しては,一定間隔で音声と発話アニメーションとの同期をずらしたものを被験者に提示し,主観的な同期のずれを調査するとともに、違和感の程度を5段階評価によって評価する.加えて,音声と発話アニメーションとの同期のずれが音声の知覚に及ぼす影響についても評価する.以上により,合成された発話アニメーションの品質評価を行い、音声との自然な同期について検証した.
- 社団法人電子情報通信学会の論文
- 2004-03-18
著者
-
中村 哲
(株)国際電気通信基礎技術研究所(ATR)音声言語コミュニケーション研究所
-
四倉 達夫
(株)国際電気通信基礎技術研究所
-
前島 謙宣
成蹊大学大学院工学研究科
-
森島 繁生
成蹊大学大学院工学研究科
-
四倉 達夫
株式会社国際電気通信基礎技術研究所
-
中村 哲
独立行政法人情報通信研究機構|株式会社国際電気通信基礎技術研究所
関連論文
- 23aBC-14 0.67〜0.92GeV光子ビームを用いた重水素からの2π光生成反応の研究(23aBC 実験核物理領域,理論核物理領域合同 ハドロン構造・相互作用・中間子生成(合同),実験核物理領域)
- 23aBC-13 γp→pπ^+π^-反応を用いたNKS2システムの性能評価(23aBC 実験核物理領域,理論核物理領域合同 ハドロン構造・相互作用・中間子生成(合同),実験核物理領域)
- 22pBS-5 中性K中間子スペクトロメータ中心部検出器の性能評価(22pBS 検出器III,実験核物理領域)
- 20aBD-3 JLab Hall C第3世代(e,e'K^+)ラムダハイパー核分光実験のためのK中間子スペクトロメータの性能評価(20aBD 理論核物理領域,実験核物理領域合同 ハイパー核・ストレンジネスI(合同),理論核物理領域)
- A-16-18 Blendshapesによるリップシンクアニメーションのためのキーフレーム削除法(A-16.マルチメディア・仮想環境基礎,一般講演)
- Water, Livelihood and Health in Attapeu Province in Lao PDR
- 高速度カメラを用いた顔面表情の動的変化に関する分析
- 高速度カメラを用いた顔面動作の分析
- アクティブカメラによる視線追跡・自動Lip Reading
- 京都観光案内対話コーパスにおける対話行為タグの設計と分析(理解)
- 同調的対話システム構築のための音声対話コーパスの構築(「ユニバーサルコミュニケーションを実現するための言語処理技術」シンポジウム)
- 30aSG-3 閾値領域でのn(γ,K^0)Λ反応測定によるK^0生成素過程の研究(30aSG 中高エネルギー重イオン・中間子生成・検出器II,実験核物理領域)
- 携帯型端末を用いた音声自動翻訳システムとフィールド実験(モバイルと放送の融合時代を迎えて(1セグ放送, モバイル放送, 携帯放送融合サービス, 1セグ対応携帯端末, モバイルコンテンツと放送コンテンツの融合, マルチメディア配信, ディジタル放送受信機, および一般))
- NICT知識創成コミュニケーション研究センターの研究と高度言語情報融合フォーラム(ALAGIN)の活動について(Web情報処理,Webとデータベースに関する技術報告)
- 28pSG-6 電子線を用いたハイパー核分光実験(JLab EO5-115)用水チェレンコフ検出器の開発(28pSG ハイパー核・検出器I,実験核物理領域)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(3)(SIG-SLP内組織の活動報告)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(2)(雑音・VAD,第9回音声言語シンポジウム)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境 (2)(雑音・VAD,第9回音声言語シンポジウム)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(第8回音声言語シンポジウム)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(Session-1 検出,第8回音声言語シンポジウム)
- 22pBS-6 (e,e'K^+)ラムダハイパー核分光実験のためのPMT磁場キャンセル装置(22pBS 検出器III,実験核物理領域)
- 20aBD-4 (e,e'K^+)反応を用いたJLab-HallC第三世代ラムダハイパー核分光実験(20aBD 理論核物理領域,実験核物理領域合同 ハイパー核・ストレンジネスI(合同),理論核物理領域)
- 20aBD-2 (e,e'K^+)反応を用いたハイパー原子核分光実験への散乱電子側高分解能スペクトロメータHESの導入と成果(20aBD 理論核物理領域,実験核物理領域合同 ハイパー核・ストレンジネスI(合同),理論核物理領域)
- 30aSG-5 NKS2実験におけるTULを用いたトリガー及びDAQシステムの開発(30aSG 中高エネルギー重イオン・中間子生成・検出器II,実験核物理領域)
- 30aSG-4 NKS2実験用ニューヴァーテックスチェンバーシステムの開発(30aSG 中高エネルギー重イオン・中間子生成・検出器II,実験核物理領域)
- 27aSJ-5 第三世代(e,e'K^+)原子核分光実験JLab E05-115の準備状況(27aSJ 実験核物理領域,理論核物理領域合同 ハイパー核・ストレンジネス(合同)I,実験核物理領域)
- 音声認識における頑健性 : 音響分析・音響モデル,なにが課題か(企画)
- NICTにおける音声・言語研究拠点MASTARプロジェクトについて(「ユニバーサルコミュニケーションを実現するための言語処理技術」シンポジウム)
- 音声翻訳単位の推定における句読点情報の効果(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 多チャンネル三次元音場再現システムの再生方式の違いによる再現性能評価
- マルチモーダル音声言語処理とその応用(マルチモーダル)
- 音声翻訳研究20年の夜明け : 受賞業績 携帯電話によるネットワーク型コーパスベース音声翻訳システムの構築(平成19年度喜安記念業績賞紹介)
- 同時通訳者の知識と韻律情報を用いた講演文章のチャンキング(チャンキング・要約)
- 2D-5 多言語音声翻訳基盤の通信インタフェースの検討と構築(音声対話・翻訳,一般セッション,人工知能と認知科学)
- ストーリへの没入感を実現するダイブイントゥザムービープロジェクト(テーマ関連/オーガナイズドセッション)
- ストーリへの没入感を実現するダイブイゥザムービープロジェクト(オーガナイズドセッション,CV/PR技術のVRへの応用)
- 5.効率的アニメ制作支援のための3次元CG技術(情報技術が支えるアートとコンテンツの世界)
- CENSREC-1-C : 雑音下音声区間検出評価基盤の構築
- 音声対話技術コンソーシアム(ISTC)の活動成果報告(SIG-SLP内組織の活動報告)
- マルチモーダル対話システムのための階層的アーキテクチャの提案
- モーションキャプチャを用いた内部骨格の動作再現(ヒューマン情報処理及び一般)(ヒューマンコミュニケーショングループ(HCG)大会)
- 連続音声認識候補受理・リジェクションのためのワードスポッティング仮説検証手法(システム・信頼度)(第5回音声言語シンポジウム)
- 統計的対話モデルを用いたWFSTに基づく音声対話システム
- 同調的対話を実現するプロトタイプシステムの開発(対話・インタフェース・インタラクション)
- SLP雑音下音声認識評価WG活動報告 : 評価用データと評価手法について(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 実走行車内音声認識の評価データベースCENSREC-3とその共通評価ベースライン
- 実走行車内単語音声データベースCENSREC-3と共通評価環境の構築
- CENSREC-3 : 実走行車内単語音声データベースと評価環境の構築(ポスターセッション)(第6回音声言語シンポジウム)
- 実環境下音声認識の評価の標準化とその動向(音声・言語における標準化動向)(第6回音声言語シンポジウム)
- AURORA-2Jを用いたETSI STQ Aurora WI008 Advanced DSR Frontendの評価(ポスターセッション)(第5回音声言語シンポジウム)
- 生理学的手法を用いた顔面筋肉モデルの構築
- 高速度カメラによる動的な顔面表情の分析および合成
- 自発・演技表情表出時における顔面動作および表情合成
- 高速度カメラを用いた顔面動作の分析および表情合成
- モーションキャプチャによる顔表情の定量表現(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- 雑音環境下での音声の聞き取り実験による合成発話顔アニメーションの評価(コンピュータグラフィックス(CG)基礎)
- 雑音環境下における合成発話アニメーションの評価(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- 来場者の声の特徴を反映する映像エンタテインメントシステムのための台詞音声生成システム
- iFACe:デジタルアニメ声優体験システム
- 個人の音声を反映する映像エンタテインメントシステム
- 音声のパラメータ変換によるイントネーション変換システムの構築(ヒューマンコミュニケーション及び一般)(ヒューマンコミュニケーショングループ(HCG)大会)
- カスタマイズ性を考慮した擬人化音声対話ソフトウェアツールキットの設計(音声言語情報処理とその応用)
- 擬人化音声対話エージェントツールキットGalatea
- 擬人化音声対話エージェントツールキットの基本設計
- 影響力マップを用いた任意表情モデル上での表情合成
- 擬人化音声対話エージェントツールキットの基本設計
- HYPERMASK : 3次元顔モデルを用いた仮面の構築
- 高速度カメラを用いた顔面動作の分析および表情合成
- 高速度カメラを用いた顔面動作の分析および表情合成
- 高速度カメラで捉えた自発表情と演技表情の動的変化
- D-11-110 HyperMask-任意表情及び人物表出可能な仮面の構築
- Hyper Mask:表情・口形状制御可能な顔モデルを用いた仮面の構築
- D-11-148 古典バレエのモーションキャプチャリング
- A-16-11 3次元アバタの構築とリアルタイム対話システム
- モーションキャプチャシステムを用いたマルチモーダル音声コーパスの構築(セッション2)(インタラクション・メディア)
- D-8-11 擬人化音声対話システム構築のための顔モデル生成ツールの開発(D-8. 人工知能と知識処理)
- A-14-2 音声のパラメータ変換によるイントネーション変換システムの構築
- 擬人化音声対話システムにおけるエージェント画像生成
- 擬人化音声対話エージェントのための表情合成技術
- 擬人化音声対話エージェントのための表情合成技術
- ネットワークシアタ : 仮想環境とコンピュータネットワークによるコンテンツ作成システム
- A-14-21 高速度カメラを用いた表情表出時の顔面動作の分析および微妙な表情の合成
- A-14-18 仮想空間を用いた多人数コミュニケーションシステム構築
- A-14-6 ネットワークシアタ
- 擬人化音声対話エージェント開発と周辺技術 : (3)対話における顔画像生成
- 判別分析法による音声の感情推定及び実時間メディア変換システム
- 韻律情報制御のための感情音声合成GUIツール
- 自然音声の分析に基づく音声への感情情報の付加
- 仮想人物によるサイバースペース上でのコミュニケーションシステムの構築
- A-14-4 音声からの感情推定と実時間メディア変換システム
- 新映像技術「ダイブイントゥザムービー」
- 音声認識の動向[II] : 音声認識性能の客観的評価に向けて
- A-14-3 リアルな3次元表情編集ツールの作成
- サイバースペース上の仮想人物による実時間対話システムの構築 (ヒューマンインタフェースとインタラクション)
- 11)音声による実時間口形・表情制御可能なサイバースペース上での仮想人物の実現(ネットワーク映像メディア研究会)
- サイバースペース上での多人数コミュニケーションシステム
- 音声による実時間口形・表情制御可能なサイバースペース上での仮想人物の実現
- 音声による実時間口形・表情制御可能なサイバースペース上での仮想人物の実現
- 韻律情報の制御による感情音声合成のための声質変換
- A-14-7 音声に含まれる感情のモデル化と感情音声合成ツール