語彙が与える印象に基づく対話韻律生成
スポンサーリンク
概要
- 論文の詳細を見る
対話音声の合成を目指して,対話韻律生成の方法を提案した。対話場面において出現する発話内容自体が,その取り得る対話韻律を限定することに着目し,提案方法では,入力となる語彙が与える印象によって制約される韻律特徴量を用いて,従来の読み上げ韻律を修正する対話韻律生成を行う。これまでに行った一語発話「ん」のパラ言語分析が示した,3次元の知覚的印象空間(確信-疑念,肯定-否定,好印象-悪印象)と韻律制御(基本周波数の平均値と時間変化形状,発話時間長)の関係を用いて,同じ印象空間で典型的な座標を持つ語彙に対して,対応する対話韻律を付与した。得られた合成音声に対する自然性評価実験により,提案した方法の妥当性を確認した。
- 2011-02-01
著者
-
津崎 実
京都市立芸術大学
-
津崎 実
Atr人間情報通信研究所
-
匂坂 芳典
早稲田大学国際情報通信研究科
-
匂坂 芳典
Atr音声言語コミュニケーション研究所:(現)早稲田大学大学院
-
匂坂 芳典
早稲田大学
-
加藤 宏明
Nict:atrメディア情報科学研究所
-
匂坂 芳典
ATR 音声言語通信研究所
-
匂坂 芳典
早稲田大学大学院国際情報通信学研究科
-
グリーンバーグ 陽子
早稲田大学大学院国際情報通信学研究科
-
加藤 宏明
独立行政法人情報通信研究機構
-
勾坂 芳典
ART音声翻訳通信研究所
-
津崎 実
京都市立芸術大学音楽部
-
Kato Hiroaki
Atr Human Information Processing Research Laboratories
-
津崎 実
京都市立芸大
関連論文
- フレッシュマン企画 : 音の常識Q&A(やさしい解説)
- 音の持続時間が音源の大きさ知覚に及ぼす影響 : 母音刺激を用いた検討(日本基礎心理学会第28回大会,大会発表要旨)
- 日本人学習者による英語のリズム制御におけるモーラの影響(感情音声,韻律,声質,音声生成・知覚,脳機能,一般)
- ことばとコミュニケーション(音叉)
- 種々の周波数遷移特性における音の時間知覚の比較(日本基礎心理学会第28回大会,大会発表要旨)
- 等間隔性からのずれに対する聴覚感度の調査 : 周波数遷移の開始点と終了点での比較(日本基礎心理学会第27回東北大会,大会発表要旨)
- 旋律同定における場所・時間情報の役割 : 輪郭と音程の判断
- 聴覚的視点から見たアルペジオと和音の境界について : 蝸牛遅延との関連は?
- 統計的翻訳評価尺度に基づく日英翻訳文の訳質分析(機械翻訳)
- 未知固有表現を含む音声の認識([特別セッション]音声言語獲得・学習技術(2), 未知語処理)
- 複数のマルコフモデルを用いた階層化言語モデルによる未登録語認識(音声、聴覚)
- 話題と文型の違いを同時に考慮した言語モデル適応
- 構造化言語モデルとその実装
- 対話者の前発話を利用した統計的言語モデル
- クラスに依存した語彙の確率的記述に基づく階層型言語モデル
- 2つの単語クラスから生じた未登録語のサブワードモデルによる音声認識
- 音系列中の新規音知覚に関わる周波数遷移条件の検討
- フレッシュマン企画 : 音の常識Q&A
- 自動音韻セグメンタの時間精度評価 : ラベル尤度との相関と誤差の音韻文脈依存性
- サブワードネットワークに基づく未登録語処理を搭載したデコーダの構築
- 大語彙連続音声認識における未知語のsub-wordモデリング手法
- 日本人英語学習者音声の時間制御特性客観評価(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
- Q&Aコーナー(コーヒーブレーク)
- ピアノ演奏における聴覚フィードバックの利用(音楽認知・知覚3)
- スポーツオノマトペの実態について
- スポーツ指導者・体育学習者のためのオノマトペ辞典の開発
- 大語彙連続音声認識における未知語のsub-wordモデリング手法
- 音声翻訳システム : ATR-MATRIXの開発と評価(音声言語情報処理とその応用)
- 中国語単語音声からの基本周波数制御コマンドの自動抽出
- 発声スタイル並行コーパスを用いた発音変形の分析
- 大規模コーパスを用いた音声合成システムXIMERA(音声,聴覚)
- 音声合成システムXIMERAにおける日本語合成音の自然性劣化要因の分析
- コーパス・ベース音声合成システムXIMERA(一般, 一般, チュートリアルレクチャー)
- コーパス・ベース音声合成システムXIMERA
- D-14-11 日本人学習者に見られる中国語声調制御難易度の分析(D-14. 音声,一般セッション)
- 対話音声合成を目指した対話音声の韻律分析
- 発話スタイル並列コーパスを用いた発音変形の分析
- 対話音声を対象とした連続音声認識システムの試作と評価
- 平均スペクトル等化の検討(合成, 韻律, 生成, 一般)
- 連続母音の遷移部の知覚における後続雑音の効果
- 種々の周波数変化音の動的知覚特性
- 周波数変化音の動的知覚特性
- スイープ音追跡過程の動特性
- 連続音声の過度部の知覚における後続雑音の効果
- 周波数変化音知覚における残効
- 素片接続合成単位選択のための特徴量に関する聴覚モデルの導入 : 物理モデルとの比較と聴取実験による評価
- STRAIGHT合成音源に対する位相拡散の最適化 : 心理評価と制御変数値推定の試み
- STRAIGHT合成音源に対する位相拡散の最適化 : 心理評価と制御変数値推定の試み
- 基本周波数パタンに見られる発話態度の分析(対話)
- 持続時間収縮錯覚と時間間隔による文脈の関係について(音楽認知・知覚3)
- 聴覚系における共鳴体の「大きさ」知覚の時間追随性 : 寸法変調音声を用いた検討(日本基礎心理学会第26回大会,大会発表要旨)
- 語彙が与える印象に基づく対話韻律生成
- ジッター検出に対する時間領域の非対称性の影響
- 調性の枠組みのある継時的音程の知覚 : 場所・時間情報による差異(日本基礎心理学会第24回大会,大会発表要旨)
- 日英バイリンガル・コーパスを用いた知覚的話者空間の推定
- 発話の時間構造知覚における視聴覚の情報統合 : 時間知覚における聴覚優位の再発見
- 音色の印象に関わる非パワースペクトル的要因
- 合成音源に対する群遅延制御と基本周波数変換音声の品質
- 音声分析合成系における音源の非周期成分付加方式の比較検討
- 音声の非周期成分の時間特性の抽出と合成について
- STRAIGHT合成音源に対する位相拡散効果の最適化 - 心理評価による検討 -
- 波形素片接続時の音素環境代替による自然性劣化の知覚的評価
- 群遅延・イベント・調派構造による音源情報表現の検討
- STRAIGHT分析合成音の心理評価 - 話者依存性の検討 -
- 単位接続型音声合成における音素環境代替による自然性劣化の知覚的評価
- 時間変形を施した発話の視聴覚刺激に対する知覚的弁別 : 単独条件,一致条件,矛盾(固定)条件間の比較
- 時間変形を施した発話の視聴覚刺激に対する知覚的弁別 -両モダリティーの時間構造が矛盾する場合-
- 時間変形を施した発話の視聴覚刺激に対する知覚的弁別 --複数モダリティーの場合--
- 時間変形を施した発話の視聴覚刺激に対する知覚的弁別 --単一モダリティーの場合の比較--
- パルス列に対する群遅延特性の時間的非対称性の検出
- 非調波部分音によるピッチシフトのモデル
- 時間構造の知覚的再現性について : 揺らぐ時間と揺らがない時間
- コーパスベース音声合成技術の動向[III] : コーパスの設計と評価尺度
- 波形接続型音声合成における知覚的評価に基づく素片選択サブコスト関数の最適化(合成, 韻律, 生成, 一般)
- 波形接続型音声合成における局所的な自然性劣化を考慮に入れた素片選択の評価
- 素片接続型日本語テキスト音声合成における音素単位とダイフォン単位に基づく素片選択
- 音声合成用大規模音声コーパスにおける声質時期差の検討
- 波形接続型テキスト音声合成における素片選択コストの知覚的評価
- 素片接続型音声合成器の単位選択特徴量についての検討 : 聴覚モデルとMFCCによる選択の聴取評価
- 日本語テキスト音声合成における母音中心での接続を考慮に入れた単位選択
- 波形接続型音声合成における音素環境代替コストの予測
- STRAIGHTとPSOLAによる単語音声分析合成音の比較評価
- 日本語テキスト音声合成における音素単位とダイフォン単位に基づいた単位選択
- ネットワーク座談会「聴覚の情景分析」 : カクテルパーティー問題を越えて (聴覚の情景分析)
- 日英バイリンガル・コーパスを用いた知覚的話者空間の推定(オーガナイズドセッション2,聴覚・音声・言語とその障害/一般)
- 語彙が与える印象に基づく対話韻律生成
- 単独母音間の話者寸法弁別に影響を与える時間的要因の検討
- 寸法変調母音系列の同定成績と寸法抽出過程の時間的追随性との関連性(音声・聴覚,一般)
- 聴覚における「形」の恒常性と寸法正規化について(日本基礎心理学会第24回大会,大会発表要旨)
- 周波数変化音追跡の動特性
- Q&Aコーナー(コーヒーブレーク)
- 「ハイペリオン(上・下)」, ダンシモンズ著, 酒井昭伸訳, 2000年, 早川書房 (私のすすめるのこ一冊,コーヒーブレーク)
- スケーリングした2種のインパルス応答が交替する音系列に対するピッチ知覚 : 調整法による心理物理実験
- 特集 日本音楽知覚認知学会編集委員会座談会議事録
- 歌舞伎とニュートンの林檎(ちょっとしたエッセイ,コーヒーブレーク)
- 個人性を考慮した異言語音声合成に対する知覚評価
- スケール変形母音の話者寸法弁別と母音同定 : 母音持続時間の依存性
- 個人性を考慮した異言語音声合成に対する知覚評価(オーガナイズドセッション「音声知覚生成インタラクション・音声認識合成統合技術」,音声知覚生成/聴覚コミュニケーション,一般)
- スケール変形母音の話者寸法弁別と母音同定 : 母音持続時間の依存性(オーガナイズドセッション「音声知覚生成インタラクション・音声認識合成統合技術」,音声知覚生成/聴覚コミュニケーション,一般)
- 寸法判断における視聴覚情報統合(日本基礎心理学会第31回大会,大会発表要旨)