波形素片接続時の音素環境代替による自然性劣化の知覚的評価
スポンサーリンク
概要
- 論文の詳細を見る
波形素片接続型の音声合成において、合成単位の音素環境が抽出時と使用時で異なることに起因する自然性の劣化を表す評価値を得るために、VCV音声を先頭のVと後続のCVの間で分割し、異なる波形素片を再接続して刺激音声を作り、接続部の自然性を評定する知覚実験を行った。その結果、母音の後続環境を代替する場合は、(1)使用環境が[y,w]の場合に評価値が低いこと、(2)抽出環境と使用環境に対して評価値が非対称であること、などが明らかになった。また、子音の先行環境を代替する場合は, (1)抽出環境が[i]のとき評価値が高く、[N,a]では評価値が低いこと、(2)子音の先行環境よりも子音自体の違いの方が評価値への影響が大きいこと、(3)子音が無声の破裂音、破擦音、摩擦音の場合に評価値が高いこと、などが明らかになった。
- 社団法人電子情報通信学会の論文
- 2001-05-18
著者
-
津崎 実
Atr人間情報通信研究所
-
河井 恒
株式会社kddi研究所音声処理グループ
-
河井 恒
KDD研究所
-
岩澤 秀紀
Crest
-
河井 恒
ATB音声言語通信研究所
-
津崎 実
ATB音声言語通信研究所
-
舛国 剛志
奈良先端科学技術大学院大学
-
舛田 剛志
旭化成株式会社研究開発本部情報技術研究所
関連論文
- フレッシュマン企画 : 音の常識Q&A(やさしい解説)
- 音の持続時間が音源の大きさ知覚に及ぼす影響 : 母音刺激を用いた検討(日本基礎心理学会第28回大会,大会発表要旨)
- テレビ視聴環境を利用した顔認識のための変動学習
- 携帯型端末を用いた音声自動翻訳システムとフィールド実験(モバイルと放送の融合時代を迎えて(1セグ放送, モバイル放送, 携帯放送融合サービス, 1セグ対応携帯端末, モバイルコンテンツと放送コンテンツの融合, マルチメディア配信, ディジタル放送受信機, および一般))
- 音楽情報検索向け類似テキスト検索システムの試作(音楽情報検索)
- 携帯電話音声に対する主観評価の精度及び客観評価尺度PESQの有効性の検証(一般)
- 種々の周波数遷移特性における音の時間知覚の比較(日本基礎心理学会第28回大会,大会発表要旨)
- 等間隔性からのずれに対する聴覚感度の調査 : 周波数遷移の開始点と終了点での比較(日本基礎心理学会第27回東北大会,大会発表要旨)
- 音系列中の新規音知覚に関わる周波数遷移条件の検討
- B-6-57 総合音声伝送品質率に基づくヘッダ圧縮処理の制御に関する一検討(B-6.ネットワークシステム,一般講演)
- 転送特性が非対称なワイヤレスリンクにおけるヘッダ圧縮性能向上に関する検討(Webサービスベースのオフィスアプリケーション・ネットワーキング・マネジメント及び一般)
- B-6-124 転送特性の異なる複合IP網における会話型アプリサービス提供に関する一検討(B-6.ネットワークシステム, 通信2)
- 背景雑音を含む携帯電話音声に対するMOS評価の精度推定とPESQの有効性検証
- B-6-115 ワイヤレスIP網におけるRTPパケット受信バッファ制御に関する一検討(B-6. ネットワークシステム, 通信2)
- 無線 IP 網上における区間分割型 QoS 情報通知機能に基づくメディア品質制御手法
- 無線IP網上における区間分割型QoS情報通知機能に基づくメディア品質制御手法
- 波形素片接続型音声合成システムの検討
- アンサンブル学習に基づく音韻継続長のモデル化(合成, 生成, 韻律, 一般)
- 日本人英語学習者音声の時間制御特性客観評価(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
- 分散型音声認識の商用システム構築(特別企画「音声認識デベロッパーズフォーラム」)
- B-15-16 統合PDA端末の開発(6) : 分散型音声認証システムの実装(B-15. モバイルマルチメディア通信, 通信1)
- 大語彙汎用音声認識エンジンの評価
- 大語彙汎用音声認識エンジンの開発
- 多数話者電話音声データベースを用いた話者クラスタリングの検討
- 韻律生成HMMのための学習データ作成ツール
- 音声翻訳システムのための声質変換法と日中英語間における評価
- Q&Aコーナー(コーヒーブレーク)
- 携帯型端末を用いた音声自動翻訳システムとフィールド実験
- 多言語音声の合成
- 連続数字認識を利用した悪戯電話排除システム
- 少数マイクロホンを用いた音声入力手法の検討(立体音響・トランスデューサ/一般)
- 大規模コーパスを用いた音声合成システムXIMERA(音声,聴覚)
- 音声合成システムXIMERAにおける日本語合成音の自然性劣化要因の分析
- コーパス・ベース音声合成システムXIMERA(一般, 一般, チュートリアルレクチャー)
- コーパス・ベース音声合成システムXIMERA
- ATRにおける中国語テキスト音声変換システム
- 品詞列の分析にもとづく中国語音声のポーズ予測(合成・生成,韻律,一般)
- 平均スペクトル等化の検討(合成, 韻律, 生成, 一般)
- セグメンテーション誤差最小規準にもとづく音素セグメンテーション用HMMの識別学習(合成, 韻律, 生成, 一般)
- 自動ラベリングされた中国語音声コーパスにおける声調の検証
- 中国語基本周波数パターンの自動ラベリング手法
- 統語情報を利用いた中国語韻律境界の自動検出
- 句レベルの韻律を考慮した中国語音声合成のための音声コーパス設計
- 中国語の音声合成のための音韻と韻律を考慮したテキストコーパス
- 連続母音の遷移部の知覚における後続雑音の効果
- 種々の周波数変化音の動的知覚特性
- 周波数変化音の動的知覚特性
- スイープ音追跡過程の動特性
- 連続音声の過度部の知覚における後続雑音の効果
- 周波数変化音知覚における残効
- A-10-7 2段階DOA推定法に基づく音源分離手法の評価(A-10.応用音響,一般講演)
- 波形接続型音声合成における素片選択遅延時間の短縮(音声,聴覚)
- 素片接続型音声合成における最良優先探索に基づく素片選択(一般, STRAIGHTスペシャルセッション(SS))
- 波形接続型音声合成における連続素片優先探索の効果(合成, 生成, 韻律, 一般)
- 幅優先探索に基づく短遅延素片選択アルゴリズムの評価
- 短遅延素片選択におけるビーム幅制御の検討
- 短遅延音声合成のための素片選択法(合成・生成,韻律,一般)
- 波形素片接続型音声合成のための音声データの収集
- 素片接続合成単位選択のための特徴量に関する聴覚モデルの導入 : 物理モデルとの比較と聴取実験による評価
- 連続数字認識における低認識率話者の分析
- 音声認識を利用した携帯電話サービスの開発(パネルディスカッション「音声認識技術の実用化」)
- 音声合成用大規模音声コーパスの構築(チュートリアル: 音声収録から始めるコーパスベース音声合成, 一般, チュートリアルレクチャー)
- 無線 IP 網上における区間分割型 QoS 情報通知機能に基づくメディア品質制御手法
- 電話網経由の連続数字音声認識システムの試作
- STRAIGHT合成音源に対する位相拡散の最適化 : 心理評価と制御変数値推定の試み
- STRAIGHT合成音源に対する位相拡散の最適化 : 心理評価と制御変数値推定の試み
- 日英バイリンガル・コーパスを用いた知覚的話者空間の推定 (音声)
- 聴覚系における共鳴体の「大きさ」知覚の時間追随性 : 寸法変調音声を用いた検討(日本基礎心理学会第26回大会,大会発表要旨)
- 語彙が与える印象に基づく対話韻律生成
- ジッター検出に対する時間領域の非対称性の影響
- 日英バイリンガル・コーパスを用いた知覚的話者空間の推定
- 発話の時間構造知覚における視聴覚の情報統合 : 時間知覚における聴覚優位の再発見
- 音色の印象に関わる非パワースペクトル的要因
- 合成音源に対する群遅延制御と基本周波数変換音声の品質
- 音声分析合成系における音源の非周期成分付加方式の比較検討
- 音声の非周期成分の時間特性の抽出と合成について
- STRAIGHT合成音源に対する位相拡散効果の最適化 - 心理評価による検討 -
- 波形素片接続時の音素環境代替による自然性劣化の知覚的評価
- 群遅延・イベント・調派構造による音源情報表現の検討
- STRAIGHT分析合成音の心理評価 - 話者依存性の検討 -
- 単位接続型音声合成における音素環境代替による自然性劣化の知覚的評価
- 時間変形を施した発話の視聴覚刺激に対する知覚的弁別 : 単独条件,一致条件,矛盾(固定)条件間の比較
- 時間変形を施した発話の視聴覚刺激に対する知覚的弁別 -両モダリティーの時間構造が矛盾する場合-
- 時間変形を施した発話の視聴覚刺激に対する知覚的弁別 --複数モダリティーの場合--
- 時間変形を施した発話の視聴覚刺激に対する知覚的弁別 --単一モダリティーの場合の比較--
- パルス列に対する群遅延特性の時間的非対称性の検出
- 非調波部分音によるピッチシフトのモデル
- 時間構造の知覚的再現性について : 揺らぐ時間と揺らがない時間
- ネットワーク座談会「聴覚の情景分析」 : カクテルパーティー問題を越えて (聴覚の情景分析)
- 日英バイリンガル・コーパスを用いた知覚的話者空間の推定(オーガナイズドセッション2,聴覚・音声・言語とその障害/一般)
- 単独母音間の話者寸法弁別に影響を与える時間的要因の検討
- 周波数変化音追跡の動特性
- Q&Aコーナー(コーヒーブレーク)
- スケーリングした2種のインパルス応答が交替する音系列に対するピッチ知覚 : 調整法による心理物理実験
- 特集 日本音楽知覚認知学会編集委員会座談会議事録
- 歌舞伎とニュートンの林檎(ちょっとしたエッセイ,コーヒーブレーク)
- 個人性を考慮した異言語音声合成に対する知覚評価
- スケール変形母音の話者寸法弁別と母音同定 : 母音持続時間の依存性
- 個人性を考慮した異言語音声合成に対する知覚評価(オーガナイズドセッション「音声知覚生成インタラクション・音声認識合成統合技術」,音声知覚生成/聴覚コミュニケーション,一般)
- スケール変形母音の話者寸法弁別と母音同定 : 母音持続時間の依存性(オーガナイズドセッション「音声知覚生成インタラクション・音声認識合成統合技術」,音声知覚生成/聴覚コミュニケーション,一般)