母音音源信号のランダムフラクタル性を利用した合成音声の自然性改善
スポンサーリンク
概要
- 論文の詳細を見る
本論文では,線形予測分析により得られた-6dB/oct(1/f^2)特性となる母音音源信号のランダムフラクタル性をシャウダー解析により調べた.また,解析結果に基づき合成音声の自然性を改善する方法を提案した.線形予測分析に基づく音声合成では,周期性を示す母音音源信号をパルス列とする単純化がしばしば採用される.このとき合成母音はブザー音質として知覚されやすく,自然性が大幅に劣化することが指摘されている.本論文では,母音音源信号のランダムフラクタル性を利用したパルス列音源の改善法を提案し,音響心理実験により提案法の有効性について主観的評価を行った.
- 社団法人電子情報通信学会の論文
- 1999-09-25
著者
-
青木 直史
北海道大学大学院情報科学研究科
-
伊福部 達
北海道大学電子科学研究所
-
伊福部 達
北海道大学
-
青木 直史
北海道大学電子科学研究所
-
青木 直史
北海道大学 大学院 工学研究科
-
青木 直史
北海道大学
関連論文
- DVI-ADPCMに対するロスレスステガノグラフィの一手法(研究速報,マルチメディア情報ハイディング技術とその応用論文)
- IP電話におけるロスレス方式のステガノグラフィ技術(ブロードバンドアクセス,ホームネットワーク,ネットワークサービス,通信利用アプリケーション,一般)
- 音響プログラミング入門(やさしい解説)
- リアルバーチャリティー--映像の中のウソ=人間にとって現実よりもリアルな架空世界のこと (特集 新しい映像表現とディスプレイ)
- リアルバーチャリティー : 映像の中のウソ(高臨場感ディスプレイフォーラム2009臨場感とは何か?)
- リアルバーチャリティー : 映像の中のウソ(高臨場感ディスプレイフォーラム2009-臨場感とは何か?-)
- リアルバーチャリティー--映像の中のウソ
- 音のリアルバーチャリティに関する一考察(複合現実感,仮想都市,及び一般)
- モノづくりにおけるWeb2.0の可能性(仮想都市,複合現実感,及び一般)
- サウンドエフェクトを題材としたプログラミング演習(感情音声,韻律,声質,音声生成・知覚,脳機能,一般)
- 狭帯域電話音声の帯域拡張に関する一考察(ワイヤレス環境でのアプリケーション品質,P2P/アドホックネットワーク,画像符号化ストリーム技術,信頼性,一般)
- YOSAKOIソーラン祭りのためのサイバー鳴子の開発(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- サイバー鳴子が彩るYOSAKOIソーラン祭りの夜(楽しいあかりのヒント)
- H8マイコンによる学習用IP電話スタータキットの開発(マルチメディア,一般,ネットワーク制御,QoS,ルーティング,マルチキャスト及び一般)
- プロトタイピングによるモノづくりの可能性 (マルチメディア・仮想環境基礎)
- SD-1-1 XMLによる音声データベースのオープンコンテンツ化(SD-1. WebとXML : 新たな展開)
- D-4-1 キーワードによる効果音データベース検索システムの開発
- D-11-110 画像処理によるギター運指動作のキャプチャリング(D-11. 画像工学D(画像処理・計測), 情報・システム2)
- K-088 演舞者のパフォーマンスをアシストするIT楽器の開発(K.ヒューマンコミュニケーション&インタラクション)
- D-11-66 ギター演奏動作のキャプチャ装置の開発(D-11.画像工学B)
- フォトリフレクタ方式によるギター演奏動作のキャプチャリング
- フォトリフレクタ方式によるギター演奏動作のキャプチャリング(映像メディア及び一般)
- リアルバーチャリティー : 映像の中のウソ
- MATLABによるサウンド処理のプログラミング演習(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
- 全波整流にもとづく狭帯域電話音声の一帯域拡張法(聴覚・音声・言語とその障害,一般)
- 非線形量子化にもとづく音声コーデックにおけるロスレスステガノグラフイの一手法
- 全波整流に基づくステガノグラフィを用いたG.711音声の一帯域拡張法(マルチメディアシステム)
- G.711におけるロスレスステガノグラフィに関する一考察(信号処理,LSI,及び一般)
- G.711におけるロスレスステガノグラフィに関する一考察(信号処理,LSI,及び一般)
- プロトタイピングによるモノづくりの可能性(複合現実感,仮想都市)
- ユビコン環境利用化身話システム構築のための調査研究 : 「ネットワークを通して化身を媒体とした異文化コミュニケーションツール」の可能性を探る(映像メディアおよび一般 : インターネット, デジタル放送, マルチメディア, 三次元画像, 視覚と画質評価, ITS等)
- 高次局所自己相関特徴と判別分析による顔画像の表情認識(映像メディアおよび一般 : インターネット, デジタル放送, マルチメディア, 三次元画像, 視覚と画質評価, ITS等)
- ユビコン環境利用化身話システム構築のための調査研究 : 「ネットワークを通して化身を媒体とした異文化コミュニケーションツール」の可能性を探る
- ユビコン環境利用化身話システム構築のための調査研究 : 「ネットワークを通して化身を媒体とした異文化コミュニケーションツール」の可能性を探る
- 高次局所自己相関特徴と判別分析による顔画像の表情認識
- 高次局所自己相関特徴と判別分析による顔画像の表情認識
- I-29 高次局所自己相関特徴と多重解像度画像を利用した顔の表情認識に関する一考察(顔検出・表情解析,I.画像認識・メディア理解)
- MPEG-4の仕様に準拠した顔パラメータの抽出に関する一考察
- MPEG-4の仕様に準拠した顔パラメータの抽出に関する一考察
- MPEG-4の仕様に準拠した顔パラメータの抽出に関する一考察
- D-12-83 MPEG-4の仕様に準拠した顔線画アニメーション生成
- D-12-26 顔画像中の特徴点追跡によるMPEG-4顔アニメーション生成
- MPEG4に準拠した顔アニメーション生成に関する一考察
- MPEG4に準拠した顔アニメーション生成に関する一考察
- MPEG4に準拠した顔アニメーション生成に関する一考察
- 母音音源信号のランダムフラクタル性を利用した合成音声の自然性改善
- 持続発声母音における振幅ゆらぎ及びピッチゆらぎの周波数特性とその音響心理的効果
- 合成持続発声母音の自然性改善を目的とした音源波形揺らぎの生成とその主観的及び客観的評価
- PARCOR分析合成システムにおける母音音源波形のウェーブレット圧縮に関する考察
- 合成持続発声母音の自然性改善を目的とした波形ゆらぎの生成とその主観的および客観的評価
- 1/fピッチゆらぎおよび1/f振幅ゆらぎの母音合成における有効性の検討
- 持続発声母音合成における1/fゆらぎ現象の応用
- 音原信号の振幅ゆらぎによるバズ音質の改善
- 合成音声における音原信号の振幅ゆらぎの役割
- 音源信号の振幅ゆらぎによる合成音の自然性
- フォトリフレクタ方式によるギター演奏動作のキャプチャリング(映像メディア及び一般)
- 数論変換による脆弱型電子透かしを用いた改ざん位置検出法(情報セキュリティ基礎)
- 数論変換の脆弱型電子透かしとロスレス電子透かしへの応用(映像メディアおよび一般 : インターネット, デジタル放送, マルチメディア, 三次元画像, 視覚と画質評価, ITS等)
- 数論変換の脆弱型電子透かしとロスレス電子透かしへの応用
- 数論変換の脆弱型電子透かしとロスレス電子透かしへの応用
- J-43 静止画像の改ざん位置検出と訂正を考慮した数論変換に基づく脆弱型電子透かし(電子透かし,J.グラフィクス・画像)
- 数論変換による脆弱型電子透かしを用いた静止画像の改ざん位置検出と改ざん訂正
- 数論変換による脆弱型電子透かしを用いた静止画像の改ざん位置検出と改ざん訂正
- 数論変換による脆弱型電子透かしを用いた静止画像の改ざん位置検出と改ざん訂正
- D-11-13 数論変換を用いた脆弱型電子透かしによる静止画像の改ざん位置検出
- D-11-35 フェルマー数変換を用いた静止画像の改ざん検出可能な文字コード埋め込み法
- 数論変換を用いた改ざん検出可能な電子透かし方式
- 数論変換を用いた改ざん検出可能な電子透かし方式
- 無線通信を利用した参加型エンターテインメントの可能性に関する一検討(ブロードバンドアクセス,ホームネットワーク,一般)
- XMLによる音声データベースの構築とクライアント/サーバー音声合成システムの開発
- G.711におけるロスレスステガノグラフィに関する一考察(信号処理,LSI,及び一般)
- B-11-1 電話音声の帯域拡張に関する一考察(B-11.コミュニケーションクオリティ,一般講演)
- 波形の形状分析に基づく音素セグメンテーションの一検討(聴覚・音声・言語とその障害, 一般)
- 波形の形状分析に基づく音素セグメンテーションの一検討
- D-15-11 無線LANとパソコン利用ディジタル信号処理授業の試み
- SB-7-5 VoIP におけるステガノグラフィを用いたパケット損失の一隠蔽法
- B-6-72 ハードウェアVoIP端末の開発(B-6.ネットワークシステム, 通信2)
- フーリエ解析と音声信号処理 (特集 フーリエ解析の力--分野を超えた多彩な応用)
- D-14-8 Lisp XMLインタフェースを用いた音声合成システムの構築
- A-6-15 情報ミスリーディングによるオーディオトリックアート(A-6.情報理論,一般セッション)
- LF-6 2side PWR法によるVoIPにおけるパケット損失の隠蔽(F. 音声・音楽)
- 波形置換に基づくVoIPにおけるパケット損失の一隠蔽法(マルチメディア通信とQoS, VoIP, ストリーミング, 一般)
- 波形置換に基づくVoIPにおけるパケット損失の一隠蔽法
- EMMが目指すマルチメディア情報処理の未来(キックオフ・イベント)
- カラーユニバーサルデザイン : 色覚異常者の見え方と今後の課題、そしてカラーユニバーサルデザインヘ(画像システム, ITS画像処理,映像メディア及び一般)
- カラーユニバーサルデザイン : 色覚異常者の見え方と今後の課題、そしてカラーユニバーサルデザインヘ(画像システム, ITS画像処理,映像メディア及び一般)
- SuperColliderによるサウンドプログラミング(一般)
- 講演会報告 参加型情報化社会でWisdom Of Crowdsは構築できるか (2007 PC CONFERENCE 壁を越えるICT教育--目が輝く新しい学びへ)
- P-17 電子情報系学生のためのマイコン実習((11)ものつくり教育,ポスター発表)
- リアルバーチャリティの要因に関する一考察(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- リアルバーチャリティを考慮したモノづくりの可能性
- リアルバーチヤリティを考慮したモノづくりの可能性(画像システム, ITS画像処理,映像メディア及び一般)
- リアルバーチャリティの可能性について(仮想都市, 複合現実感, および一般)
- 仮想世界と現実世界をつなぐ価値創造の可能性(映像/音声サービスの品質,メディア品質,ネットワークの品質・QoS制御,次世代/新世代ネットワークアーキテクチャ,災害時のネットワークとコミュニケーション,一般)
- カラーユニバーサルデザイン : 色覚異常者の見え方と今後の課題、そしてカラーユニバーサルデザインへ
- ソーシャルメディアによる価値創造の可能性(一般,複合現実感,仮想都市,及び一般)
- ロバスト型電子透かしの指紋画像への応用(映像メディアおよび一般 : インターネット, デジタル放送, マルチメディア, 三次元画像, 視覚と画質評価, ITS等)
- ロバスト型電子透かしの指紋画像への応用
- ロバスト型電子透かしの指紋画像への応用
- 情報ミスリーディングによるオーディオトリックアートの可能性 (マルチメディア情報ハイディング・エンリッチメント)