F0パターンの自動推定と目標点の抽出(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
The fundamental frequency (F0) contours of voices manifest the acoustic correlation. of lexical tones in tonal languages (or pitch accents in non-tonal languages), expressive intonation, and such speaker factors as individual vocal ranges. Tonal target points, focusing particularly on tonal F0 peaks and valleys, are used to sparsely specify the prosodic contributions of lexical tones (or pitch accents) and expressive intonation to the F0 contours. This paper presents an approach to automatic extraction of the underlying tonal target points with optimal approximations of the observed F0 contours using a functional F0 contour model. This consists of (1) finding potential target candidates from the observed F0 contours, (2) suppressing the micro-prosodic effects involved in the F0 contours, and (3) selecting appropriate target points from these candidates. This approach is currently evaluated by investigating the errors between the observed and reproduced F0 contours in the spirit of analysis-by-synthesis, conducted on thousands of Chinese speech samples and a few of Japanese and English speech samples. It shows a straightforward way to studying dynamic intonation variations, thanks to its ability to parametric representation of the F0 contours in term of the same way as specifying the prosodic contribution of tone and intonation to the F0 contours.
- 社団法人電子情報通信学会の論文
- 2006-12-14
著者
-
中村 哲
独立行政法人情報通信研究機構:(株)atr音声言語コミュニケーション研究所
-
中村 哲
情報通信研究機構知識創成コミュニケーション研究センター:atr音声言語コミュニケーション研究所
-
中村 哲
独立行政法人情報通信研究機構知識創成コミュニケーション研究センター音声言語グループ:atr音声言語コミュニケーション研究所
-
倪 晋富
独立行政法人情報通信研究機構知識創成コミュニケーション研究センター音声言語グループ
-
倪 晋富
独立行政法人情報通信研究機構知識創成コミュニケーション研究センター音声言語グループ:atr音声言語コミュニケーション研究所
-
中村 哲
独立行政法人 情報通信研究機構 知識創成コミュニケーションセンター:国際電気通信基礎技術研究所(atr)音声言語コミュニケーション研究所
-
中村 哲
独立行政法人 情報通信研究機構
関連論文
- 23aBC-14 0.67〜0.92GeV光子ビームを用いた重水素からの2π光生成反応の研究(23aBC 実験核物理領域,理論核物理領域合同 ハドロン構造・相互作用・中間子生成(合同),実験核物理領域)
- 23aBC-13 γp→pπ^+π^-反応を用いたNKS2システムの性能評価(23aBC 実験核物理領域,理論核物理領域合同 ハドロン構造・相互作用・中間子生成(合同),実験核物理領域)
- 22pBS-5 中性K中間子スペクトロメータ中心部検出器の性能評価(22pBS 検出器III,実験核物理領域)
- 20aBD-3 JLab Hall C第3世代(e,e'K^+)ラムダハイパー核分光実験のためのK中間子スペクトロメータの性能評価(20aBD 理論核物理領域,実験核物理領域合同 ハイパー核・ストレンジネスI(合同),理論核物理領域)
- Water, Livelihood and Health in Attapeu Province in Lao PDR
- 京都観光案内対話コーパスにおける対話行為タグの設計と分析(理解)
- 同調的対話システム構築のための音声対話コーパスの構築(「ユニバーサルコミュニケーションを実現するための言語処理技術」シンポジウム)
- 30aSG-3 閾値領域でのn(γ,K^0)Λ反応測定によるK^0生成素過程の研究(30aSG 中高エネルギー重イオン・中間子生成・検出器II,実験核物理領域)
- NICT知識創成コミュニケーション研究センターの研究と高度言語情報融合フォーラム(ALAGIN)の活動について(Web情報処理,Webとデータベースに関する技術報告)
- 28pSG-6 電子線を用いたハイパー核分光実験(JLab EO5-115)用水チェレンコフ検出器の開発(28pSG ハイパー核・検出器I,実験核物理領域)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(3)(SIG-SLP内組織の活動報告)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(2)(雑音・VAD,第9回音声言語シンポジウム)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境 (2)(雑音・VAD,第9回音声言語シンポジウム)
- 音声翻訳システムの研究開発
- 22pBS-6 (e,e'K^+)ラムダハイパー核分光実験のためのPMT磁場キャンセル装置(22pBS 検出器III,実験核物理領域)
- 20aBD-4 (e,e'K^+)反応を用いたJLab-HallC第三世代ラムダハイパー核分光実験(20aBD 理論核物理領域,実験核物理領域合同 ハイパー核・ストレンジネスI(合同),理論核物理領域)
- 20aBD-2 (e,e'K^+)反応を用いたハイパー原子核分光実験への散乱電子側高分解能スペクトロメータHESの導入と成果(20aBD 理論核物理領域,実験核物理領域合同 ハイパー核・ストレンジネスI(合同),理論核物理領域)
- 30aSG-5 NKS2実験におけるTULを用いたトリガー及びDAQシステムの開発(30aSG 中高エネルギー重イオン・中間子生成・検出器II,実験核物理領域)
- 30aSG-4 NKS2実験用ニューヴァーテックスチェンバーシステムの開発(30aSG 中高エネルギー重イオン・中間子生成・検出器II,実験核物理領域)
- 27aSJ-5 第三世代(e,e'K^+)原子核分光実験JLab E05-115の準備状況(27aSJ 実験核物理領域,理論核物理領域合同 ハイパー核・ストレンジネス(合同)I,実験核物理領域)
- 音声認識における頑健性 : 音響分析・音響モデル,なにが課題か(企画)
- NICTにおける音声・言語研究拠点MASTARプロジェクトについて(「ユニバーサルコミュニケーションを実現するための言語処理技術」シンポジウム)
- 音声翻訳単位の推定における句読点情報の効果(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 多チャンネル三次元音場再現システムの再生方式の違いによる再現性能評価
- マルチモーダル音声言語処理とその応用(マルチモーダル)
- 音声翻訳研究20年の夜明け : 受賞業績 携帯電話によるネットワーク型コーパスベース音声翻訳システムの構築(平成19年度喜安記念業績賞紹介)
- 同時通訳者の知識と韻律情報を用いた講演文章のチャンキング(チャンキング・要約)
- 2D-5 多言語音声翻訳基盤の通信インタフェースの検討と構築(音声対話・翻訳,一般セッション,人工知能と認知科学)
- ストーリへの没入感を実現するダイブイントゥザムービープロジェクト(テーマ関連/オーガナイズドセッション)
- ストーリへの没入感を実現するダイブイゥザムービープロジェクト(オーガナイズドセッション,CV/PR技術のVRへの応用)
- 5.効率的アニメ制作支援のための3次元CG技術(情報技術が支えるアートとコンテンツの世界)
- NICTにおけるユニバーサルコミュニケーションのための音声言語研究(研究動向を探るセッション)
- HMM/BN音響モデルの設計と実装(国際ワークショップ"Beyond HMM")
- 統計的対話モデルを用いたWFSTに基づく音声対話システム
- 同調的対話を実現するプロトタイプシステムの開発(対話・インタフェース・インタラクション)
- 音声翻訳単位の推定における句読点情報の効果(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 音声翻訳単位の推定における句読点情報の効果(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 来場者の声の特徴を反映する映像エンタテインメントシステムのための台詞音声生成システム
- iFACe:デジタルアニメ声優体験システム
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(2)(雑音・VAD,第9回音声言語シンポジウム)
- 個人の音声を反映する映像エンタテインメントシステム
- Oriental COCOSDA : 音声データベースおよび音声入出力システム評価国際協調委員会東アジア部会について(一般セッション「音声言語処理」)
- Oriental COCOSDA : 音声データベースおよび音声入出力システム評価国際協調委員会東アジア部会について(一般セッション「音声言語処理」)
- QAシステムのための音声入力インターフェース
- 音声認識の信頼度・複数候補を利用したWFST対話システムの評価
- 雑音下マルチモーダル音声認識評価基盤CENSREC-1-AVの構築
- 相談型対話のモデル化と対話戦略の最適化
- 音声認職の信頼度・複数候補を利用したWFST対話システムの評価
- 12pSK-5 (e,e'K^+)反応を用いた第三世代ラムダハイパー核分光実験における高計数率下での検出器の効率について(12pSK 検出器III,実験核物理領域)
- 11pSF-2 (e,e'K^+)反応を用いたJLab-HallC第三世代ラムダハイパー核分光実験の解析状況(11pSF 実験核物理領域,理論核物理領域合同 ストレンジネス・中間子生成・ハドロン構造(合同),実験核物理領域)
- HMM/BN音響モデルの設計と実装
- HMM/BN音響モデルの設計と実装(国際ワークショップ"Beyond HMM")
- HMM/BN音響モデルの設計と実装(国際ワークショップ"Beyond HMM")
- ハイブリッドHMM/BNモデルに基づいた調音特徴とスペクトル特徴の統合
- ハイブリッドHMM/BNモデルに基いた大語彙音声認識システム
- ハイブリッドHMM/BNモデルに基いた大語彙音声認識システム
- ベイジアンネットとジャンクションツリー分解を用いて知識を組み込んだ統計的音響モデル(第8回音声言語シンポジウム)
- ベイジアンネットとジャンクションツリー分解を用いて知識を組み込んだ統計的音響モデル(Session-5 特徴量・音響モデル,第8回音声言語シンポジウム)
- ベイジアンネットとジャンクションツリー分解を用いて知識を組み込んだ統計的音響モデル(Session-5 特徴量・音響モデル,第8回音声言語シンポジウム)
- インドネシア語の音声コーパス作成および音声認識システムの開発
- インドネシア語の音声コーパス作成および音声認識システムの開発
- インドネシア語の音声コーパス作成および音声認識システムの開発
- インドネシア語の音声コーパス作成および音声認識システムの開発(ポスターセッション)(第6回音声言語シンポジウム)
- インドネシア語の音声コーパス作成および音声認識システムの開発(ポスターセッション)(第6回音声言語シンポジウム)
- インドネシア語の音声コーパス作成および音声認識システムの開発(ポスターセッション)(第6回音声言語シンポジウム)
- マルチモーダル音声認識のための顔検出
- マルチモーダル音声認識のための顔検出
- 調音運動ダイナミクスの音声認識への応用(聴覚・音声/一般)
- F0パターンの自動推定と目標点の抽出(第8回音声言語シンポジウム)
- F0パターンの自動推定と目標点の抽出(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- F0パターンの自動推定と目標点の抽出(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 新映像技術「ダイブイントゥザムービー」
- 音場の局所化技術を応用した指向性スピーカシステムの試作と評価
- 音声翻訳技術の動向
- 新映像技術「ダイブイントゥザムービー」
- 音声認識の動向[II] : 音声認識性能の客観的評価に向けて
- Web時代の音声・言語技術
- 意志決定を支援する音声対話システムの構築と評価
- 雑音DBを用いたモデル適応化HMMのSN比別マルチパスモデルによる雑音下音声認識
- 言葉の壁を越える音声翻訳技術
- 26aGM-5 陽子標的を用いたNKS2の運動量分解能の評価(26aGM 実験核物理領域,理論核物理領域合同 ハドロン構造・中間子生成(合同),実験核物理領域)
- 26aGM-4 NKS2による重陽子からの2π光生成反応の研究(26aGM 実験核物理領域,理論核物理領域合同 ハドロン構造・中間子生成(合同),実験核物理領域)
- 26aGM-3 閾値領域での重水素標的におけるK中間子生成機構の研究(26aGM 実験核物理領域,理論核物理領域合同 ハドロン構造・中間子生成(合同),実験核物理領域)
- 25pGK-5 中性K中間子スペクトロメータ(NKS2 upgrade)の性能評価と解析の現状(25pGK 検出器II,実験核物質領域)
- 26aGH-8 (e,e'K^+)反応を用いたJLab-HallC第三世代ラムダハイパー核分光実験の解析手法と現状報告(26aGH 実験核物理領域,理論核物理領域合同 ハイパー核・ストレンジネスI(合同),実験核物質領域)
- 25pGK-6 (e,e' K^+)反応を用いたJLab E05-115中重ラムダハイパー核分光実験の高多重度に対応するトラッキングコードの開発(25pGK 検出器II,実験核物質領域)
- 26aGH-10 マインツMAMI-Cにおける(e,e'K^+)反応によるハイパー核分光実験(26aGH 実験核物理領域,理論核物理領域合同 ハイパー核・ストレンジネスI(合同),実験核物質領域)
- 26aGH-9 電子線を用いたハイパー核崩壊パイ中間子分光実験手法の研究(26aGH 実験核物理領域,理論核物理領域合同 ハイパー核・ストレンジネスI(合同),実験核物質領域)
- Web時代の音声・言語技術
- 非可聴つぶやき認識のためのステレオ信号を用いたブラインド雑音抑圧法
- 新映像技術「ダイブイントゥザムービー」
- 18aSG-4 電子線を用いたハイパー核崩壊パイ中間子分光実験(18aSG 実験核物理領域,理論核物理領域合同,ハイパー核・ストレンジネス(合同)I,実験核物理領域)
- 18aSG-2 (e,e'K^+)反応を用いたJLab-HallC第三世代ラムダハイパー核分光実験の解析と現状報告(18aSG 実験核物理領域,理論核物理領域合同,ハイパー核・ストレンジネス(合同)I,実験核物理領域)
- 17pSK-10 電子線を用いた中重ラムダハイパー核分光実験の為の高多重度用飛跡再現コードの開発(17pSK 測定器(III),実験核物理領域)
- 16pSG-1 NKS2を用いた重水素標的における二重パイオン光生成反応の研究(16pSG 実験核物理領域,理論核物理領域合同,中間子生成・ハドロン構造(合同),実験核物理領域)
- 18aSG-3 MAMI-Cにおける電子ビームを用いたハイパー核分光実験(18aSG 実験核物理領域,理論核物理領域合同,ハイパー核・ストレンジネス(合同)I,実験核物理領域)
- 音声翻訳システム実利用データを用いたシステム改善手法(音声翻訳,統計的機械学習,異文化コラボレーション論文)
- ユーザの相づち・うなずきを喚起する音声対話システム(対話生成,人とエージェントのインタラクション論文)
- 分散共有フルコンテキストモデルによるHMM音声合成に関する検討
- 音声翻訳システム実利用データを用いたシステム改善手法