発声スタイル並行コーパスを用いた発音変形の分析
スポンサーリンク
概要
- 論文の詳細を見る
自由発話の認識率の改善を目的として、自由発話の朗読発話からの変形を調査すべく、自由か朗読かという発話スタイルだけが異なるコーパスを作成した。これらの両音声を、単語及び音素認識率で比較した結果、日本語においても、自由発話の認識は朗読発話の認識に比べて困難であることが確認された。さらに、発声スタイルが変わることで生じるエラーの分布は言語カテゴリごとに偏りがあることが分かった。また、音素認識結果と音素転記との比較から、誤りに言語カテゴリ毎の傾向があることが分かった。
- 社団法人電子情報通信学会の論文
- 2001-06-21
著者
-
匂坂 芳典
早稲田大学国際情報通信研究科
-
匂坂 芳典
早稲田大学
-
平野 泉
早稲田大学 理工学部
-
中嶋 秀治
ATR音声言語コミュニケーション研究所
-
平野 泉
早大・理工
-
平野 泉
早稲田大学大学院理工学研究科
-
中嶋 秀治
早稲田大学国際情報通信研究科
-
中嶋 秀治
Atr音声言語通信研究所
-
匂坂 芳典
ATR 音声言語通信研究所
-
匂坂 芳典
早稲田大学大学院国際情報通信学研究科
関連論文
- 日本人学習者による英語のリズム制御におけるモーラの影響(感情音声,韻律,声質,音声生成・知覚,脳機能,一般)
- ことばとコミュニケーション(音叉)
- 音声対話システム汎用プラットホームにおける行動管理部の構築
- 音声対話システム汎用プラットフォームの検討
- 統計的翻訳評価尺度に基づく日英翻訳文の訳質分析(機械翻訳)
- 未知固有表現を含む音声の認識([特別セッション]音声言語獲得・学習技術(2), 未知語処理)
- 複数のマルコフモデルを用いた階層化言語モデルによる未登録語認識(音声、聴覚)
- 機械翻訳によって生成された追加テキストを使った統計的言語モデルの適応
- 話題と文型の違いを同時に考慮した言語モデル適応
- 構造化言語モデルとその実装
- 対話者の前発話を利用した統計的言語モデル
- 音声認識過程での発話分割のための統計的言語モデル(21世紀のグループウェア)
- クラスに依存した語彙の確率的記述に基づく階層型言語モデル
- 2つの単語クラスから生じた未登録語のサブワードモデルによる音声認識
- 自動音韻セグメンタの時間精度評価 : ラベル尤度との相関と誤差の音韻文脈依存性
- サブワードネットワークに基づく未登録語処理を搭載したデコーダの構築
- 大語彙連続音声認識における未知語のsub-wordモデリング手法
- 日本人英語学習者音声の時間制御特性客観評価(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
- スポーツオノマトペの実態について
- スポーツ指導者・体育学習者のためのオノマトペ辞典の開発
- 大語彙連続音声認識における未知語のsub-wordモデリング手法
- 音声翻訳システム : ATR-MATRIXの開発と評価(音声言語情報処理とその応用)
- ATR-MATRIXと人間との音声翻訳能力比較法の誤差に関する検討
- 中国語単語音声からの基本周波数制御コマンドの自動抽出
- 発声スタイル並行コーパスを用いた発音変形の分析
- D-14-11 日本人学習者に見られる中国語声調制御難易度の分析(D-14. 音声,一般セッション)
- 対話音声合成を目指した対話音声の韻律分析
- 発話スタイル並列コーパスを用いた発音変形の分析
- 講演音声の音響的特徴分析と音響モデル構築方法の検討
- 対話音声を対象とした連続音声認識システムの試作と評価
- 発話分割付実時間音声認識
- 旅行会話タスクにおけるTARSPRECの性能評価
- 発話情報を用いたF0制御パラメータの自動推定
- 基本周波数パタンに見られる発話態度の分析(対話)
- 基本周波数パタンに見られる発話態度の分析(対話)
- 文中の音韻長伸縮の自然性許容に対する発話速度の効果(聴覚・音声・言語とその障害)
- コーパスベース音声合成技術の動向[I] : コーパスベース音声合成の過去・現在・将来(自然な音声合成システム構築のための枠組み)
- 文音声における音韻長の制御特性と知覚特性との対応関係
- 英語発話リズム客観評価に向けた音響特徴の分析
- 日本人発話英語のリズム客観評価モデル
- 大規模日本語音声データベースの構築と評価
- 文中の音韻長伸縮の自然性許容に対する文節内位置の効果
- 認知計算モデルとしての音声技術
- クラスタされた音響モデルによる中国語音声認識
- 中国語音声認識における音素環境のモデリング
- 文音声における音韻長伸縮の許容度に対する文節内位置の効果
- 語彙が与える印象に基づく対話韻律生成
- 音響的セグメント単位を用いた自由発話音声認識
- 位置依存単語クラスタと頻出単語列を用いた多重クラス複合3-gram言語モデル
- ドメインの多次元性を考慮した言語モデル適応
- 句構造間の関係を反映した言語モデル
- 品詞接続特性と単語接続特性の最大事後確率推定による融合に基づく単語クラス分類
- 多重クラスTrigram構築のための効率的な自動クラスタリング手法
- 多重クラスTrigram構築のための効率的な自動クラスタリング手法
- 多重クラスTrigram構築のための効率的な自動クラスタリング手法
- 語彙が与える印象に基づく対話韻律生成
- 接続の方向性を考慮した多重クラス複合N-gram言語モデル(音声情報処理 : 現状と将来技術論文特集)
- B6. 柔道で使用するスポーツオノマトペエフェクト : 「グッ」,「サッ」における音調と聴覚特性の分析(研究発表,日本音声学会創立80周年記念式典・第20回全国大会発表要旨)
- A9. 英語学習者による音読における主観的評価と客観的測定値の関係(研究発表,日本音声学会2007年度(第21回)全国大会発表要旨)
- A2.韓国人日本語学習者による日本語の促音の聴取訓練の効果(研究発表,音声学会2009年度(第23回)全国大会発表要旨)
- 日本語特殊拍の知覚学習システムを利用した聴取訓練の効果(第319回研究例会発表要旨)
- 数理モデルからの提言(記念フォーラム 音声研究の輝かしい展開を求めて-研究分野・研究方法からの提言-,日本音声学会創立80周年記念式典・第20回全国大会発表要旨)
- C8. 運動指導者・実践者のためのオノマトペ発話音声の印象評価(研究発表,第18回全国大会発表要旨)
- 人間科学としての音声言語研究(音声研究の課題)
- 英語学習者音声のリズムの評価に用いるテキストの必要条件
- 対話音声合成を目指した対話音声の韻律分析
- 促音挿入判断に着目した韓国語母語話者による日本語促音の知覚特性 : 韓国語の濃音化との関連性を中心に(聴覚一般,聴覚・音声・言語とその障害/一般)
- 日本人英語学習者音声の時間制御特性客観評価
- B1-4. タイミング制御特性に着目した非母語話者の日本語音声の評価 : 日本語の長短音素を中心に(研究発表,日本音声学会2012年度(第26回)全国大会発表要旨)