音声の構造的表象に基づく学習者分類の検証と発音矯正度推定の高精度化
スポンサーリンク
概要
- 論文の詳細を見る
外国語を習得する場合,母語干渉に起因する外国語訛りが頻繁に観測される.本研究では外国語発音の自動分析およびそれに基づく自動評定技術の構築を目指している.外国語発音を音響分析する場合,年齢・性別・体格に起因する音響バイアスを捨象したうえで分析することが望まれるが,本研究では音声の構造的表象を用いてこれを検討している.すでに先行研究で,構造的表象を用いた学習者分類および発音矯正度推定についての有効性が示されている.本研究では前者に対しては,音声学者による学習者分類との比較を通してその妥当性検証を,後者に対しては,より高精度に矯正度推定を行う手法を提案する.実験の結果,音声学者による分類とほぼ同等の分類結果を得ることができ,また,矯正度に関しても7.4ポイント精度向上を果たすことができた.
- 2011-12-15
著者
-
広瀬 啓吉
東京大学
-
西村 多寿子
東京大学大学院医学系研究科
-
西村 多寿子
東京大学大学院
-
朝川 智
東京大学大学院新領域創成科学研究科
-
広瀬 啓吉
東大
-
牧野 武彦
中央大学経済学部
-
牧野 武彦
成蹊大学文学部
-
鎌田 圭
東京大学大学院新領域創成科学研究科
-
峯松 信明
東京大学
-
鈴木 雅之
東京大学大学院工学系研究科
-
鈴木 雅之
東京大学
-
鎌田 圭
東京大学|現在,JR東日本旅客鉄道株式会社
-
朝川 智
東京大学|現在,ソニー株式会社
-
鎌田 圭
東京大学|現在 Jr東日本旅客鉄道株式会社
-
牧野 武彦
中央大学
-
鈴木 雅之
東京大学:(現)日本アイ・ビー・エム(株)東京基礎研究所
関連論文
- 3次元母音図の4次元可視化に向けた基礎研究(視聴覚技術,ヒューマンインタフェース)
- 設備監視のための異音検知方式の一検討
- 母語話者と中国語話者の日本語朗読音声の基本周波数パターンの比較
- パネル討論 : 音声言語関連大型プロジェクトの現状と将来
- 要素論から全体論へ : 全体から入る音声情報処理への招待(音響・音韻モデル)
- 孤立音[あ]を聞いて音韻/あ/と同定する能力は音声言語に必要か?(聴覚・音声/一般)
- 孤立音「あ」を聞いて音韻/あ/と同定する能力は音声言語に必要か?
- 音声の構造的表象に基づく音声認知と外国語発音学習に対する一考察(言語の学習・教育)
- 音声の構造的表象を通して考察する失読症・自閉症の音声認知(一般)
- 音声の相対音感 : 音声と音楽の同質性に関する一考察(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 構造不変の定理とそれに基づく音声ゲシュタルトの導出(一般, 一般, チュートリアルレクチャー)
- 構造不変の定理とそれに基づく音声ゲシュタルトの導出
- 構造不変の定理に基づく音声の構造的表象とその距離尺度
- 316 中高年齢女性における血流制限を伴う低負荷抵抗運動とサーキットトレーニングの効果(生活環境支援系理学療法,一般演題(ポスター発表演題),第43回日本理学療法学術大会)
- 骨粗鬆症予防の運動療法として血流制限を伴う低負荷抵抗運動(加圧トレーニング)を導入する場合の有効性と安全性の検討 (第13回(平成17年度)財団法人骨粗鬆症財団 研究助成に関する成果報告)
- 骨密度データを活用した健康教育 : 生活習慣と骨密度の関連性
- シャドーイング・音読発音評価を目的とした話者適応の分析と応用(感情音声,韻律,声質,音声生成・知覚,脳機能,一般)
- 通訳者支援システム「イズ」とその情報保障支援の可能性(聴覚と福祉情報工学・一般)
- 音声の構造的表象に基づく異言語間・異話者間の音声変換手法(言語獲得・学習,合成,生成,韻律,一般)
- 構造評価関数を用いた構造的表象からの音声合成系の高精度化(言語獲得・学習,合成,生成,韻律,一般)
- 構造表象を用いた音声認識におけるパラメータ共有とその効果(認識,理解,対話,一般)
- 構造的表象からの音声合成とそれに基づく音声模倣に関する検討(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
- 基本周波数パターン生成過程モデルに基づくコーパスベース韻律生成における柔軟な焦点制御(言語獲得・学習,合成,生成,韻律,一般)
- 男性から女性への性別の移行を希望する性同一性障害者(MtF)の発話音声の分類に関する試案(聴覚・音声・言語とその障害,一般)
- 中国語方言の構造分析とその発音評価に向けた実験的検討(発音評価,認識,理解,対話,一般)
- 手の動きを入力としたリアルタイム音声生成系における鼻音の合成とピッチ制御に関する検討(福祉と音声処理,一般)
- 経験的モード分解による主構造抽出を介した雑音環境下における音声信号の基本周波数推定
- 外国語学習を対象としたシャドーイング音声の自動評定法に関する検討(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
- マルチモーダルコミュニケーションのための音声合成プラットホーム
- マルチモーダルコミュニケーションのための音声合成プラットホーム
- 構造的特徴量に対する多段階の重回帰分析による発音評価(認識,理解,対話,一般)
- 生成過程モデルを用いたHMMに基づく基本周波数パターン生成(音声・言語・音響教育,一般)
- 音声に含まれる言語的情報を非言語的情報から音響的に分離して抽出する手法の提案 : 人間らしい音声情報処理の実現に向けた一検討(ヒューマンコミュニケーション〜人間中心の情報環境構築のための要素技術〜論文)
- 話者不変な相対関係特徴を音響単位とする音響モデリングに関する実験的検討(音響モデル,第11回音声言語シンポジウム)
- 話者不変な相対関係特徴を音響単位とする音響モデリングに関する実験的検討(音響モデル,第11回音声言語シンポジウム)
- 音声の相対音感 : 音声と音楽の同質性に関する一考察(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 音声の相対音感 : 音声と音楽の同質性に関する一考察(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 男性から女性へ性別の移行を希望する性同一性障害者(MtF)の音声訓練 : 症例報告
- 女性と判定された性同一性障害者(MtF)の声の基本周波数(聴覚,音声,言語とその障害)
- 非言語的な要因に不変な音響的特徴を用いた中国語方言に基づく話者分類(ポスターセッション,第10回音声言語シンポジウム)
- 音声の構造的表象を用いた自動発音評定法の改善
- 用法の違いを考慮した類似単語の置換による学習データ生成とそれを用いた主題の違いに頑健な言語モデルの構築
- 用法の違いを考慮した類似単語の置換による学習データ生成とそれを用いた主題の違いに頑健な言語モデルの構築
- カスタマイズ性を考慮した擬人化音声対話ソフトウェアツールキットの設計(音声言語情報処理とその応用)
- 1U-9 音声の構造的表象と多段階の重回帰を用いた外国語発音分析(音声分析・強調,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 音声対話に基づく知的情報検索システム
- 生成過程モデルに基づく広東語音声の基本周波数パターンの合成
- 1990年音響・音声・信号処理国際会議(ICASSP 90)報告
- 対話音声の韻律的特徴に影響を与える要因の定量的分析
- 声調核モデルとニューラルネットワークを用いた標準中国語連続音声の声調認識(第8回音声言語シンポジウム)
- 声調核モデルとニューラルネットワークを用いた標準中国語連続音声の声調認識(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 声調核モデルとニューラルネットワークを用いた標準中国語連続音声の声調認識(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 声調核モデルとニューラルネットワークを用いた標準中国語連続音声の声調認識
- 用法の違いを考慮した類似単語の置換による学習データ生成とそれを用いた主題の違いに頑健な言語モデルの構築
- Evaluations of an open source WFST-based phoneticizer (音声)
- An analysis on the perception of pitch level changes for Japanese words (音声)
- IEEE音響・音声・信号処理国際会議(ICASSP'99)報告
- 経験的モード分解による主構造抽出を介した雑音環境下における音声信号の基本周波数推定
- 経験的モード分解による主構造抽出を介した雑音環境下における音声信号の基本周波数推定
- 日本語単語音声におけるピッチレベル変化の知覚に関する定量的検討
- WFST-駆動G2Pシステムの構築と評価
- 音声の構造的表象と多段階の重回帰を用いた外国語発音評価
- Eigen-SPLICEを用いた雑音環境下における音声認識
- 音声に含まれる言語的情報を非言語的情報から音響的に分離して抽出する手法の提案 : 人間らしい音声情報処理の実現に向けた一検討
- WFST-駆動G2Pシステムの構築と評価(音声一般,聴覚・音声・言語とその障害/一般)
- 日本語単語音声におけるピッチレベル変化の知覚に関する定量的検討(聴覚一般,聴覚・音声・言語とその障害/一般)
- 母語干渉が外国語発声の韻律的自然性に与える影響に関する知覚的検討(オーガナイズドセッション2,聴覚・音声・言語とその障害/一般)
- 手から声のメディア変換モデルと手のジェスチャーモデルの確率的統合に基づく異メディア空間の対応付けの検討(音声一般・障害者支援,聴覚・音声・言語とその障害/一般)
- VCV/VV単位によるフュージョン手法を用いた波形接続型日本語音声合成
- 音声の構造的表象に基づく学習者分類の検証と発音矯正度推定の高精度化
- B1.日本人学習者のフランス語母音生成特徴の考察 : 音声の構造表象による発音評価の応用(研究発表,音声学会2009年度(第23回)全国大会発表要旨)
- C2. 孤立音を聞いて音韻同定できる能力は音声言語運用に必要か?(研究発表,日本音声学会2007年度(第21回)全国大会発表要旨)
- A6. 句境界のフィラーが聞き手の予測に及ぼす影響(研究発表,第19回全国大会発表要旨)
- B2. 節境界の種類とフィラーの出現頻度(研究発表,第18回全国大会発表要旨)
- 音声の相対音感 : 音楽と音声の同質性に関する理論的かつ実験的考察(第312回研究例会発表要旨)
- 空間写像に基づく母音と鼻子音を対象としたジェスチャ-音声変換システム
- 話者空間のテンソル表現に基づく任意話者声質変換(オーガナイズドセッション:Advances in speech decomposition,合成,生成,韻律,音声一般)
- 日本語単語における2モーラ単位でのピッチレベル低下の確率的定式化(一般セッション,合成,生成,韻律,音声一般)
- 雑音抑圧とSPLICEを組み合わせた雑音環境下音声認識(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
- 雑音抑圧とSPLICEを組み合わせた雑音環境下音声認識(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
- 雑音抑圧とSPLICEを組み合わせた雑音環境下音声認識(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
- SPLICEに基づく音声・口唇画像情報を用いた雑音環境下音声認識(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
- SPLICEに基づく音声・口唇画像情報を用いた雑音環境下音声認識(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
- SPLICEに基づく音声・口唇画像情報を用いた雑音環境下音声認識(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
- 外国語学習を対象としたシャドーイング音声の自動評定法に関する検討
- 条件付き確率場を用いた日本語東京方言のアクセント結合自動推定(音声,聴覚,学生論文)
- 構造的特徴を用いたSVMによる中国語自動発音誤り検出(システム,認識,理解,対話,一般)
- 日本語アクセント・イントネーションの教育・学習を支援するオンラインインフラストラクチャの構築とその評価(音声,聴覚,システム開発論文)
- 波形包絡を用いた音節核の自動抽出とそれを用いた構造的表象による単語獲得プロセスのモデル化の初期検討(ポスターセッション)
- スーパーベクトルとSVRに基づくMtF話者のための女声度推定(学生ポスターセッション,音声アプリケーション,一般)
- 日本語韻律教育の支援を目的としたオンラインアクセント辞書と読み上げチューターの開発(一般セッション,音声アプリケーション,一般)
- 日本語HMM音声合成のコンテキストラベルの改良(一般セッション,音声・言語・対話,一般)
- SPLICEに基づく音声・口唇画像情報を用いた雑音環境下音声認識
- 雑音抑圧とSPLICEを組み合わせた雑音環境下音声認識
- 雑音抑圧とSPLICEを組み合わせた雑音環境下音声認識
- 条件付き確率場を用いた日本語東京方言のアクセント結合自動推定
- SPLICEに基づく音声・口唇画像情報を用いた雑音環境下音声認識
- SPLICEに基づく音声・口唇画像情報を用いた雑音環境下音声認識
- 世界諸英語分類のための構造的表象を用いた発音距離予測(一般,時系列パターン認識,一般)
- 雑音抑圧とSPLICEを組み合わせた雑音環境下音声認識