音声情報処理技術を用いた外国語学習支援(音声,聴覚)
スポンサーリンク
概要
- 論文の詳細を見る
音声認識・合成に関する技術はこの十年ほどの間に大きな進歩を遂げており,言語学習支援(CALL)システムに関しても,発音の自動評定や模擬会話訓練などの新たな可能性を広げている.音声分析・認識・合成技術を利用したCALLには,音韻的な観点と韻律的な観点がある.非母語話者の音声を正確に区分化・認識しながら,そこに含まれる誤りを検出するためのモデル化には多くの課題がある.本論文では,これらの課題と現在の方法論に関して概観を行う.まず,発音学習支援における音韻的な発音評定と誤り検出に関して,音声認識技術に基づく方法について述べる.統計的なアプローチの定式化を行い,非母語話者の音響・発音レベルのモデル化について述べる.次に,継続長や強勢・トーンなどの韻律的なモデル化と評価について述べる.更に,テキスト音声合成,分析合成,モーフィングなどの音声合成技術の利用についても述べる.最後に,実用化されている幾つかの外国語CALLシステム,及び非母語話者の音声データベースについて紹介する.
- 2013-07-01
著者
-
河原 達也
京都大学
-
河原 達也
Academic Center for Computing and Media Studies, Kyoto University, Japan.
-
峯松 信明
東京大学
-
河原 達也
京都大学大学院情報学研究科
関連論文
- ロボットのための音声認識
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 構造不変の定理とそれに基づく音声ゲシュタルトの導出(一般, 一般, チュートリアルレクチャー)
- 構造不変の定理とそれに基づく音声ゲシュタルトの導出
- シャドーイング・音読発音評価を目的とした話者適応の分析と応用(感情音声,韻律,声質,音声生成・知覚,脳機能,一般)
- 音声の構造的表象に基づく異言語間・異話者間の音声変換手法(言語獲得・学習,合成,生成,韻律,一般)
- 構造評価関数を用いた構造的表象からの音声合成系の高精度化(言語獲得・学習,合成,生成,韻律,一般)
- 11.人にやさしい音声インタフェース(第2部:情報の高信頼蓄積・検索技術等の開発,学と産の連携による基盤ソフトウェアの先進的開発)
- 基本周波数パターン生成過程モデルに基づくコーパスベース韻律生成における柔軟な焦点制御(言語獲得・学習,合成,生成,韻律,一般)
- 音声対話技術コンソーシアム(ISTC)の活動成果報告(SIG-SLP内組織の活動報告)
- 男性から女性への性別の移行を希望する性同一性障害者(MtF)の発話音声の分類に関する試案(聴覚・音声・言語とその障害,一般)
- 中国語方言の構造分析とその発音評価に向けた実験的検討(発音評価,認識,理解,対話,一般)
- 手の動きを入力としたリアルタイム音声生成系における鼻音の合成とピッチ制御に関する検討(福祉と音声処理,一般)
- 言語的情報と非言語的情報の音響的分離と音声コミュニケーション (音声)
- 音声ドキュメント検索評価のためのテストコレクションの試作(第8回音声言語シンポジウム)
- 音声ドキュメント検索評価のためのテストコレクションの試作(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 外国語学習を対象としたシャドーイング音声の自動評定法に関する検討(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
- マルチモーダルコミュニケーションのための音声合成プラットホーム
- マルチモーダルコミュニケーションのための音声合成プラットホーム
- 構造的特徴量に対する多段階の重回帰分析による発音評価(認識,理解,対話,一般)
- スロットベースのベクトル空間モデルの組合せによる音声書籍検索
- 生成過程モデルを用いたHMMに基づく基本周波数パターン生成(音声・言語・音響教育,一般)
- 「ユビキタスアプリケーションを支えるツールキット」(全4回) : 第3回 Julius を用いた音声認識インタフェースの作成
- Spoken Term Detection のためのテストコレクション構築とベースライン評価
- NTCIR-9 SpokenDoc: 音声検索語検出と音声ドキュメント検索の評価枠組の設計
- 音声中の検索語検出のためのテストコレクション構築 : 中間報告
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 音声に含まれる言語的情報を非言語的情報から音響的に分離して抽出する手法の提案 : 人間らしい音声情報処理の実現に向けた一検討(ヒューマンコミュニケーション〜人間中心の情報環境構築のための要素技術〜論文)
- 話者不変な相対関係特徴を音響単位とする音響モデリングに関する実験的検討(音響モデル,第11回音声言語シンポジウム)
- 話者不変な相対関係特徴を音響単位とする音響モデリングに関する実験的検討(音響モデル,第11回音声言語シンポジウム)
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- 男性から女性へ性別の移行を希望する性同一性障害者(MtF)の音声訓練 : 症例報告
- 非言語的な要因に不変な音響的特徴を用いた中国語方言に基づく話者分類(ポスターセッション,第10回音声言語シンポジウム)
- 音声の構造的表象を用いた自動発音評定法の改善
- 音色の変復調を通して考える音声コミュニケーション(発達と知識獲得)
- 用法の違いを考慮した類似単語の置換による学習データ生成とそれを用いた主題の違いに頑健な言語モデルの構築
- 用法の違いを考慮した類似単語の置換による学習データ生成とそれを用いた主題の違いに頑健な言語モデルの構築
- Spoken Term Detection のためのテストコレクション構築とベースライン評価
- SIG-SLP/SIG-NL合同セッションここまでできるぞ音声/言語処理技術 : 音声編
- ここまでできるぞ音声/言語処理技術 : 音声編
- 2群対判別法における対の組合せの選択手順
- カスタマイズ性を考慮した擬人化音声対話ソフトウェアツールキットの設計(音声言語情報処理とその応用)
- 音声ドキュメント検索評価のためのテストコレクションの試作(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 1U-9 音声の構造的表象と多段階の重回帰を用いた外国語発音分析(音声分析・強調,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 日本語ディクテーション基本ソフトウェア(99年度版)
- 日本語ディクテーション基本ソフトウェア : 98年度版
- 日本語ディクテーション基本ソフトウェア(97年度版)
- 統計的系列-フレーム写像に基づく音声変換(一般セッション,クロスモーダル)
- 統計的系列-フレーム写像に基づく音声変換(一般セッション,クロスモーダル)
- 統計的系列-フレーム写像に基づく音声変換(一般セッション,クロスモーダル)
- 統計的系列-フレーム写像に基づく音声変換(一般セッション,クロスモーダル)
- デ-24 発音クリニック : 音声の構造的表象を用いた外国語・方言発音分析(デモセッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 音声対話に基づく知的情報検索システム
- 音声中の検索語検出のためのテストコレクション構築 -中間報告-
- 言語的情報と非言語的情報の音響的分離と音声コミュニケーション(オーガナイズドセッション:「Advances in soeech decomposition」,合成,生成,韻律,音声一般)
- 大語彙日本語連続音声認識研究基盤の整備 : 学習・評価テキストコーパスの作成
- 英語CALL構築を目的とした日本人及び米国人による読み上げ英語音声データベースの構築(第二言語学習とその支援に関する教育工学研究)
- 声調核モデルとニューラルネットワークを用いた標準中国語連続音声の声調認識(第8回音声言語シンポジウム)
- 声調核モデルとニューラルネットワークを用いた標準中国語連続音声の声調認識(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 声調核モデルとニューラルネットワークを用いた標準中国語連続音声の声調認識(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 声調核モデルとニューラルネットワークを用いた標準中国語連続音声の声調認識
- 用法の違いを考慮した類似単語の置換による学習データ生成とそれを用いた主題の違いに頑健な言語モデルの構築
- Evaluations of an open source WFST-based phoneticizer (音声)
- 外国語学習用読み上げ音声データベース
- Automatic Speech Recognition and Understanding Workshop(ASRU99)
- 音声操作プロジェクタ(音声処理技術のデモの紹介)
- ESCA IDS'99(Interactive Dialogue in Multi-Modal Systems)ワークショップ報告
- 生涯ディジタルパートナー : 連想型個人情報管理システム
- パネル討論対象とした音声認識のためのトリガー言語モデルの適応
- 日本語対話処理研究に必要なもの
- 話題同定に基づく言語モデル切替えによる対話音声認識
- 述語項の類似度に基づく情報抽出・推薦を行う音声対話システム
- 音声会話コンテンツにおける聴衆の反応に基づく音響イベントとホットスポットの検出
- 2000-SLP-32-6 音声認識技術の今後の10年について : 予測調査
- 素性頻度ファイルと部分的アノテーションコーパスからの単語分割器の学習
- ウエーブレットパケット分解による残響に頑健な音声認識
- 2000-SLP-32-14 ICASSP2000に見る世界の研究動向
- ポスター会話におけるパラ言語・非言語情報を用いた話者交替及び次話者の予測 (一般セッションと「法と社会のインタフェース」関する特別セッション)
- 講演音声の印象評定と韻律的特徴との関係
- 話題の追跡 国会審議の会議録作成支援のための音声認識システム
- 議会の会議録作成のための音声認識-衆議院のシステムの概要-
- 識別学習に基づく音声認識単語辞書の最適化の評価(言語モデル・辞書,第13回音声言語シンポジウム)
- 識別学習に基づく音声認識単語辞書の最適化の評価(言語モデル・辞書,第13回音声言語シンポジウム)
- 会議音声認識におけるBICに基づく高速な話者正規化と話者適応(音声,聴覚)
- 予稿の話し言葉変換に基づく言語モデルによる講演音声認識(言語モデル・辞書,第13回音声言語シンポジウム)
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 点予測による述語項構造解析
- 点予測による述語項構造解析
- 音声ドキュメント処理ワーキンググループ活動報告
- 4. 音声認識技術を用いた講演・講義への字幕付与(教育におけるICTと映像情報の活用)
- 音声ドキュメント処理ワーキンググループ活動報告
- 2012年度論文賞の受賞論文紹介:コンテンツの解析からインタラクションの解析へ
- ポスター会話における聴衆のマルチモーダルな振る舞いに基づく興味・理解度の推定
- 音声情報処理技術を用いた外国語学習支援(音声,聴覚)
- スマートポスターボード : ポスター会話のマルチモーダルなセンシングと認識(オーガナイズドセッション:マルチモーダル情報によるコミュニケーション環境理解,認識,理解,対話,一般)
- ロボットのための音声認識
- 音声言語情報処理研究会の20年-歴代主査による研究レビュー-