音声に含まれる言語的情報を非言語的情報から音響的に分離して抽出する手法の提案 : 人間らしい音声情報処理の実現に向けた一検討(<特集>ヒューマンコミュニケーション〜人間中心の情報環境構築のための要素技術〜論文)
スポンサーリンク
概要
- 論文の詳細を見る
近年の計算機性能の飛躍的な向上により,大規模語彙を対象とした音声認識は実用段階を迎えている.音声合成においても話者性や発話スタイルを制御できる合成方式など,種々の応用場面を念頭においた技術開発が行われている.その一方で,音声工学研究の目的を「人間に匹敵するような」音声言語情報処理能力の計算機実装と考えた場合,人間と機械との間には,今なお,大きな溝があることも指摘されている.本研究ではまず,現在の音声認識・音声合成相当の情報処理を行う人間が現に存在した場合,その人間の挙動は,音声言語の獲得に困難を示す重度自閉症者の挙動と類似するであろうことを指摘する.その上で,(定型発達を遂げた)人間らしい音声情報処理の実現に向けて,現在の音声技術に欠けている基礎技術は何であるのかを幅広い視点から考え,欠損技術の一つとして「音声に含まれる言語的情報を,非言語的情報から音響的に分離して抽出する技術」を主張する.と同時に,その実現に向けて一つの技術的提案を行い,いくつかの実験結果を述べる.
- 2011-01-01
著者
-
鈴木 雅之
東京大学大学院教育学研究科
-
櫻庭 京子
東京医薬専門学校
-
峯松 信明
東京大学大学院
-
西村 多寿子
東京大学大学院医学系研究科
-
西村 多寿子
東京大学大学院
-
朝川 智
東京大学大学院新領域創成科学研究科
-
齋藤 大輔
東京大学大学院新領域創成科学研究科
-
齋藤 大輔
芝浦工業大学工学部電気工学科:東京工芸大学大学院工学研究科ハイパーメディア研究センター
-
喬 宇
東京大学大学院情報理工学系研究科
-
齋藤 大輔
東京大学
-
峯松 信明
東京大学
-
櫻庭 京子
獨協医科大学越谷病院
-
喬 宇
東京大学
-
鈴木 雅之
東京大学大学院工学系研究科
-
齋藤 大輔
東京大学大学院工学系研究科
-
喬 宇
東京大学大学院工学系研究科
-
鈴木 雅之
東京大学
-
鈴木 雅之
東京大学:(現)日本アイ・ビー・エム(株)東京基礎研究所
-
鈴木 雅之
東京大学大学院
関連論文
- 工夫速算問題の分類と抽象的方略を用いた教授の効果
- 女性と判定される声の特徴 : 性同一性障害者の話声位
- 母語話者と中国語話者の日本語朗読音声の基本周波数パターンの比較
- 英語・中国語・母語話者の日本語朗読音声のF0に現れる特徴(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
- 基本周波数パターン生成過程モデルに基づく日本語学習者音声の韻律の分析(一般)
- 中国語話者の日本語朗読音声の韻律的特徴と母語話者評価(聴覚・音声・言語とその障害,一般)
- 要素論から全体論へ : 全体から入る音声情報処理への招待(音響・音韻モデル)
- 孤立音[あ]を聞いて音韻/あ/と同定する能力は音声言語に必要か?(聴覚・音声/一般)
- 孤立音「あ」を聞いて音韻/あ/と同定する能力は音声言語に必要か?
- 音声の構造的表象に基づく音声認知と外国語発音学習に対する一考察(言語の学習・教育)