音声に含まれる言語的情報を非言語的情報から音響的に分離して抽出する手法の提案 : 人間らしい音声情報処理の実現に向けた一検討(<特集>ヒューマンコミュニケーション〜人間中心の情報環境構築のための要素技術〜論文)
スポンサーリンク
概要
- 論文の詳細を見る
近年の計算機性能の飛躍的な向上により,大規模語彙を対象とした音声認識は実用段階を迎えている.音声合成においても話者性や発話スタイルを制御できる合成方式など,種々の応用場面を念頭においた技術開発が行われている.その一方で,音声工学研究の目的を「人間に匹敵するような」音声言語情報処理能力の計算機実装と考えた場合,人間と機械との間には,今なお,大きな溝があることも指摘されている.本研究ではまず,現在の音声認識・音声合成相当の情報処理を行う人間が現に存在した場合,その人間の挙動は,音声言語の獲得に困難を示す重度自閉症者の挙動と類似するであろうことを指摘する.その上で,(定型発達を遂げた)人間らしい音声情報処理の実現に向けて,現在の音声技術に欠けている基礎技術は何であるのかを幅広い視点から考え,欠損技術の一つとして「音声に含まれる言語的情報を,非言語的情報から音響的に分離して抽出する技術」を主張する.と同時に,その実現に向けて一つの技術的提案を行い,いくつかの実験結果を述べる.
- 2011-01-01
著者
-
鈴木 雅之
東京大学大学院教育学研究科
-
櫻庭 京子
東京医薬専門学校
-
峯松 信明
東京大学大学院
-
西村 多寿子
東京大学大学院医学系研究科
-
西村 多寿子
東京大学大学院
-
朝川 智
東京大学大学院新領域創成科学研究科
-
齋藤 大輔
東京大学大学院新領域創成科学研究科
-
齋藤 大輔
芝浦工業大学工学部電気工学科:東京工芸大学大学院工学研究科ハイパーメディア研究センター
-
喬 宇
東京大学大学院情報理工学系研究科
-
齋藤 大輔
東京大学
-
峯松 信明
東京大学
-
櫻庭 京子
獨協医科大学越谷病院
-
喬 宇
東京大学
-
鈴木 雅之
東京大学大学院工学系研究科
-
齋藤 大輔
東京大学大学院工学系研究科
-
喬 宇
東京大学大学院工学系研究科
-
鈴木 雅之
東京大学
-
鈴木 雅之
東京大学:(現)日本アイ・ビー・エム(株)東京基礎研究所
-
鈴木 雅之
東京大学大学院
関連論文
- 工夫速算問題の分類と抽象的方略を用いた教授の効果
- 女性と判定される声の特徴 : 性同一性障害者の話声位
- 母語話者と中国語話者の日本語朗読音声の基本周波数パターンの比較
- 英語・中国語・母語話者の日本語朗読音声のF0に現れる特徴(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
- 基本周波数パターン生成過程モデルに基づく日本語学習者音声の韻律の分析(一般)
- 中国語話者の日本語朗読音声の韻律的特徴と母語話者評価(聴覚・音声・言語とその障害,一般)
- 要素論から全体論へ : 全体から入る音声情報処理への招待(音響・音韻モデル)
- 孤立音[あ]を聞いて音韻/あ/と同定する能力は音声言語に必要か?(聴覚・音声/一般)
- 孤立音「あ」を聞いて音韻/あ/と同定する能力は音声言語に必要か?
- 音声の構造的表象に基づく音声認知と外国語発音学習に対する一考察(言語の学習・教育)
- 音声の構造的表象を通して考察する失読症・自閉症の音声認知(一般)
- 音声の相対音感 : 音声と音楽の同質性に関する一考察(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 構造不変の定理とそれに基づく音声ゲシュタルトの導出(一般, 一般, チュートリアルレクチャー)
- 構造不変の定理とそれに基づく音声ゲシュタルトの導出
- 音声言語運用が要求する認知的能力と音声言語工学が構築した計算論的能力(第10回音声言語シンポジウム)
- 日本語CALLシステムのための学習者発音分析とその自動評価(一般)
- シャドーイング・音読発音評価を目的とした話者適応の分析と応用(感情音声,韻律,声質,音声生成・知覚,脳機能,一般)
- ドラム音のパラメトリックモデリングとそれに基づくモーフィング
- ドラム音のパラメトリックモデリングとそれに基づくモーフイング
- 音声の構造的表象に基づく異言語間・異話者間の音声変換手法(言語獲得・学習,合成,生成,韻律,一般)
- 雑音環境下における話者照合(聴覚・音声・言語とその障害,一般)
- Statistical sequence-to-frame mapping techniques for voice conversion (パターン認識・メディア理解)
- 構造評価関数を用いた構造的表象からの音声合成系の高精度化(言語獲得・学習,合成,生成,韻律,一般)
- 確率的線形回帰混合モデルを用いた音声変換
- 話者不変な相対関係特徴を音響単位とする音響モデリングに関する実験的検討 (音声)
- 構造表象を用いた音声認識におけるパラメータ共有とその効果(認識,理解,対話,一般)
- 構造的表象からの音声合成とそれに基づく音声模倣に関する検討(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
- ケプストラムの声道長依存性に関する幾何学的考察(一般(ポスターセッション),第9回音声言語シンポジウム)
- 構造的表象からの音声生成に関する基礎的検討(合成,生成,韻律,一般)
- 基本周波数パターン生成過程モデルに基づくコーパスベース韻律生成における柔軟な焦点制御(言語獲得・学習,合成,生成,韻律,一般)
- 男性から女性への性別の移行を希望する性同一性障害者(MtF)の発話音声の分類に関する試案(聴覚・音声・言語とその障害,一般)
- 話者認識技術を用いた性同一性症者(MtF)の音声に対する男声度・女声度の自動推定とその臨床応用(聴覚・音声・言語とその障害,一般)
- 中国語方言の構造分析とその発音評価に向けた実験的検討(発音評価,認識,理解,対話,一般)
- 生成過程モデルを用いたHMMに基づく基本周波数パターン生成 (音声)
- 手の動きを入力としたリアルタイム音声生成系における鼻音の合成とピッチ制御に関する検討(福祉と音声処理,一般)
- 経験的モード分解による主構造抽出を介した雑音環境下における音声信号の基本周波数推定
- PE063 工夫速算問題の分類と,方略指導による直接・間接効果の検討
- スペクトル領域特徴量を用いた音声の構造的表象に関する実験的考察(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
- 外国語学習を対象としたシャドーイング音声の自動評定法に関する検討(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
- PG047 数学力コンポーネントを育成する学習法講座の試み : その2:図表利用と論理判断
- PG046 数学力コンポーネントを育成する学習法講座の試み : その1:用語理解と工夫速算
- マルチモーダルコミュニケーションのための音声合成プラットホーム
- マルチモーダルコミュニケーションのための音声合成プラットホーム
- 構造的特徴量に対する多段階の重回帰分析による発音評価(認識,理解,対話,一般)
- 生成過程モデルを用いたHMMに基づく基本周波数パターン生成(音声・言語・音響教育,一般)
- 音声言語運用が要求する認知的能力と音声言語工学が構築した計算論的能力(第10回音声言語シンポジウム)
- ボトムアップクラスタリングを用いたシャドーイング音声の自動評定(聴覚・音声・言語とその障害,一般)
- 教師なし音素セグメンテーションの最適化に関する理論的・実験的考察(一般(ポスターセッション),第9回音声言語シンポジウム)
- 教師なし音素セグメンテーションの最適化に関する理論的・実験的考察(一般(ポスターセッション),第9回音声言語シンポジウム)
- 教師なし音素セグメンテーションの最適化に関する理論的・実験的考察(一般(ポスターセッション),第9回音声言語シンポジウム)
- 制約条件付きクラスタリングによる連続音声からのイベント境界検出(認識,理解,対話,一般)
- ケプストラムの声道長依存性に関する幾何学的考察(一般(ポスターセッション),第9回音声言語シンポジウム)
- ケプストラムの声道長依存性に関する幾何学的考察(一般(ポスターセッション),第9回音声言語シンポジウム)
- 音声に含まれる言語的情報を非言語的情報から音響的に分離して抽出する手法の提案 : 人間らしい音声情報処理の実現に向けた一検討(ヒューマンコミュニケーション〜人間中心の情報環境構築のための要素技術〜論文)
- 話者不変な相対関係特徴を音響単位とする音響モデリングに関する実験的検討(音響モデル,第11回音声言語シンポジウム)
- 話者不変な相対関係特徴を音響単位とする音響モデリングに関する実験的検討(音響モデル,第11回音声言語シンポジウム)
- 音声の相対音感 : 音声と音楽の同質性に関する一考察(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 音声の相対音感 : 音声と音楽の同質性に関する一考察(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 男性から女性へ性別の移行を希望する性同一性障害者(MtF)の発話音声の分類に関する試案
- 男性から女性へ性別の移行を希望する性同一性障害者(MtF)の音声訓練 : 症例報告
- 「ピカチュウ」にこめられた感性情報 (Feature Article: Emotion in Speech)
- 女性と判定された性同一性障害者(MtF)の声の基本周波数(聴覚,音声,言語とその障害)
- 女声と聴取された性同一性障害者(MtF)の音声の音響分析
- 日英語の「平静」「感情」発話における話者の母語弁別能力
- 音声による感情表現の発達的検討
- 感情判断と言語判断 母語は外国語より感情認知しやすいか
- 2〜4歳児における情動語の理解力と表情認知能力の発達的比較
- 日米語の言語的制約が感情表現に及ぼす影響の音響的比較 : ピカチュウ vs pikachu
- 音声の構造的表象と判別分析を用いた単語音声認識(ポスターセッション,第10回音声言語シンポジウム)
- アフィン変換不変性を有する局所的特徴量を用いた音声認識(ポスターセッション,第10回音声言語シンポジウム)
- 非言語的な要因に不変な音響的特徴を用いた中国語方言に基づく話者分類(ポスターセッション,第10回音声言語シンポジウム)
- 音声の構造的表象と判別分析を用いた単語音声認識(ポスターセッション,第10回音声言語シンポジウム)
- アフィン変換不変性を有する局所的特徴量を用いた音声認識(ポスターセッション,第10回音声言語シンポジウム)
- 音声の構造的表象と判別分析を用いた単語音声認識(ポスターセッション,第10回音声言語シンポジウム)
- アフィン変換不変性を有する局所的特徴量を用いた音声認識(ポスターセッション,第10回音声言語シンポジウム)
- 空間写像に基づく手の動きを入力とした音声生成系の構築(マルチモーダル)
- 変換不変性を有するダイバージェンスとその一般形(認識,理解,対話,一般)
- 音声の構造的表象を用いた自動発音評定法の改善
- 音色の変復調を通して考える音声コミュニケーション(発達と知識獲得)
- 用法の違いを考慮した類似単語の置換による学習データ生成とそれを用いた主題の違いに頑健な言語モデルの構築
- 用法の違いを考慮した類似単語の置換による学習データ生成とそれを用いた主題の違いに頑健な言語モデルの構築
- 日本語のアクセント・イントネーションを対象とした発音教育システム構築に関する検討
- 2ZL-6 大規模英語学習者を対象とした音声の構造的表象に基づく発音分類とその応用(情報爆発時代におけるコミュニケーション手法,学生セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 無作為判別構造解析を用いた日本語母音連結発声の自動認識
- 1U-9 音声の構造的表象と多段階の重回帰を用いた外国語発音分析(音声分析・強調,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 用法の違いを考慮した類似単語の置換による学習データ生成とそれを用いた主題の違いに頑健な言語モデルの構築
- K146 ルーブリックによる評価基準の教示が学習者に及ぼす影響 : テスト観を媒介にした影響の検討(口頭セッション24 検査・評価)
- 日米の幼児・児童の感情表現における音声的制約 - ピカチュウと pikachu の音響的比較 -
- 幼児児童と成人による感情表現の音響的比較 : 「ぴかちゅう」発話による言語的制約と感情表現の関係
- SP2000-39 感情表現が言語的制約に及ぼす影響の発達的検討:「ぴかちゅう」発話の分析
- 幼児・児童の感情表現における音響的分析
- 幼児・児童の感情表現における音響的分析 :「ぴかちゅう」にこめられた感性情報
- 幼児・児童の感情表現における発達的研究:聴取実験結果の分析 : 「ぴかちゅう」にこめられた感性情報
- 音声の構造的表象と多段階の重回帰を用いた外国語発音評価
- メタ学習への介入法の提案とその効果検証
- 音声に含まれる言語的情報を非言語的情報から音響的に分離して抽出する手法の提案 : 人間らしい音声情報処理の実現に向けた一検討
- ルーブリックの提示による評価基準・評価目的の教示が学習者に及ぼす影響 : —テスト観・動機づけ・学習方略に着目して—
- C2. 孤立音を聞いて音韻同定できる能力は音声言語運用に必要か?(研究発表,日本音声学会2007年度(第21回)全国大会発表要旨)
- 「ピカチュウ」にこめられた感性情報(音声と感情)
- 26-J-16 認知カウンセリングからみた学習上の問題と基礎研究の展開(自主企画)