認知計算モデルとしての音声技術
スポンサーリンク
概要
- 論文の詳細を見る
音声認識、音声合成といった人の機能を代替するための音声技術は人に匹敵する高い性能が期待されるため、実現上で多くの課題が残されている。音声認識でのHMMや、コーパスベース音声合成に代表される統計的なアプローチは成功を収めてきたが、数理的客観尺度の最適化によるモデル作成技術に重点が置かれ、人の音声言語処理モデルとしては十分に実現されていない機能が存在する。音声技術は、人の音声言語処理を実現するための機能モデルとして不足している能力を補うことによって、より本質的な進展が図られると考えられる。本稿では、音声認識、音声合成の技術課題を人間の機能モデルの観点から再考した。さらに、認知機構を考慮した計算モデル化の具体例として、未登録語を無理なく扱うことができる階層的言語モデル作成の取り組みを紹介した。
- 社団法人電子情報通信学会の論文
- 2002-05-24
著者
関連論文
- 日本人学習者による英語のリズム制御におけるモーラの影響(感情音声,韻律,声質,音声生成・知覚,脳機能,一般)
- ことばとコミュニケーション(音叉)
- 統計的翻訳評価尺度に基づく日英翻訳文の訳質分析(機械翻訳)
- 未知固有表現を含む音声の認識([特別セッション]音声言語獲得・学習技術(2), 未知語処理)
- 複数のマルコフモデルを用いた階層化言語モデルによる未登録語認識(音声、聴覚)
- 話題と文型の違いを同時に考慮した言語モデル適応
- 構造化言語モデルとその実装
- 対話者の前発話を利用した統計的言語モデル
- クラスに依存した語彙の確率的記述に基づく階層型言語モデル
- 2つの単語クラスから生じた未登録語のサブワードモデルによる音声認識
- 自動音韻セグメンタの時間精度評価 : ラベル尤度との相関と誤差の音韻文脈依存性
- サブワードネットワークに基づく未登録語処理を搭載したデコーダの構築
- 大語彙連続音声認識における未知語のsub-wordモデリング手法
- 日本人英語学習者音声の時間制御特性客観評価(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
- スポーツオノマトペの実態について
- スポーツ指導者・体育学習者のためのオノマトペ辞典の開発
- 大語彙連続音声認識における未知語のsub-wordモデリング手法
- 音声翻訳システム : ATR-MATRIXの開発と評価(音声言語情報処理とその応用)
- ATR-MATRIXと人間との音声翻訳能力比較法の誤差に関する検討
- 中国語単語音声からの基本周波数制御コマンドの自動抽出
- 発声スタイル並行コーパスを用いた発音変形の分析
- D-14-11 日本人学習者に見られる中国語声調制御難易度の分析(D-14. 音声,一般セッション)
- 対話音声合成を目指した対話音声の韻律分析
- 発話スタイル並列コーパスを用いた発音変形の分析
- 対話音声を対象とした連続音声認識システムの試作と評価
- 発話情報を用いたF0制御パラメータの自動推定
- 基本周波数パタンに見られる発話態度の分析(対話)
- 基本周波数パタンに見られる発話態度の分析(対話)
- 文中の音韻長伸縮の自然性許容に対する発話速度の効果(聴覚・音声・言語とその障害)
- コーパスベース音声合成技術の動向[I] : コーパスベース音声合成の過去・現在・将来(自然な音声合成システム構築のための枠組み)
- 文音声における音韻長の制御特性と知覚特性との対応関係
- 英語発話リズム客観評価に向けた音響特徴の分析
- 日本人発話英語のリズム客観評価モデル
- 大規模日本語音声データベースの構築と評価
- 文中の音韻長伸縮の自然性許容に対する文節内位置の効果
- 認知計算モデルとしての音声技術
- クラスタされた音響モデルによる中国語音声認識
- 中国語音声認識における音素環境のモデリング
- 文音声における音韻長伸縮の許容度に対する文節内位置の効果
- 語彙が与える印象に基づく対話韻律生成
- 音響的セグメント単位を用いた自由発話音声認識
- 位置依存単語クラスタと頻出単語列を用いた多重クラス複合3-gram言語モデル
- ドメインの多次元性を考慮した言語モデル適応
- 句構造間の関係を反映した言語モデル
- 品詞接続特性と単語接続特性の最大事後確率推定による融合に基づく単語クラス分類
- 多重クラスTrigram構築のための効率的な自動クラスタリング手法
- 多重クラスTrigram構築のための効率的な自動クラスタリング手法
- 多重クラスTrigram構築のための効率的な自動クラスタリング手法
- 語彙が与える印象に基づく対話韻律生成
- 接続の方向性を考慮した多重クラス複合N-gram言語モデル(音声情報処理 : 現状と将来技術論文特集)
- B6. 柔道で使用するスポーツオノマトペエフェクト : 「グッ」,「サッ」における音調と聴覚特性の分析(研究発表,日本音声学会創立80周年記念式典・第20回全国大会発表要旨)
- A9. 英語学習者による音読における主観的評価と客観的測定値の関係(研究発表,日本音声学会2007年度(第21回)全国大会発表要旨)
- A2.韓国人日本語学習者による日本語の促音の聴取訓練の効果(研究発表,音声学会2009年度(第23回)全国大会発表要旨)
- 日本語特殊拍の知覚学習システムを利用した聴取訓練の効果(第319回研究例会発表要旨)
- 数理モデルからの提言(記念フォーラム 音声研究の輝かしい展開を求めて-研究分野・研究方法からの提言-,日本音声学会創立80周年記念式典・第20回全国大会発表要旨)
- C8. 運動指導者・実践者のためのオノマトペ発話音声の印象評価(研究発表,第18回全国大会発表要旨)
- 人間科学としての音声言語研究(音声研究の課題)
- 英語学習者音声のリズムの評価に用いるテキストの必要条件
- 対話音声合成を目指した対話音声の韻律分析
- 促音挿入判断に着目した韓国語母語話者による日本語促音の知覚特性 : 韓国語の濃音化との関連性を中心に(聴覚一般,聴覚・音声・言語とその障害/一般)
- 日本人英語学習者音声の時間制御特性客観評価
- B1-4. タイミング制御特性に着目した非母語話者の日本語音声の評価 : 日本語の長短音素を中心に(研究発表,日本音声学会2012年度(第26回)全国大会発表要旨)