音韻・抑揚・文章予測を混用した音声対話処理におけるマッチング部の性能検討
スポンサーリンク
概要
- 論文の詳細を見る
近年では音声認識において、音声信号の各フレームのパターンのスペクトル特性を統計的手法で表現する隠れマルコフモデル(HMM)が一般に使われているが、本研究では、(1)上記のような音韻系列の分析手法のみならず、(2)基本周波数抽出を中心とする抑揚解析、(3)文章そのものの状態遷移表並びに人工推論的推論手法を用いて、次に発話される文章の予測という3つの異なる手法を用いて、総体的な対話そのものの音声認識率を向上させる音声認識法を紹介する。またその上でその3つの異なる論理の合体ロジック(以降マッチング部という)が、首尾よく機能しているか確認する。確認方法としては、文章予測が正確になされたと仮定して、音韻情報により作られる構文木の構造が葉の入れ替えを許しながら、抑揚推定による抑揚木の構造と葉の合体・分裂を考慮したある閾値内で類似しているかを、比較検討する。
- 社団法人電子情報通信学会の論文
- 2000-03-10
著者
-
堀内 靖雄
千葉大学 工学部
-
岡田 一秀
トヨタ自動車(株)東富士研究所
-
市川 熹
千葉大学 工学部 情報工学科
-
市川 熹
千葉大学 工学部
-
堀内 靖雄
千葉大学 大学院自然科学研究科
-
藤田 聡
千葉大学 自然科学研究科知能情報科学専攻
-
岡田 一秀
千葉大学 自然科学研究科知能情報科学専攻
関連論文
- 音声言語関連大型プロジェクトの現状と将来
- パネル討論 : 音声言語関連大型プロジェクトの現状と将来
- ヒューマンインタフェースシンポジウム2007報告
- F_0モデルによるアクセント句のセグメンテーションの検討(感情音声,韻律,声質,音声生成・知覚,脳機能,一般)
- 1.情報福祉と音声(バリアフリー社会に向けた音声情報処理)
- 視覚障害者のウェブサイトの検索行動に関する考察(福祉と音声処理,一般)
- 福祉と音声研究者
- 視覚障害者のウェブサイトの検索効率と心的負担に関する考察(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- 視覚障害者のアクセシビリティを考慮した Web ページ作成のためのビルダの検討
- 視覚障害者のアクセシビリティを考慮したWebページ作成のためのビルダの検討(特定領域研究「情報福祉の基礎」)
- 6.コミュニケーションと障害者(コミュニケーション支援)
- 3DCGによる手話文アニメーション合成システムの構築と評価(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 多目的利用分散型学術成果データベースシステムの構成法(オフィスインフォメーションシステム及び一般)
- 日本語地図課題対話コーパスの設計と特徴
- 福祉情報工学研究会10周年を記念して : 設立の経緯と情報福祉研究開発への期待(WIT10周年・50回記念企画「未来へつなぐ」プログラム)
- 対話音声の抑揚の記述
- 日本手話の後続うなずきの機能に関する検討(福祉情報工学一般)
- ブレスの合図を認識する伴奏システムの実装と評価(システム)
- 視覚障害者のウェブサイトの検索行動に関する考察(福祉と音声処理,一般)
- 高齢者・障害者支援とバリアフリー技術の動向
- 音声の非言語情報の知覚・認知モデルの検討 : 感情認知過程を説明する階層モデル(聴覚・音声・言語とその障害,一般)
- 音声対話システムにおける発話予測を利用した音声認識
- 手話日本語間の自動翻訳とその周辺
- 指点字の強度と時間構造におけるプロソディ情報の分析(福祉情報工学一般)
- 3DCGによる手話文アニメーション合成システムの構築と評価(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 3DCGによる手話文アニメーション合成システムの構築と評価(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 書き起こしへの付与を目指した音声とテキストを対象とした発話印象の分析
- ブレスによる合図を検出する伴奏システム
- 母音間のピッチデルタと発話インターバルを用いた焦燥検知 : 現実に基づいた正確な検知を目指して(韻律・VAD,第11回音声言語シンポジウム)
- 発言権を考慮した指点字と文字による会議システムの構築(視聴覚補助,情報福祉論文)
- 指点字を利用した盲聾者用エディタの開発(福祉と言語処理/一般)
- 指点字を利用した盲聾者用エディタの開発(福祉と言語処理/一般)
- 高齢者, 障害者と電子情報通信技術
- 複数のモデルを利用した重回帰分析による演奏表現の学習
- 演奏フィードバックを用いた伴奏システム
- 演奏フィードバックを用いた伴奏システム
- 韻律からの文構造推定における局所的特徴の分析 (テーマ:一般)
- 演奏するコンピュータ(「音楽情報処理研究への誘い特集号」)
- 動作要素の時間的関係を考慮した手話認識方式の検討
- 話者交替における視線とうなずきの分析 (テーマ:一般)
- 音声対話コーパスにおける画像情報のアノテーション手法の検討
- 時間的差分学習に基づく環境適応による音声認識(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 時間的差分学習に基づく環境適応による音声認識(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 時間的差分学習に基づく環境適応による音声認識(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 強化学習を用いた環境適応とクラスタリングに基づく音声認識
- LG-003 強化学習に基づくオンライン逐次環境適応による雑音下音声認識(G. 音声・音楽)
- 音韻認識に対する強化学習の基礎検討
- 手話における手動作のモデル化に基づくCGアニメーションの生成(福祉と知能・認知障害/一般)
- 手話における手動作のモデル化に基づくCGアニメーションの生成(福祉と知能・認知障害/一般)
- 発話末の基本周波数とパワーのパターン分類とその分析
- 発話制御におけるコード化された抑揚情報の利用
- 対話制御における抑揚情報の役割の2, 3の検討
- 伴奏システムでのブレス情報利用に関する検討
- 抑揚情報による木構造の準実時間推定
- 先行発話断片の終端部分に存在する次発話者に関する言語的・韻律的要素について
- 自発的音声対話における話者交替の制御に関わる発話末の統語的・韻律的特徴
- 日本手話におけるうなずきと接続詞の分析(福祉と音声処理,一般)
- 日本手話におけるうなずきと接続詞の分析(福祉と音声処理,一般)
- 音声言語関連大型プロジェクトの現状と将来
- 無音イメージから合理的音響付けへの1検討 : 正確な自動読唇術へのアプローチ(一般(ポスターセッション),第11回音声言語シンポジウム)
- 無音イメージから合理的音響付けへの1検討 : 正確な自動読唇術へのアプローチ(一般(ポスターセッション),第11回音声言語シンポジウム)
- 母音問のピッチデルタと発話インターバルを用いた焦燥検知 : 現実に基づいた正確な検知を目指して(韻律・VAD,第11回音声言語シンポジウム)
- 口腔生理を考えた画像処理手法使用の新しい音声認識手法
- D-14-26 波形形状分析型音声認識への環境・生理適応への考察(D-14. 音声・聴覚, 情報・システム1)
- SD-1-2 WEB音声認識サービスを考慮した発話データからの音声辞書の自動生成方法(SD-1. WebとXML : 新たな展開)
- D-14-9 音声認識用ノイズ・サプレッシング追随への試行(D-14. 音声・聴覚)
- 統計的解析から見た日本手話手指動作・非手指動作の相関関係について
- 指点字会議システムの試作(視覚障害/聴覚障害/一般)
- 全帯域対応型レゾネータへの試作検討小型化設計で広範囲な消音を狙って(トランスデューサ/一般)
- 音声対話処理のためのマルチエージェントシステム
- 連続音韻認識への強化学習の適応の検討
- 視覚障碍者用WWWブラウザの試作
- 視覚障碍者用WWWブラウザのUI設計
- 視覚障碍者用WWWブラウザのUI設計
- 視覚障碍者用WWWブラウザのUI設計
- 伴奏システムの協調動作の評価
- K-017 全盲者のウェブサイトのユーザビリティと検索効率に関する考察(教育工学・福祉工学・マルチメディア応用,一般論文)
- 発話予測を利用した手話対話システムに関する検討(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 発話予測を利用した手話対話システムに関する検討(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 発話予測を利用した手話対話システムに関する検討(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- STRAIGHTを用いたF0モデルパラメータの変換・再合成ツールの開発(一般(ポスターセッション),第9回音声言語シンポジウム)
- STRAIGHTを用いたF0モデルパラメータの変換・再合成ツールの開発(一般(ポスターセッション),第9回音声言語シンポジウム)
- STRAIGHTを用いたF0モデルパラメータの変換・再合成ツールの開発(一般(ポスターセッション),第9回音声言語シンポジウム)
- F0モデルを用いた日本語対話における韻律と話者交替の分析(合成,生成,韻律,一般)
- 音声対話におけるN-gramと予測文を併用した対システム発話の判別(合成,生成,韻律,一般)
- インタラクティブ性を考慮したウェブアクセシビリティの可能性の検討
- インタラクティブ性を考慮したウェブアクセシビリティの可能性の検討
- 人間の伴奏制御モデルに基づく伴奏システムの実装と評価
- 手話共通データSigndexの概念とその実例 : Signdex V.1
- D-14-25 実音声信号を用いたハードウェアによる自動シミュレーションの検討
- Island(島)分析を用いた音声認識法
- 視覚障害者用WWWブラウジングインタフェースの検討
- 音声の雑音比とスペクトルQを用いた全疲労検知 : 話者への効率や安全への助言を考えて(ポスターセッション,第10回音声言語シンポジウム)
- 音声の雑音比とスペクトルQを用いた全疲労検知 : 話者への効率や安全への助言を考えて(ポスターセッション,第10回音声言語シンポジウム)
- 音声の雑音比とスペクトルQを用いた全疲労検知 : 話者への効率や安全への助言を考えて(ポスターセッション,第10回音声言語シンポジウム)
- 波形の形状分析に基づく音素セグメンテーションの一検討(聴覚・音声・言語とその障害, 一般)
- 波形の形状分析に基づく音素セグメンテーションの一検討
- 音韻・抑揚・文章予測を混用した音声対話処理におけるマッチング部の性能検討
- 音声対話システムにおけるメタトピックの予測と応答合成
- 歩行障害を有する脳卒中患者の改善度推定のための足音検知の試み