対話音声の発話単位への自動区分の検討
スポンサーリンク
概要
- 論文の詳細を見る
対話音声コーパスの構築および利用において、音声データのセグメンテーションは重要な問題の一つである。自由発話音声の音響的性質は朗読音声と大きく異るため、音素・音節単位のラベルを付与することは困難である。対話音声において、「文」は休止と間投詞によって複数の音声区間に断片化されていることが多い。このような休止間音声は、認識処理単位(発話単位)として適当であると考えられる。本稿では、休止・間投詞・文音声からなる対話音声モデルを提案し、これを用いて、対話音声を発話単位に区分化することを試みた。韻律情報を利用することによって間投詞の検出精度が向上し、85.4%の正解率で発話単位境界を正しく推定することができた。
- 一般社団法人情報処理学会の論文
- 1997-02-07
著者
関連論文
- 「日本語音声」データベースの構築 : 中間報告(国語学会2003年度秋季大会研究発表会発表要旨)
- 音声合成システム性能評価方法の規格
- 声帯振動の非線形効果パラメータのパタン化とその評価
- 声帯振動の非線形効果を考慮した合成音声とその評価
- 方言音声コーパスの設計・構築と分析
- 日本語方言音声コーパスの構築と分析
- マルチSNR・マルチバンド法を用いた話者識別における様々な学習雑音に対する性能評価
- マルチSNR部分帯域モデルを用いた話者識別システムの耐雑音性能改善
- フレーム単位で最適 SNR 部分帯域モデルを選択する話者認識
- 韻律情報を用いた日本語読み上げ文の係り受け解析におけるニューラルネットワークの利用
- 日本語読み上げ文の係り受け解析における複数ポーズ情報の利用
- 韻律を利用した係り受け解析におけるポーズ・基本周波数情報の結合法の検討
- 係り受け解析におけるポーズ・ピッチの利用法の検討
- 1)擬似中間調表示を利用した視感評価によるディスプレイの輝度階調補正法(〔画像処理・コンピュータビジョン研究会映像表現研究会〕合同)
- テレフォンショッピング対話の収録と分析
- 生成文書モデルを用いた文書読み上げ音声認識(認識, 信頼度)
- GMMによる多言語音声系統樹の構成
- 文書確率を用いた文書読み上げ音声認識
- F_0モデルパラメータ自動抽出方法の改良(聴覚・音声・言語とその障害, 一般)
- 混合ガウス分布による多言語音声系統樹の構成(音声言語応用)(第6回音声言語シンポジウム)
- 混合ガウス分布による多言語音声系統樹の構成(音声言語応用)(第6回音声言語シンポジウム)
- 混合ガウス分布による多言語音声系統樹の構成(音声言語応用)(第6回音声言語シンポジウム)
- F_0モデル・パラメーターの自動決定方法についての考察(ポスターセッション)(第5回音声言語シンポジウム)
- F_0モデル・パラメーターの自動決定方法についての考察(第5回音声言語シンポジウム : ポスターセッション)
- F_0モデル・パラメーターの自動決定方法についての考察(第5回音声言語シンポジウム : ポスターセッション)
- F_0モデル・パラメーターの自動決定方法についての考察
- [フェロー記念講演]音声研究と音声コーパス(認識・理解・対話)
- F_0モデルパラメータ自動決定の一方法
- 国内における音声データベースの現状 : 開発,管理及び音声研究への利用
- F_0モデルパラメータ自動抽出の一方法
- F_0モデルパラメータ自動抽出の一方法
- 多言語音声コーパスの構築と分析
- 雑音重畳音声の認識における連語言語モデルの比較
- 対話音声の発話単位への自動区分の検討
- 間投詞・非流暢発話と休止による対話音声区分化の検討
- 対話音声中の自立語の検出におけるポーズ情報導入の効果
- 単語クラスタリングに基づく言語モデルを用いたニュース音声認識
- ニュース音声認識のための言語モデルの比較
- 種々の音響条件におけるニュース音声認識についての考察
- 複数の単語bigramモデルを線形結合した言語モデルの検討
- 読み上げ音声韻律コーパスの設計・構築と分析