韻律情報を用いた相槌の挿入 (<特集>ヒューマンインタフェースとインタラクション)
スポンサーリンク
概要
- 論文の詳細を見る
機械とユーザの対話において, 機械が人間と同様に相槌を打つことが可能であれば, ユーザの話しやすさの改善につながる. 本研究では, 話し手の発話間にポーズの出現とほぼ同時に相槌が打たれる場合を対象として, システムによる相槌挿入を試みた. システムが適切なタイミングで相槌を打つにはポーズを検出するよりも早く相槌の挿入判定を行う必要がある. そこで本稿では話し手の発話から抽出した韻律情報を用いて, 予測的に相槌の挿入判定を行う手法について検討した. まず対象としたテレフォンショッピングをタスクとした対話について音声を分析し, 聞き手の相槌が韻律的に特徴のある話し手の発話箇所で打たれていることを示した. 次に相槌音声を消去した対話を聞かせ, 相槌の箇所を人間が判定する実験を行ったところ, 実際に出現した相槌の76%は実験でも検出され, 発話長が長い場合に相槌を打つと判定した被験者が多いことが明らかになった. さらに相槌を打つタイミングについて, 対話の分析と知覚実験を行った. この結果, 相槌は発話中のポーズ開始から0.3秒以内に打つ必要があることが明らかになった. そこでテンプレートを用いた韻律パターンの認識による相槌タイミングの検出方法を提案し, 相槌判定のための予測時間を変えて相槌挿入判定とタイミングの検出実験を行ったところ, 予測時間0.1秒のとき84%, 予測時間0.4秒のとき72%のタイミング正解率を得た. また予測時間0.1秒のとき得られたシステムの応答を人間が評価したところ, 抽出箇所の74%は自然な発声箇所であると判定された.
- 一般社団法人情報処理学会の論文
- 1999-02-15
著者
-
板橋 秀一
筑波大学電子・情報工学系
-
山本 幹雄
筑波大学電子・情報工学系
-
山本 幹雄
沖テクノシステムズラボラトリ(株)
-
岡登 洋平
筑波大学大学院博士課程工学研究科
-
加藤 佳司
アルパイン株式会社
関連論文
- トピック教師なしデータからのトピック依存評価表現モデルの獲得(「主観表現処理の最前線」シンポジウム)
- 「日本語音声」データベースの構築 : 中間報告(国語学会2003年度秋季大会研究発表会発表要旨)
- フレーズテーブル及び既存対訳辞書を用いた専門用語の訳語推定(自然言語処理)
- 特許情報処理を指向したテストコレクションの構築 : 情報検索と自然言語処理の融合を目指して(NTCIR特別セッション)
- 特許情報処理を指向したテストコレクションの構築 : 情報検索と自然言語処理の融合を目指して(NTCIR特別セッション)
- 統計的機械翻訳におけるフレーズ対応最適化を利用したN-best翻訳候補のリランキング
- 確立・統計的言語モデル (特集 脳とことばとコンピュータ--脳の高次機能の解明に向けて)
- 確率・統計情報を用いた文法研究 (新・文法用語入門) -- (新しい文法研究)
- 日本語音声コ-パスの比較・選択の方法
- シソーラス上に動的に構成される標本空間における動詞の多義性解消
- シソーラス上での共起頻度を利用した動詞の多義解消
- 被喩詞の意味と比喩表現の意味との違いを示す指標
- 実例に基づいた入力文と格フレームの類似度
- 視点を考慮した比喩の理解
- 6U-2 特許文に対するクロストリガーモデルを用いた統計的機械翻訳システム(自然言語処理,学生セッション,人工知能と認知科学)
- 特許情報を対象とした機械翻訳 : 共通基盤による評価タスクを目指して
- 特許情報を対象とした機械翻訳 : 共通基盤による評価タスクを目指して(文書分類・翻訳)
- 音声認識セミナー : 基礎からディクテーションまで
- コーパスから抽出された辞書を用いた表記誤り検出法
- 音声合成システム性能評価方法の規格
- 声帯振動の非線形効果パラメータのパタン化とその評価
- 声帯振動の非線形効果パラメータのパタン化
- 声帯振動の非線形効果を考慮した合成音声とその評価
- 音声対話データベース構築の現状(音声対話システムの実力と課題)
- ブログ記事集合を用いたポストとコメントとの自動分離抽出手法の提案
- 方言音声コーパスの設計・構築と分析
- 日本語方言音声コーパスの構築と分析
- Integer programming for a phrase alignment problem on statistical machine translation (21世紀の数理計画--最適化モデルとアルゴリズム--RIMS研究集会報告集)
- SIG-SLP/SIG-NL合同セッションここまでできるぞ音声/言語処理技術 : 音声編
- ここまでできるぞ音声/言語処理技術 : 音声編
- 日本語ディクテーションのための言語資源・ツールの整備
- 日本語ディクテーションのための言語資源・ツールの整備
- 2000-FI-59-2 / 2000-DD-24-2 情報検索性能と表記の揺れへの寛容性を持つ類似度
- 2000-FI-59-2 / 2000-DD-24-2 情報検索性能と表記の揺れへの寛容性を持つ類似度
- 2000-NL-138-9 ダイナミックプログラミングでの検索方法
- NLC2000-18 ダイナミックプログラミングでの検索方法
- 日本語ディクテーション基本ソフトウェア(99年度版)
- 2000-NL-137-7 / 2000-SLP-31-2 日本語ディクテーション基本ソフトウェア(99年度版)の性能評価
- 2000-NL-137-7 / 2000-SLP-31-2 日本語ディクテーション基本ソフトウェア(99年度版)の性能評価
- 日本語ディクテーション基本ソフトウェア : 98年度版
- 日本語ディクテーション基本ソフトウェア(98年度版)の性能評価
- 日本語ディクテーション基本ソフトウェア(98年度版)の性能評価
- 日本語ディクテーション基本ソフトウェア : 97年度版
- 日本語ディクテーション基本ソフトウェア(97年度版)
- 日本語ディクテーション基本ソフトウェア(97年度版)の性能評価
- 対訳特許文書からの専門用語対訳辞書半自動獲得におけるフレーズテーブルと既存対訳辞書の併用(機械翻訳・要約・評判分析)
- 3D-5 フレーズテーブルと要素合成法を用いた対訳特許文書からの専門用語対訳辞書生成(自然言語処理,一般セッション,人工知能と認知科学)
- 語学会話教育用ICAIシステムの構成
- 大語彙日本語連続音声認識研究基盤の整備 : 汎用音素モデルの作成
- 大語彙日本語連続音声認識研究基盤の整備 : 学習・評価テキストコーパスの作成
- 大語彙日本語連続音声認識研究基盤の整備 : 評価用連続音声認識プログラムの開発
- 日本語音声コーパスの比較・選択の方法
- 日本音響学会新聞記事読み上げ音声コーパスからの評価用発話セットの作成
- 1)擬似中間調表示を利用した視感評価によるディスプレイの輝度階調補正法(〔画像処理・コンピュータビジョン研究会映像表現研究会〕合同)
- 2次元テクスチャを用いた炎の動的表現
- 擬似中間調表示を利用した視感評価によるディスプレイの輝度階調補正法
- テクスチャを用いた雲状対象物の動的表現
- 人間の理解手法を用いたロバストな音声対話システム
- ロバストな対話システム構築に関する一考察
- 音声対話システムにおける自然発話の頑健な一理解法
- 事前説明によるシステムへの入力発話の変化と誤認識結果の人間による復元
- 事前説明によるシステムへの入力発話の変化と誤認識結果の人間による復元
- 自然発話の意味理解と対話システム
- 日本語ディクテーション基本ソフトウェア(97年度版)の性能評価
- 音声対話文における助詞落ち・倒置の分析と解析手法
- 音声対話とキーボード対話における発話文の統語的特徴の比較
- 混合ディリクレ分布を用いたトピックに基づく言語モデル(音声, 聴覚)
- 確率的LSAを用いた日本語同音異義語誤りの検出・訂正(自然言語)
- 確率的LSAに基づくngramモデルの変分ベイズ学習を利用した文脈適応化(音声,聴覚)
- 混合ディレクレ分布を用いた文脈のモデル化と言語モデルへの応用
- 確率的LSAに基づくngramモデルの変分ベイズ学習を利用した文脈適応化
- 単一ニューロンによるパリティ関数の実現?!;人工ニューロンについての代数的研究
- 生成文書モデルを用いた文書読み上げ音声認識(認識, 信頼度)
- GMMによる多言語音声系統樹の構成
- 文書確率を用いた文書読み上げ音声認識
- F_0モデルパラメータ自動抽出方法の改良(聴覚・音声・言語とその障害, 一般)
- 混合ガウス分布による多言語音声系統樹の構成(音声言語応用)(第6回音声言語シンポジウム)
- 混合ガウス分布による多言語音声系統樹の構成(音声言語応用)(第6回音声言語シンポジウム)
- 混合ガウス分布による多言語音声系統樹の構成(音声言語応用)(第6回音声言語シンポジウム)
- F_0モデル・パラメーターの自動決定方法についての考察(ポスターセッション)(第5回音声言語シンポジウム)
- F_0モデル・パラメーターの自動決定方法についての考察(第5回音声言語シンポジウム : ポスターセッション)
- F_0モデル・パラメーターの自動決定方法についての考察(第5回音声言語シンポジウム : ポスターセッション)
- F_0モデル・パラメーターの自動決定方法についての考察
- [フェロー記念講演]音声研究と音声コーパス(認識・理解・対話)
- F_0モデルパラメータ自動決定の一方法
- 国内における音声データベースの現状 : 開発,管理及び音声研究への利用
- F_0モデルパラメータ自動抽出の一方法
- F_0モデルパラメータ自動抽出の一方法
- ニューラルネットワークを用いた日本語解析の試み
- クラスタリングによるHMM間の距離尺度の検討
- 日本音響学会研究用連続音声データベース (<小特集>出揃った音声データベース)
- 韻律情報を用いた相槌の挿入 (ヒューマンインタフェースとインタラクション)
- 韻律パターンの認識を用いた相槌挿入とその評価
- 読み上げ音声韻律コーパスの設計・構築と分析
- 基本周波数による多言語音声の分類
- 合成音声による画像の表現
- 音による図形の表現
- 3次元声道モデルによる連続音声合成の試み
- 曖昧観測シンボル列からのHMMパラメータ推定法とその形態素解析への応用
- 曖昧観測シンボル列からのHMMパラメータ推定法とその形態素解析への応用