ロボットとの柔軟な対話を目的とした音声入出力システム : ―WABOT-2における会話系―
スポンサーリンク
概要
- 論文の詳細を見る
人間とロボットとのインターフェイスが, 音声を用いた自由度の高い会話で実現されるならば, ロボットは人間にとってよ, り身近な存在となり, その利用の楊は大きく広がっていくことになろう.我々は, このような要求を満たすロボット用音声会話装置の開発を進め, 鍵盤楽器演奏ロボット・WABOT-2に組み込むことを試みた.本論文は, その概要について述べたものである.<BR>システムは, 連続的に発声された文章を状況に応じて適切に解釈する会話音声理解部と, 自然な形で人間に対, し入力を要求し円滑に会話を進めていくための章声合成部から成る.<BR>扱うタスクの変更に柔軟に対処するため, 理解部には音韻認識をベースにした方式が, また合成部にはCV素片編集型の規則合成方式が採用された.このような方式を採るとき, 理解部では特に調音結合と呼ばれる音韻環境に応じた音の変形が, 合成部では音質の劣化が問題となる.本研究では, 音韻認識に調音次元の特徴を利用することと, 合成部に肉ける素片結合時にフォルマント感度を考慮することを提案し, それぞれの問題を解決した.<BR>また, 理解部における文解釈の部分には.バス重み付け可能なネットワークモデルを提案し, この重みをプロダクションルールで制御することを試みた.この方式によって会話の状況に応じて随時受理文ネットワークのある特定の部分に興味を集中させることが可能となり, 複数の意味にとれるあいまいな文章を一意に解釈する能力が実現された.<BR>また, これちのアルゴリズみを合計15個のマイクロプロセッサから成るハードウェア上に実装することにより, 完全に実時間で動作させることに成功した.<BR>以上の成果の下に, 従来の音声入出力装置では実現できなかった自由度の高い会話システムが構築できた.
著者
-
白井 克彦
早稲田大学
-
小林 哲則
早稲田大学
-
岩田 和彦
早稲田大学 It研究機構
-
岩田 和彦
早稲田大学理工学部電気工学科
-
深沢 克夫
早稲田大学理工学部電気工学科
-
小林 哲則
早稲田大学理工学部電気工学科
関連論文
- 正弦波トラジェクトリに基づく楽器音中の音声強調
- 1983年IEEE音響・音声・信号処理国際会議 : ICASSP83
- 1990年音声言語処理国際会議
- J-028 音声対話システム利用時における感情表出誘因性に関する考察(ヒューマンコミュニケーション&インタラクション,一般論文)
- 検索語の共起情報を利用した単語クラスタリングとWeb検索への応用
- 検索語の共起情報を利用した単語クラスタリングとWeb検索への応用(QA・Web検索)
- 係り受け解析のための辞書の構成とその学習機能
- 多次元心的状態を扱う音声対話システムの構築
- 音声対話システム汎用プラットホームにおける行動管理部の構築
- 音声対話システム汎用プラットフォームの検討
- 人間型ロボットの対話インタフェースにおける発話交替時の非言語情報の制御 (ヒューマンインタフェースとインタラクション)
- 人間型対話インタフェースにおけるまばたき制御の検討
- 人間とロボットのコミュニケーションにおける非言語情報の利用
- A-4-23 「通る」歌声の分析(A-4.信号処理,一般セッション)
- A-10-2 べき級数展開によるフォルマント表現(A-10.応用音響,一般セッション)
- A-10-7 べき級数展開によるスペクトル予測推定(A-10. 応用音響,一般セッション)
- サブバンド信号振幅変化に着目した音源分離(音声合成・分析)
- 新しい字幕制作実用化モデルシステムの設計・開発(デジタル放送技術, デジタル設備および一般)
- 多様な字幕表示形式を選択可能な字幕放送受信システム
- 9-8 字幕番組制作技術の研究開発フェーズ2における計画の概要
- 17-6 オフライン自動字幕番組制作システムの評価
- 8-5 字幕番組データを自動制作する新しい字幕制作システムの開発
- 聴覚障害者向けニュースの字幕提示方法に関する主観評価(人間の視覚・聴覚情報)
- 8-1 聴覚障害者のための字幕放送制作技術の研究状況 (第四報)
- 多様な提示法の字幕番組評価実験結果と実験用字幕番組の制作概要(人間とマルチメディア及び一般)
- 多様な提示法の字幕番組評価実験結果と実験用字幕番組の制作概要
- 8-3 聴覚障害者のための字幕放送制作技術の研究状況 (第三報)
- 多様な提示方法の実験字幕番組の自動制作手法と字幕評価実験概要 : 聴覚障害者向け自動字幕制作システムの研究開発
- E-073 適応的言語処理を用いた音声認識利用による楽曲検索システムの検討(E分野:自然言語・音声・音楽)
- 中国語読解支援システムCHIDAOの設計
- 人間形会話ロボット : パラ言語の生成・理解機能を持つマルチモーダルインタフェース
- D-14-14 品詞情報を用いた操作要求発話判別(D-14. 音声,一般セッション)
- D-5-7 相手にあわせた発話調整機能のための言語情報からのユーザモデル生成手法の検討(D-5. 言語理解とコミュニケーション,一般セッション)
- D-5-6 再利用可能情報収集のための構造化データベースの提案(D-5. 言語理解とコミュニケーション,一般セッション)
- ユーザの発話を利用した聞き取りやすい英語への音声変換手法 (言語理解とコミュニケーション)
- D-14-11 韻律条件付言語モデルを用いた音声認識のリスコアリング(D-14. 音声,一般セッション)
- D-14-2 文頭・文末の音韻情報を加味した単文に有効な言語識別手法(D-14. 音声,一般セッション)
- D-14-1 対話支援システムのための雑談判別(D-14. 音声,一般セッション)
- 音声対話システムにおける発話意図推定
- ユーザの嗜好に適応させた選曲システムの提案
- D-14-3 質問者の発話による発表スライド特定提示法(D-14.音声,一般セッション)
- A-15-24 PC操作情報とソーシャルタグに基づいた楽曲推薦手法(A-15.ヒューマン情報処理,一般セッション)
- サブバンド信号振幅変化に着目した音源分離(音声合成・分析)
- 情報系学長,おおいに語る
- AMとFMの長時間分析に基づく音声認識
- 狭帯域解析信号と非線形識別分析を用いた音声認識(認識,理解,対話,一般)
- 可変長セグメントパタンマッチングに基づく楽音の音高・楽器推定
- 音声・楽器音・歌声が混在した音響信号中の音カテゴリ検出
- 母音および摩擦音発生時の発声器官の運動推定(2部 ヒトの機能と特性)
- 箏曲異種楽譜の比較による歌の旋律分析
- 3G-5 箏曲の声楽部における旋律の分析
- マルチモーダル入力環境下における音声の協調的利用 : 音声作図システムS-tgifの設計と評価
- 音声認識技術を利用した日本語発音学習システム
- マルチメディアインタフェースにおける音声対話
- 音声・マウス・キーボードを併用した作図システムS-tgifとその評価
- 音声・マウス・キーボードを用いたマルチモーダル作図システム
- ロボットの知能(これからのロボットと社会的インパクト)
- 音声母音スペクトルのべき級数展開とその零点分布(研究速報)
- 箏曲の歌における旋律とリズムの知識表現
- 箏曲の歌の旋律型とリズム型
- 筝曲の歌の旋律型とリズム型
- 楽譜情報に基づいた箏曲の音律と音階の分析
- 箏曲の歌におけるメリスマの表現
- 箏曲における歌の音階に関する考察
- 予測や予備運動が指運動の反応時間に与える影響
- 情報理論に基づく遮音性能評価の基礎的検討
- 1N-8 共起情報を用いた同表記異義の処理
- Sinusoidal trajectoryを利用した音楽中の音声検出法
- 音声・楽器音・歌声が重畳した音響信号中のカテゴリ識別
- 音声・楽器音・歌声が重畳した音響信号中のカテゴリ識別
- HMMを用いた音声・音楽識別(信号処理・符号化・一般)
- HMMを用いた音声・音楽識別(信号処理・符号化・一般)
- HMMを用いた音声・音楽自動識別の検討
- 音声・音楽識別を目的とした特徴量の検討
- 音声・音楽識別を目的とした特徴量の検討
- 音声・音楽識別を目的とした特徴量の検討
- 放送音源における音声・音楽区間セグメンテーション手法の検討
- 対面および非対面における対話の違い : 頭の振りの役割分析
- 画像特徴に基づくシーンの分類
- ロボットとの対話における非言語情報の役割
- 人間型対話ロボットにおける非言語情報の役割
- 分散処理を意識した設計支援システムSYARDSの構築
- マルチプロセッサによる分散処理を意識した専用プロセッサ設計支援システムSYARDSの構築
- 専用プロセッサ設計支援システム(SYARDS)におけるハードウェア指向・ソフトウェア指向合成法の評価
- 専用プロセッサ設計システム(SYARDS)と論理合成システムとの接続
- 専用プロセッサ設計支援システム(SYARDS)におけるパイプライン処理システムのための最適化
- 並列モジュール記述を可能とした高位記述言語による専用プロセッサ設計支援システム(SYARDS)の構築
- 新聞記事データベースを用いた大語い連続音声認識
- 新聞記事を用いた大語彙連続音声認識の検討
- 人類の文化としてのロボティクス
- 音声認識から音声対話へ
- D-5-5 子どもの質問に対するわかりやすい回答提示システム(D-5.言語理解とコミュニケーション,一般セッション)
- ユーザの発話を利用した聞き取りやすい英語への音声変換手法(一般(ポスターセッション),第11回音声言語シンポジウム)
- ユーザの発話を利用した聞き取りやすい英語への音声変換手法(一般(ポスターセッション),第11回音声言語シンポジウム)
- J-006 時空を越えたコミュニケーションを実現する音声インタフェースの提案(ヒューマンコミュニケーション&インタラクション,一般論文)
- J-040 子供を対象とする音声対話インタフェースの検討(J分野:ヒューマンコミュニケーション&インタラクション)
- 音声認識のためのダイナミック非線形手法
- I-046 音響信号処理に基づくサッカー映像のインデクシング手法(I.画像認識・メディア理解)
- 多様な字幕表示形式を選択可能な字幕放送受信システム
- 多様な字幕表示形式を選択可能な字幕放送受信システム