自動推論 Wizard of OZ システムによる日本語自由発話コーパス
スポンサーリンク
概要
- 論文の詳細を見る
In this paper, we describe a corpus that contains spontaneous speech data between human and machine using the WOZ technique. It is designed to collect data in order to analyze the elements that enable interaction between human and machine, such as taking turns naturally during the dialog, chiming in, interruption, and natural recovery from interruption. The corpus contains the data from forty speakers during 197 sessions. The net amount of time that was spent on dialog sessions was over 1,300 min. The corpus contains speech signal waves, pitch patterns, transcriptions, utterance segment boundaries, and semantic representations of the user utterance.
- 社団法人日本音響学会の論文
著者
-
田中 和世
筑波大学図書館情報学系
-
長谷川 修
産業技術総合研究所
-
速水 悟
電子技術総合研究所
-
秋葉 友良
豊橋技科大
-
速水 悟
産総研
-
伊藤 克亘
Electrotechnical Laboratory
-
秋葉 友良
Electrotechnical Laboratory
-
長谷川 修
Electrotechnical Laboratory
-
速水 悟
Electrotechnical Laboratory
-
田中 和世
Electrotechnical Laboratory
-
長谷川 修
電子技術総合研究所知能情報部
-
長谷川 修
東京工業大学大学院理工学研究科像情報工学研究施設:産業技術総合研究所脳神経情報研究部門:科学技術振興事業団さきがけ研究21
関連論文
- 軽い音声認識システムの開発と課題(若手研究者育成レクチャーシリーズ,認識,理解,対話,一般)
- 会議音声データの収録とデータファイル化
- ニュース音声コーパスの構築
- 高次相関特徴によるテクスチャ解析の試み
- 視覚情報を対話的に学習するマルチモーダル擬人化エージェント
- コンピュータとの対話におけるユーザの振舞いの解析
- 視覚・聴覚・発話機能を有するエージェント型マルチモーダルインタフェースの試作
- 調音の構造的制約を考慮した音声特徴抽出の検討
- 声帯振動の非線形効果パラメータのパタン化とその評価
- 声帯振動の非線形効果パラメータのパタン化
- ホルマントと調音パラメータノモグラムを用いた音声の低ビット符号化法
- 声帯振動の非線形効果を考慮した合成音声とその評価
- 音声文書検索のための多言語音素片セグメントの応用(第5回音声言語シンポジウム : ポスターセッション)
- 音声文書検索のための多言語音素片セグメントの応用(第5回音声言語シンポジウム : ポスターセッション)
- 音声認識技術とその応用,現状と課題
- 利得適応型AR-HMM分解法を用いた音響モデルの雑音適応化の検討(音響と音声処理,音声強調,ロバスト音声認識)
- 利得適応型AR-HMM分解法を用いた音響モデルの雑音適応化の検討(音響と音声処理,音声強調,ロバスト音声認識)
- 人の表情を有し音声対話・視覚機能を備えたマルチモーダルインタフェース
- 音声・視覚・画像を統合した対話システムの試作
- ARHMMに基づいた音声分析手法と歌声認識による評価(聴覚・音声及び一般)
- 対話型英語学習システムにおける日本人英語音声認識精度の検討
- 日本人英語の特性に基づく音声認識を用いた英会話学習支援システム
- 言語に共通な音声符号系とその音響セグメントモデルの作成
- 単語発声の複数サンプルを利用した未知語の音韻系列の推定(音声情報処理 : 現状と将来技術論文特集)
- 自動推論 Wizard of OZ システムによる日本語自由発話コーパス
- 被覆率を重視した大語彙連続音声認識用統計的言語モデル
- 人の間, ものの間のインタフェース
- WOZシステムで収録した自由発話音声の対話データベース
- 音声認識用統計的言語モデルのための形態素解析済みテキストの後処理
- ノンバーバル情報を導入した音声・画像統合対話システムでの初期データ収録
- ノンバーバル情報を導入した音声・画像統合対話システムの設計
- 複数サンプルを用いた未知語の音韻系列の推定
- 複数サンプルを用いた未知語認識
- RWC計画における音声対話データベースの構築
- 休止を単位とした漸進的対話処理
- 対話システム制御における時間の扱い
- サブスペース法を用いた音声強調法とその音声認識への応用(第2報)
- サブスペース法を用いた音声強調法の音声認識への応用
- 身振りと発話のマルチモーダルデータベース
- 手の表面情報認識による人物同定
- IE2000-22 / PRMU2000-47 / MVE2000-51 ジェスチャ認識システム評価用ジェスチャデータベースの開発
- IE2000-22 / PRMU2000-47 / MVE2000-51 ジェスチャ認識システム評価用ジェスチャデータベースの開発
- IE2000-22 / PRMU2000-47 / MVE2000-51 ジェスチャ認識システム評価用ジェスチャデータベースの開発
- EM法を用いた複数情報源からの概念獲得
- EM法を用いた複数情報源からの概念獲得
- マン・マシン対話データのピッチパターン分類に関する検討
- 単語アクセントパターン識別におけるモーラ単位HMMの語彙独立性の評価と検討
- セグメント単位の音声符号列からのレキシコンの生成
- 区分線形セグメントラティスによる日英混合音声の認識
- 言語混合単語音声認識に関する実験的検討
- 区分線形セグメントラティスにおける音韻的チャンクの抽出
- 中間符号系と記号列間距離計算に基づく音声処理の提案
- 区分線形セグメントラティス音韻モデルにおけるクラスタリング
- 単語セットの音声認識難易度推定 : 記号領域における単語間距離計算の応用
- 記号領域における単語間距離の計算と音声認識難易度
- インタラクションのための計測・認識 : ビジョンの特長を生かせるか?
- インタラクションのための計測・認識 : ビジョンの特長を生かせるか?
- オフィス移動ロボットJijo-2 の音声対話システム
- 事情通ロボットの音声対話インターフェース
- 論争支援マルチモーダル実験システム MrBengo
- 論争支援のマルチモーダル実験システム
- 音声・視覚・画像をもつインタラクションシステム
- インタフェース研究と脳科学
- インタフェース研究と脳科学
- インタラクションのための計測・認識 : ビジョンの特長を生かせるか?
- 学習による不特定環境下の顔の追跡と向きの推定
- Multimodal Interaction System that Integrates Speech and Visual Information (特集 RWC研究--実世界知能の実現を目指して) -- (第2部 実世界知能研究推進センターの最新の研究成果)
- 実世界視覚情報を対話的に学習・管理する人間型ソフトウェアロボット (知能情報メディア論文特集)
- 人間型マルチモーダルエージェントによる実世界情報の学習と管理
- 実空間中の人物や物体を認識して対話するマルチモーダル擬人化エージェント
- 部分画像からの物体の認識と切り出し手法の提案
- 「顔」の情報処理
- 「顔」の情報処理
- ディベート : 「仮想ネットワーク社会に自律擬人化エージェントは必要か」の主旨と論点
- 音声補完 : 音声入力インタフェースへの新しいモダリティの導入(インタラクティブシステムとソフトウェア)
- 音声補完 : 単語補完機能の評価
- マルチモーダル機能(「RWC-実世界知能」)
- 音声補完の評価
- 音声補完の評価
- 音声補完: 音声ワイルドカード補完機能の実現
- 自然発話中の有声休止箇所のリアルタイム検出システム(音声情報処理 : 現状と将来技術論文特集)
- 高次局所自己相関特徴とKL展開による3次元物体のビューベース画像認識
- マルチモーダル対話システムのための人間型CGエージェントの構築
- 区分線形セグメント列からの音素的構造の抽出
- 音声スペクトルからの識別的特徴抽出に関する実験的検討
- 音韻モデル獲得のための区分線形セグメントラティスの学習
- 時間の扱いを考慮した対話システム制御手法
- 区分線形セグメントラティスを用いた単語モデルの自動生成
- マンマシン対話における言語表現の多様性の解析
- 解説 マルチモーダル研究の現状と展望--フレーム問題の擬似的解決と実世界知能
- マルチモーダル研究の現状と展望 : フレーム問題の疑似的解決と実世界知能
- 生体の視覚に学ぶコンピュータビジョン
- 空間指示語と想起される認知領域の基礎的研究
- Multinomial Logit Modelによるオフライン手書き文字認識
- マルチモーダル対話における視覚の役割とその応用
- マルチモーダル対話における視覚の役割とその応用
- 擬人化エージェントによるマルチモーダルインタフェース
- 2-2 顔画像からの個人識別(2.認識技術の現状)(人体と顔の画像処理)
- 対話しながら学習するマルチモーダル対話システムを目指して
- マルチモーダル対話