自己修復の分析に基づく発話生成モデルに関する考察
スポンサーリンク
概要
- 論文の詳細を見る
計算機との自然な対話を実現するためには、自由発話理解、実環境への対応、対話のモデル化などが重要な課題である。しかし、話し言葉には省略、倒置、言い直しなど、通常書き言葉にはあまり見られない表現が数多く現れる。なかでも、音声入力によって書き言葉と異り、誤りなどを含む不適格文が多く入力されることが予想される。Leveltによると、こうした不適格性は話者自身によって直されることが多い.この話者自身による言い直し行為を自己修復(self-rePair)と呼ぶ。自己修復は発話行動のさまざまな過程で生ずるため、さまざまなものがある。例えば、「秋葉原」と言おうとして「あきはらば」と言ってしまうような音素レベルでの誤りを訂正するものから、発話の途中でガリの話題に転換してしまうような自己修復もある。発話を生成する過程というのは大きく分けて3つのステージに分けられる。一つ目で意図(概念)を構成し、二つ目のステージでは文法構造を構築し、最後のステージで音素が決定され、発話が行なわれる。最近では各ステージの行為が並列的に行なわれていることを示す研究もある。また、Blackmerらは自己修復に要する時間の分析から、話者は各存のステップでの出力を逐次モニターしているということを報告している。そこで我々は自己修復を誤りの種類と、修復に要する時間の関係から分析する。得られた結果から、実際の現象に適合する発話生成モデルについて検討する。
- 社団法人情報処理学会の論文
- 1994-09-20
著者
-
大西 昇
名古屋大学大学院情報科学研究科
-
杉江 昇
名城大学理工学部情報工学科
-
伊藤 雅浩
名古屋大学大学院工学研究科
-
佐川 雄二
名古屋大学大学院工学研究科
-
佐川 雄二
名城大学理工学部情報工学科
-
大西 昇
名古屋大学 大学院 工学研究科 情報工学専攻
-
杉江 昇
名城大学理工学部
-
大西 昇
名古屋大学
関連論文
- 難聴者のための,会議における発言聴取支援システム(肢体障害・聴覚障害,HCGシンポジウム)
- 自己運動感覚を誘導する視覚刺激に対する生体反応の分析
- 自己運動を誘導する視覚刺激に対する生体反応の分析(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- 自己運動を誘導する視覚刺激に対する生体反応の計測
- 3次元形状手がかりに基づく陰影からの表面反射特性知覚(ヒューマンインフォメーション)
- 視聴覚事象の中心的事例の教師なし学習
- リニアスライダを用いた高速ステレオビジョンシステム : 左右カメラの見えの違いを考慮した最適基線長探索(一般セッション6)
- リニアスライダを用いた高速ステレオビジョンシステム : 左右カメラの見えの違いを考慮した最適基線長探索(一般セッション2,三次元画像,多視点画像)
- 吹き付けによる3次元形状モデリングの提案
- 三次元CGにおけるカメラワークの自動生成
- 固視微動に示唆を得たビジョンシステムによる奥行き判別支援
- ディジタル画像内での部分複写の検出(改竄検出,映像符号化,システム及び一般)
- 重なり合う物体の輪郭線抽出 : 頂点組み合わせ決定と輪郭線生成の改良
- A-19-13 聴覚障害者の講義におけるハウリング音の位置検出(A-19.福祉情報工学,一般講演)
- 安全運転支援のための緊急自動車のサイレン音の検出
- 指示語に対応する指示対象抽出による遠隔パソコン要約筆記者支援の提案
- スペクトルの特徴マップを用いた上下方向音源定位学習システム(バイオサイバネティックス,ニューロコンピューティング)
- 音圧差情報付加による音源定位システムの性能改善
- 感覚運動統合による音源定位ロボットの構築
- 曲面に書かれた文字の抽出(テーマセッション: マルチメディアコンテンツ, データ工学とメディア理解との融合)
- 超高速ステレオヘッドを用いた移動物体追跡と効率的協調制御(一般セッション(5))(ユビキタスコンピューティングのためのパターン認識・理解)
- スリット提示の視認性の検討
- スリット提示の視認性の検討(ヒューマンインフォメーション, ITS画像処理,映像メディア及び一般)
- 大画面スリット視における文字・図形の収縮率の検討
- 大画面スリット視における文字・図形の収縮率の検討(視聴覚情報処理及び一般)
- webページ中のテキストと表からの重要個所抽出
- E-18 Webページの主題推定(情報抽出,E.自然言語・文書)
- 日本語の修飾構造を評価する添削支援システムを実現するための基礎研究
- タッチパネル操作における視覚障害者の指の誘導法(聴覚と福祉情報工学・一般)
- 画像内のオブジェクトに注目した画像内容検索(一般セッション(2))
- オンライン言語処理モデルにおける自己修復文の解析手法
- 自己修復の分析に基づく発話生成モデルに関する考察
- 自己運動を誘導する視覚刺激に対する生体反応の分析
- 指向性マイクロホンの近接配置における周波数領域ブラインド音源分離の性能評価(電気音響,音響一般)
- オプティカルフローを用いた複雑背景下における人物の腕領域の抽出と運動パラメータ推定
- 観測シーンに依存しない3次元物体認識(一般セッション)
- 観測シーンに依存しない3次元物体認識(一般セッション)
- 触刺激による「方向」情報呈示とその識別について
- 動画間の差異検出に基づくスポーツフォーム教示システム(一般,顔・人物・ジェスチャ・行動)
- 動画間の差異検出に基づくスポーツフォーム教示システム(一般,顔・人物・ジェスチャ・行動)
- スーパーピクセルを用いた対応付けによる室内の領域分割(一般セッション1)
- スーパーピクセルを用いた対応付けによる室内の領域分割(一般セッション1,三次元画像,多視点画像)
- スーパーピクセルを用いた対応付けによる室内の領域分割(一般セッション1,三次元画像,多視点画像)
- 3)主観的輪郭生成のアルゴリズムとその画像理解への応用(〔情報ディスプレイ研究会視聴覚技術研究会画像通信システム研究会〕合同)
- 主観的輪郭生成のアルゴリズムとその画像理解への応用 : 情報ディスプレイ視聴覚技術画像通信システム(視覚と画質特集)
- 適応的なロバストSuper-Exponential法を用いた瞬時混合ブラインド音源分離(研究速報)
- 周波数領域BSSに対するSEMと参照信号EVA(アレー信号処理・音響計測/一般)
- A-10-7 移動音源存在時の指向性マイクを利用したブラインド音源分離
- 音源分離における指向性マイクの有効性
- 分離パラメータ収束点推定を用いた源信号分離の収束性能の向上
- D-14-12 3音源混合信号からの源信号分離
- D-14-11 独立成分分析を用いた音源分離の性能評価
- 周波数領域で行うブラインド分離の一手法
- ラインカメラによる道路面撮像と画像処理
- ラベル要素検出とモデル照合による商品棚ラベル認識(一般セッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- ラべル要素検出とモデル照合による商品棚ラべル認識(一般セッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- リニアスライダを用いた高速ステレオビジョンシステム : 左右カメラの見えの違いを考慮した最適基線長探索(一般セッション2,三次元画像,多視点画像)
- 人工筋肉を利用したヘビ型水中推進ロボット
- 人工筋肉を利用したヘビ型推進ロボット
- 追従型高速ステレオビジョンシステムを用いた移動物体の形状復元(一般セッション(5))(ユビキタスコンピューティングのためのパターン認識・理解)
- D-12-145 超高速ステレオヘッドの冗長自由度の制御
- D-12-135 超高速ビジョンシステムと高速リニアスライダを用いた物体追跡
- コンピュータアニメーションによるサッカーシーンの再現
- 任意視点からサッカーシーンを復元する仮想カメラシステム
- 移動する選手から見たシーンの生成 : キャリブレーションと選字抽出の自動化
- 生体模倣の実時間ビジュアルトラッキングシステム
- 生体模倣の実時間ビジュアルトラッキングシステム
- 視覚障害者向け商品情報取得システム
- 視覚障害者の共有資料観覧支援システム
- 生物に示唆を得た選択的注意による視聴覚事象の対応付け手法
- 事前学習を用いないオンラインでの話者識別(聴覚・音声・言語とその障害,一般)
- 物体操作による視聴覚事象の対応付け
- 旋削自動プログラミングにおける同時加工順序のプランニング
- 盲人の空間認知に関する実験的考察(バリアフリーインタフェース)
- 類似画像検索における部分教師付き特徴次元圧縮
- NC2000-43 神経回路を用いた音源定位能力の自己組織的獲得
- 両眼網膜像の不一致検出と奥行き推定過程に基づいたサッカード機構 : 注視位置とサッカード間隔の評価
- テクスチャの有無による物体注視時のサッカード駆動スキーマの違い : サッカード間隔の評価 : 視聴覚技術
- 10-2 初期視覚での両眼網膜像の不一致検出
- リム注視時の両眼の注視位置の分布 : 円柱の上面が見える時
- リムオクルージョンに誘発される両眼の注視位置の変化
- 7-4 円柱上面の見えによる両眼リム注視位置の変化
- 大規模コーパスに基づいた未登録語の傾向分析
- 5ZD-6 聴覚障がい者向け情報保障のための講師発話からの指示語抽出手法の検討(障碍者補助・福祉,学生セッション,インターフェース)
- 遠隔PC要約筆記のための指示発話と動作の関連性分析(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 遠隔PC要約筆記のための指示発話と動作の関連性分析(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 遠隔PC要約筆記のための指示発話と動作の関連性分析(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- スリット提示の視認性の検討(ヒューマンインフォメーション, ITS画像処理,映像メディア及び一般)
- 物体操作による視聴覚事象の対応付け(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- 物理法則に基づく視聴覚情報の対応付け
- 物理法則に基づく視聴覚情報の対応付け
- 物理法則に基づく視聴覚情報の対応付け
- 近似Chamfer距離とカーネル部分空間を用いたシルエット画像からの三次元人物姿勢推定(顔・ジェスチャの認識理解(1),顔・ジェスチャの認識・理解)
- 近似Chamfer距離とカーネル部分空間を用いたシルエット画像からの三次元人物姿勢推定(顔・ジェスチャの認識理解(1),顔・ジェスチャの認識・理解)
- 検索 : 組合せ法を用いた単眼画像からの三次元人物姿勢推定(テーマ関連セッション2)
- 検索-組合せ法を用いた単眼画像からの三次元人物姿勢推定(テーマ関連セッション,事例ベースメディア解析)
- 実環境音源分離におけるフィルタタップ数の低減手法
- 実環境音源分離におけるフィルタタップ数の低減手法
- A-10-6 マイクの近接配置による音源分離の性能評価と考察
- 運動で生じた視聴覚事象の対応付け(映像メディアおよび一般 : インターネット, デジタル放送, マルチメディア, 三次元画像, 視覚と画質評価, ITS等)