連続音声認識からの概念表現の作成
スポンサーリンク
概要
- 論文の詳細を見る
音声入力を自動通訳システム、音声QAシステム等に使用する場合は入力音声の一言一句を明らかにするのが主な目的ではなく、むしろ入力音声の意味を取り出すことすなわち入力音声の理解が必要となる。従来、これらのシステムを実現するためには、入力された音声を音声認識によって文字列に変換した後、入力音声の意味を抽出していた。しかしこの方法を用いると、解析のための多くの計算量や辞書情報が必要とされ、また解析誤りも生じやすい。入力された音声の意味を解析せずに抽出する方式としては文献がある。この方式では、タスクを限定し、音声認識用のネットワーク上の各単語に意味情報を付与し認識結果として、解析を行なうことなしにその意味構造を出力する。一方、文の意味を表す枠組として機械翻訳等で用いられている中間言語がある。この中間言語はタスクに依存せずに記述できるので、入力音声の意味を表すものとして用いることによっていろいろなタスクに容易に対応できる。本稿では、有限状態オートマトン等のネットワークを用いた連続音声認識において、ネットワーク内の各単語間の依存関係や素性情報等をあらかじめ記憶しておくことにより認識結果から中間表現を作成する方式を提案する。この方式を用いることにより、認識結果から構文解析、意味解析を改めて行なう必要がなくなり、かつ種々のタスクに対応することができるようになる。また、一言一句解析するのではないので文の意味を変えない範囲内であれば言い回しの自由度を増やすことが可能である。
- 一般社団法人情報処理学会の論文
- 1991-02-25
著者
-
渡辺 隆夫
日本電気(株)中央研究所
-
奥村 明俊
NECメディア情報研究所
-
奥村 明俊
日本電気(株)中央研究所共通基盤ソフトウェア研究所
-
奥村 明俊
日本電気(株)c&cメディア研究所
-
奥村 明俊
(nec C&c情報研究所)
-
坂井 信輔
日本電気(株)c&c情報研究所
-
畑崎 香一郎
日本電気(株) C&C情報研究所
-
畑崎 香一郎
Necメディア情報研究所
-
野口 淳
NEC・マルチメディア研究所
-
野口 淳
日本電気(株)C&C情報研究所
関連論文
- C&Cの夢,自動通訳の実現に向けて : 受賞業績 携帯端末など組込み機器向け多言語自動音声翻訳システムの実用化技術の開発(平成20年度喜安記念業績賞紹介)
- TREC-7参加報告
- 英日翻訳システムを基にした多言語翻訳システムの構築
- 5W1H情報を利用する情報分類・ナビゲーション
- 携帯端末向け大語彙連続音声認識システム(音声,聴覚)
- 音声による文章入力のための言語モデル適用法の検討
- F-9 大語彙音声認識を用いたPDA向け音声UIの試作(音声・音声言語情報処理,F.音声・音楽)
- PDAで動作する旅行会話向け日英双方向音声翻訳システム
- ビームサーチを用いた大語彙音声認識方式の検討
- LE-009 ロボットとの対話によるマルチメディアブログ創作と評価(自然言語・音声・音楽)
- G_010 映像コンテンツと関連文書の連携によるシーン検索システム(G分野:音声・音楽)
- LE-1 自由文通訳と例文選択型通訳を統合した自動通訳システム(E. 自然言語・文書)
- テキスト要約の複数の正解に基づいた評価
- PIVOT E-J : 英語解析部の構成
- PDAで動作する旅行会話向け日英双方向音声翻訳システム
- 自動通訳システムINTERTALKERにおける日本語音声合成
- AS-1-3 低消費電力マルチコアプロセッサで動作する大語彙連続音声認識とその応用(AS-1.マルチコアプロセッサ技術,シンポジウム)
- LG-003 携帯電話用プロセッサで動作する大語彙連続音声認識の並列処理(G分野:音声・音楽)
- 2D-2 携帯電話試作機上で動作する旅行会話向け自動通訳システムの開発(音声・音楽情報処理,一般セッション,人工知能と認知科学)
- マルチメディア要約 ビデオ要約向けの文認定手法 (リッチメディア・コンテンツ・マネジメント特集)
- 5W1H情報抽出・分類によるテキスト要約
- MIIDAS : 情報の選別とEasy Readingのためのエピソード
- MIIDAS:情報の適合的選別による文書フィルタリング
- MIIDAS : 情報の選別的共有のためのオントロジ構築とその増進的学習
- 5W1H分類・ナビゲーションによる情報活用プラットフォーム
- オントロジによる多次元情報集配信
- 日本語入力による英文作成支援インタフェース
- パソコン向け音声認識合成プラットフォームの構築とアプリケーションの試作
- 音声認識・合成カスタムコントロールの開発
- 音声認識/合成ソフトウェアのAPI開発
- HMMの変分ベイズ学習によるテキスト文書の話題分割法(認識・理解・対話)
- HMMの変分ベイズ学習によるテキスト文書の話題分割法(認識・理解・対話)
- 文書参照/引用履歴を利用したノウハウ活用エージェント
- 大規模データのセルフナビゲーショナルアクセス : SPIRAL Method
- 概念表現を用いた自動通訳システムINTERTALKER
- E_031 自動通訳システムのユーザインタフェイスレベルでの統合(E分野:自然言語)
- 日本語文構造分類ツール
- 音声認識のためのスペクトルの調波構造の利用
- SNRの変動を考慮したスペクトルサブトラクションの検討
- 種々の電話機による音声認識性能の評価
- 環境変動を考慮した電話音声認識方式の種々の電話機による評価
- 雑音環境を考慮した自律型話者適応化
- 雑音環境の変動を考慮した話者適応化
- 音声認識のための高速環境適応
- 高速環境適応におけるコンパクト化の検討
- 雑音環境の変動に強い音声認識 (音声/オ-ディオ信号処理) -- (音声認識)
- 音声認識のための高速環境適応
- パソコン向け音声認識ソフトウェア
- 自動通訳システムINTERTALKERにおける音声認識
- 話し言葉認識に向けた基本技術と応用(抽出と解析)
- 話し言葉認識に向けた基本技術と応用(抽出と解析)
- F-10 2.5G携帯電話向け音声/Web連動型マルチモーダルUI(音声・音声言語情報処理,F.音声・音楽)
- 日本語入力による英文作成支援システム : 仮名漢字変換から仮名英語変換へ
- 英語の副詞のシンタクス
- 自然言語研究開発支援システム
- 機械翻訳技術による外国語学習支援
- PIVOT : 英語生成における主語選択と用言選択
- 半音節単位に基づく単語認識のためのワードスポッティング
- 半音節を用いたワードスポッティングによる単語認識
- 2D-3 携帯電話試作機上で動作する旅行会話向け音声認識システム(音声・音楽情報処理,一般セッション,人工知能と認知科学)
- バンドルサーチ法を用いた連続音声認識の高速化
- 日英双方向自動通訳システムINTERTALKER
- 自動通訳システム (音声ヒューマンインタフェース特集)
- 連続音声認識からの概念表現の作成
- 音声認識における自律的なモデル複雑度制御を用いた話者適応化(論文賞贈呈)
- 音声認識における自律的なモデル複雑度制御を用いた話者適応化
- 情報量基準を用いた音声認識単位の自動生成
- 記述長最小原理を用いた話者適応化
- パソコン向けソフトウェア連続音声認識システム
- パソコンソフト連続音声認識
- 木構造化された確率分布を用いた話者適応化
- 大語彙音声入力装置の開発
- 音声認識のためのスペクトル内挿を用いた話者適応化
- 話し言葉認識技術とその応用 (ユビキタス環境を活用し,企業競争力を向上させる「UNIVERGE」特集) -- (ソリューション)
- 半音節を単位とするHMMを用いた不特定話者音声認識
- 談話指標とテキスト長を用いた講演音声とプレゼンテーション資料の対応付け
- 講演音声とプレゼンテーション資料の対応付けによる講演検索
- 2P-5 コンパラブルコーパスによるキュエリタームの拡張とクロス言語検索
- 音声入力パソコンネットワーク旅客機空席案内試作システム
- 音声インタフェースを用いたパソコンネットフライト空席案内
- 音声認識におけるパタンマッチングの手法
- 文書作成過程の自動蓄積とその文章化
- 文書作成過程の自動蓄積とその文章化
- 文書作成過程の蓄積とノウハウの抽出
- 3P-13 5W1H情報の在否により結果を分類する情報検索システム
- コンパラブルコーパスと対訳辞書による日英クロス言語検索
- 非定形文書中の日程情報を自動配信するスケジュールリマインダ
- 情報配信オントロジおよび5W1H分類による情報活用環境の構築
- コンパラブルコーパスによる単語共起頻度を用いたクロス言語検索
- ノウハウ共有エージェントによる文書作成支援
- PIVOT J-E : 日本語複合語解析
- 音声入力を用いたパソコンネット旅客機空席案内システム
- パソコン音声認識ソフトウエアを用いた音声ダイヤラの試作
- 日本語音声合成のためのテキスト解析における形態素解析
- 電話音声対話システムビルダの開発
- PIVOT : 日本語接辞解析
- マルチメディア検索 マルチモーダルWebアクセス (リッチメディア・コンテンツ・マネジメント特集)
- 高速・高精度なコンパクト・スケーラブル自動通訳ソフトウェアの開発と実用性評価 (コンシューマ・デバイス&システム Vo.2 No.2)