単語の文脈一貫性を用いた音声ドキュメント認識信頼度の推定
スポンサーリンク
概要
- 論文の詳細を見る
本研究では,音声ドキュメントに対して信頼度を付与する方法を提案する。提案法では音声ドキュメント認識結果中の数発話を含む範囲を見渡して得られる単語の文脈一貫性を信頼度推定に利用する。文脈一貫性は内容語間の自己相互情報量(PMI:Pointwise mutual information)を用いて定式化される。PMIの計算ではデータスパースネスに起因する二つの問題が生じるため,我々は双方の問題に対処するPMI平滑化法も提案する。実験により,提案する音声ドキュメント認識信頼度が各ドキュメントの認識率と高い相関を示すこと,信頼度による音声ドキュメント棄却が後段の検索精度を向上させることを確認した。
- 2012-07-01
著者
-
政瀧 浩和
日本電信電話株式会社NTTサイバースペース研究所
-
小橋川 哲
日本電信電話株式会社,NTTサイバースペース研究所
-
高橋 敏
日本電信電話株式会社,NTTサイバースペース研究所
-
山口 義和
日本電信電話株式会社 Nttサイバースペース研究所
-
浅見 太一
東京工業大学大学院情報理工学研究科計算工学専攻
-
浅見 太一
日本電信電話株式会社 Nttサイバースペース研究所
-
高橋 敏
日本電信電話株式会社 Nttサイバースペース研究所
-
野本 済央
日本電信電話株式会社 Nttサイバースペース研究所
-
政瀧 浩和
日本電信電話株式会社 Nttサイバースペース研究所
-
小橋川 哲
日本電信電話株式会社nttサイバースペース研究所
-
小橋川 哲
日本電信電話株式会社 Nttサイバースペース研究所
-
政瀧 浩和
日本電信電話株式会社, NTTサイバースペース研究所
関連論文
- 音声認識を用いた会議情報保障支援システムの社内会議における検証(聴覚と福祉情報工学・一般)
- 音声認識による会議支援情報保障システム使用時の話者及び訂正者の負担度の評価(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 音声デザインツールSesign
- ハイブリッドスケーラブル型音声合成方式
- 音声認識を用いた会議情報保障支援システムにおける話者と訂正者の連携支援機能の評価(聴覚と福祉情報工学・一般)
- 音声認識を用いた会議支援情報保障システムに対する話者の発話行動の分析(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- 音声認識を用いた会議情報保障支援システムにおける話者と訂正者の連携支援機能の評価
- 単語の文脈一貫性と音響尤度を用いた音声ドキュメント認識信頼度の推定(認識,理解,対話,一般)
- 韻律的特徴と対話的特徴を用いた怒り通話音声の抽出(認識,理解,対話,一般)
- 単語音声認識における音素信頼度ゆう度を用いた未知語のリジェクション
- 話者照合機能を備えた音声秘書システム
- 音素信頼度尤度を用いたリジェクションの高精度化
- 公衆電話音声に対する音声認識性能評価
- 対立音素間の尤度差に基づく信頼度尺度によるリジェクション
- 対立音素間の尤度差に基づく信頼度尺度によるリジェクション
- 対立音素間の尤度差に基づく信頼度尺度によるリジェクション
- 語学訓練のためのHMM音声認識を用いた発声評価尺度
- 部分的尤度分布の差に着目した未知語のリジェクション
- マルチストリーム話者照合におけるブースティングに基づく閾値最適化法の検討(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- マルチストリーム話者照合におけるブースティングに基づく閾値最適化法の検討(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- マルチストリーム話者照合におけるブースティングに基づく閾値最適化法の検討(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- マルチストリーム話者照合におけるブースティングに基づく重み最適化法の検討(ポスターセッション)(第6回音声言語シンポジウム)
- マルチストリーム話者照合におけるブースティングに基づく重み最適化法の検討(ポスターセッション)(第6回音声言語シンポジウム)
- マルチストリーム話者照合におけるブースティングに基づく重み最適化法の検討(ポスターセッション)(第6回音声言語シンポジウム)
- 雑音に頑健な話者照合のための基本周波数情報の利用(認識・理解・対話)
- 雑音に頑健な話者照合のための基本周波数情報の利用(認識・理解・対話)
- 音響モデルの分布数削減のための混合重み係数を考慮した分布間距離尺度(研究速報)
- ケプストラム正規化の実行単位に関する実験的検証(研究速報)
- コンタクトセンタ向け音声処理技術の展開 (特集 コンタクトセンタ業務に革新をもたらす音声処理技術)
- 学習移動ベクトルの相関関係を用いた音響モデルの話者適応化
- 4階層共有構造の音響モデルによる音声認識
- 音声認識エンジンREXの開発
- 雑音適応におけるTaylor展開の2次微分項の導入による効果
- 離散混合分布型HMMにおける量子化方法の検討
- Jacobian適応法による雑音適応の性能評価
- Jacobi行列を用いた音響モデルの適応アルゴリズム
- Taylor展開による音響モデルの適応
- Taylor展開による音響モデルの適応
- Taylor展開に基づく高速な音響モデル適応法
- スペクトルサブトラクションとNOVO合成を用いた雑音下音声認識
- 典型的な応対フレーズ検出に基づく高精度用件フェーズ抽出手法 (音声)
- 音源分離方式SAFIAを用いた高騒音下における近接音源の分離抽出(電気音響, 音響一般)
- チャネル間情報を利用した音源分離手法(SAFIA)による混合音声の認識
- 時間非同期ビーム探索に基づく第二パスを用いた連続音声確認(音声処理技術のデモの紹介)
- 音声認識による会議支援情報保障システム使用時の話者及び訂正者の負担度の評価(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 音声認識による会議支援情報保障システム使用時の話者及び訂正者の負担度の評価(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 小学生音声データベースを用いた子供音声認識の検討(音声,聴覚)
- D-14-15 日本人英語音声認識における話者適応の検討
- 小学生音声データベースの構築とそれを用いた子供音声認識の一検討
- 小学生音声データベースの構築と評価
- 音声認識エンジンVoiceRexによるニュース放送音声認識
- マルチメディア時代を支える音声認識技術 (特集論文 メディア処理技術)
- 音声認識エンジンVoiceRexの開発
- 音声認識エンジンVoiceRexを開発--幅広い応用に対応できる音声認識ソフトウェア (特集 ここまできた音声認識・音声合成)
- 典型的な応対フレーズ検出に基づく高精度用件フェーズ抽出手法(音声・音響一般,一般,オーガナイズドセッション(雑音を消せ!騒音下で有効な音声信号処理とは))
- 表現豊かな音声合成の為のテキストからの句末音調ラベルの予測(音声合成,第13回音声言語シンポジウム)
- 表現豊かな音声合成の為のテキストからの句末音調ラベルの予測(音声合成,第13回音声言語シンポジウム)
- 単語の文脈一貫性を用いた音声ドキュメント認識信頼度の推定
- 単語の文脈一貫性を用いた音声ドキュメント認識信頼度の推定
- 異なる体系を接続するための識別モデルを用いた形態素変換法(自然言語処理)
- 発話の時間的関係性を用いた対話音声からの怒り感情推定(ヒューマンコミュニケーション基礎,ヒューマンコミュニケーション〜人にやさしい情報通信社会を実現するコミュニケーション技術〜論文)
- 表現豊かな音声合成の為のテキストからの句末音調ラベルの予測
- 表現豊かな音声合成の為のテキストからの句末音調ラベルの予測
- テキストからの表現豊かな音声合成のための句末上昇ラベル予測における句末コンテキストの利用
- テキストからの表現豊かな音声合成のための句末上昇ラベル予測における句末コンテキストの利用
- 文脈類似度と認識信頼度に基づく音声認識辞書の自動語彙適応(言語モデル・音声対話)
- 異なる体系を接続するための識別モデルを用いた形態素変換法
- 発話の時間的関係性を用いた対話音声からの怒り感情推定