連続音声認識候補受理・リジェクションのためのワードスポッティング仮説検証手法(システム・信頼度)(第5回音声言語シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
音声認識での単語リジェクション問題は単語スポッティングの枠組みで定式化できる.スポッティングされた単語は2値判定,つまり,受理またはリジェクト判定される.信頼尺度として用いられる一般化された単語事後確率(Generalized Word Posterior Probability, GWPP)は,forward-backwardアルゴリズムによって単語グラフ内で計算されるか,または文ゆう度を用いてNベストリストにおいて計算される.さらに,同じ単語IDを持ち,時間的に重なるスポッティングされた単語すべてを組み込むことでGWPPを拡張する.日本語BTEC音声データベースでの評価により,信頼誤り率は2つの評価セツトに対し,それぞれ23.76%から17.78%,20.18%から15.57%へ著しく減少した.
- 2003-12-18
著者
-
Lo Wai-kit
Atr 音声言語コミュニケーション研究所
-
SOONG Frank
ATR 音声言語コミュニケーション研究所
-
中村 哲
ATR 音声言語コミュニケーション研究所
-
中村 哲
独立行政法人情報通信研究機構|株式会社国際電気通信基礎技術研究所
関連論文
- 23aBC-14 0.67〜0.92GeV光子ビームを用いた重水素からの2π光生成反応の研究(23aBC 実験核物理領域,理論核物理領域合同 ハドロン構造・相互作用・中間子生成(合同),実験核物理領域)
- 23aBC-13 γp→pπ^+π^-反応を用いたNKS2システムの性能評価(23aBC 実験核物理領域,理論核物理領域合同 ハドロン構造・相互作用・中間子生成(合同),実験核物理領域)
- 22pBS-5 中性K中間子スペクトロメータ中心部検出器の性能評価(22pBS 検出器III,実験核物理領域)
- 20aBD-3 JLab Hall C第3世代(e,e'K^+)ラムダハイパー核分光実験のためのK中間子スペクトロメータの性能評価(20aBD 理論核物理領域,実験核物理領域合同 ハイパー核・ストレンジネスI(合同),理論核物理領域)
- A-16-18 Blendshapesによるリップシンクアニメーションのためのキーフレーム削除法(A-16.マルチメディア・仮想環境基礎,一般講演)
- Water, Livelihood and Health in Attapeu Province in Lao PDR
- 京都観光案内対話コーパスにおける対話行為タグの設計と分析(理解)
- 同調的対話システム構築のための音声対話コーパスの構築(「ユニバーサルコミュニケーションを実現するための言語処理技術」シンポジウム)
- 30aSG-3 閾値領域でのn(γ,K^0)Λ反応測定によるK^0生成素過程の研究(30aSG 中高エネルギー重イオン・中間子生成・検出器II,実験核物理領域)
- 携帯型端末を用いた音声自動翻訳システムとフィールド実験(モバイルと放送の融合時代を迎えて(1セグ放送, モバイル放送, 携帯放送融合サービス, 1セグ対応携帯端末, モバイルコンテンツと放送コンテンツの融合, マルチメディア配信, ディジタル放送受信機, および一般))
- NICT知識創成コミュニケーション研究センターの研究と高度言語情報融合フォーラム(ALAGIN)の活動について(Web情報処理,Webとデータベースに関する技術報告)
- 28pSG-6 電子線を用いたハイパー核分光実験(JLab EO5-115)用水チェレンコフ検出器の開発(28pSG ハイパー核・検出器I,実験核物理領域)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(3)(SIG-SLP内組織の活動報告)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(2)(雑音・VAD,第9回音声言語シンポジウム)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境 (2)(雑音・VAD,第9回音声言語シンポジウム)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(第8回音声言語シンポジウム)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(Session-1 検出,第8回音声言語シンポジウム)
- 22pBS-6 (e,e'K^+)ラムダハイパー核分光実験のためのPMT磁場キャンセル装置(22pBS 検出器III,実験核物理領域)
- 20aBD-4 (e,e'K^+)反応を用いたJLab-HallC第三世代ラムダハイパー核分光実験(20aBD 理論核物理領域,実験核物理領域合同 ハイパー核・ストレンジネスI(合同),理論核物理領域)
- 20aBD-2 (e,e'K^+)反応を用いたハイパー原子核分光実験への散乱電子側高分解能スペクトロメータHESの導入と成果(20aBD 理論核物理領域,実験核物理領域合同 ハイパー核・ストレンジネスI(合同),理論核物理領域)
- 30aSG-5 NKS2実験におけるTULを用いたトリガー及びDAQシステムの開発(30aSG 中高エネルギー重イオン・中間子生成・検出器II,実験核物理領域)
- 30aSG-4 NKS2実験用ニューヴァーテックスチェンバーシステムの開発(30aSG 中高エネルギー重イオン・中間子生成・検出器II,実験核物理領域)
- 27aSJ-5 第三世代(e,e'K^+)原子核分光実験JLab E05-115の準備状況(27aSJ 実験核物理領域,理論核物理領域合同 ハイパー核・ストレンジネス(合同)I,実験核物理領域)
- 音声認識における頑健性 : 音響分析・音響モデル,なにが課題か(企画)
- NICTにおける音声・言語研究拠点MASTARプロジェクトについて(「ユニバーサルコミュニケーションを実現するための言語処理技術」シンポジウム)
- 音声翻訳単位の推定における句読点情報の効果(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 多チャンネル三次元音場再現システムの再生方式の違いによる再現性能評価
- マルチモーダル音声言語処理とその応用(マルチモーダル)
- 音声翻訳研究20年の夜明け : 受賞業績 携帯電話によるネットワーク型コーパスベース音声翻訳システムの構築(平成19年度喜安記念業績賞紹介)
- 同時通訳者の知識と韻律情報を用いた講演文章のチャンキング(チャンキング・要約)
- 2D-5 多言語音声翻訳基盤の通信インタフェースの検討と構築(音声対話・翻訳,一般セッション,人工知能と認知科学)
- ストーリへの没入感を実現するダイブイントゥザムービープロジェクト(テーマ関連/オーガナイズドセッション)
- ストーリへの没入感を実現するダイブイゥザムービープロジェクト(オーガナイズドセッション,CV/PR技術のVRへの応用)
- 5.効率的アニメ制作支援のための3次元CG技術(情報技術が支えるアートとコンテンツの世界)
- CENSREC-1-C : 雑音下音声区間検出評価基盤の構築
- マルチモーダル対話システムのための階層的アーキテクチャの提案
- 連続音声認識候補受理・リジェクションのためのワードスポッティング仮説検証手法(システム・信頼度)(第5回音声言語シンポジウム)
- 統計的対話モデルを用いたWFSTに基づく音声対話システム
- 同調的対話を実現するプロトタイプシステムの開発(対話・インタフェース・インタラクション)
- SLP雑音下音声認識評価WG活動報告 : 評価用データと評価手法について(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 実走行車内音声認識の評価データベースCENSREC-3とその共通評価ベースライン
- 実走行車内単語音声データベースCENSREC-3と共通評価環境の構築
- CENSREC-3 : 実走行車内単語音声データベースと評価環境の構築(ポスターセッション)(第6回音声言語シンポジウム)
- 実環境下音声認識の評価の標準化とその動向(音声・言語における標準化動向)(第6回音声言語シンポジウム)
- AURORA-2Jを用いたETSI STQ Aurora WI008 Advanced DSR Frontendの評価(ポスターセッション)(第5回音声言語シンポジウム)
- 歩行者支援GISにおける音声入力インタフェースの検討(福祉と言語処理/一般)
- 雑音環境下での音声の聞き取り実験による合成発話顔アニメーションの評価(コンピュータグラフィックス(CG)基礎)
- 雑音環境下における合成発話アニメーションの評価(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- D-14-6 次世代情報家電への音声インタフェースの導入に関する検討(D-14.音声・聴覚,一般講演)
- 音声翻訳単位の推定における句読点情報の効果(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 音声翻訳単位の推定における句読点情報の効果(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 来場者の声の特徴を反映する映像エンタテインメントシステムのための台詞音声生成システム
- iFACe:デジタルアニメ声優体験システム
- 携帯型端末を用いた音声自動翻訳システムとフィールド実験
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(2)(雑音・VAD,第9回音声言語シンポジウム)
- 個人の音声を反映する映像エンタテインメントシステム
- QAシステムのための音声入力インターフェース
- 音声認識の信頼度・複数候補を利用したWFST対話システムの評価
- 雑音下マルチモーダル音声認識評価基盤CENSREC-1-AVの構築
- 座談会 : 音声研究を語る : (小特集:)
- 相談型対話のモデル化と対話戦略の最適化
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(Session-1 検出,第8回音声言語シンポジウム)
- CENSREC-2 : 実走行車内における連続数字音声データベースと評価環境の構築
- 自動車内における連続数字音声コーパスCENSREC-2の設計と評価(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- Switching dynamical systemとパーティクルフィルタを用いた非定常雑音の逐次推定(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- 自動車内における連続数字音声コーパスCENSREC-2の設計と評価(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- SLP雑音下音声認識評価WG活動報告 : 評価用データと評価手法について(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 自動車内における連続数字音声コーパスCENSREC-2の設計と評価(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- SLP雑音下音声認識評価WG活動報告 : 評価用データと評価手法について(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- Switching dynamical systemとパーティクルフィルタを用いた非定常雑音の逐次推定(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- Switching dynamical systemとパーティクルフィルタを用いた非定常雑音の逐次推定(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- 歩行者支援地理情報システムにおける音声入力インタフェースと高齢者に対するその評価
- 高齢者を対象とした音声入力インタフェース評価および対話実験
- 歩行者支援GISにおける音声入力インタフェースの検討(福祉と言語処理/一般)
- 12pSK-5 (e,e'K^+)反応を用いた第三世代ラムダハイパー核分光実験における高計数率下での検出器の効率について(12pSK 検出器III,実験核物理領域)
- 11pSF-2 (e,e'K^+)反応を用いたJLab-HallC第三世代ラムダハイパー核分光実験の解析状況(11pSF 実験核物理領域,理論核物理領域合同 ストレンジネス・中間子生成・ハドロン構造(合同),実験核物理領域)
- HMM/BN音響モデルの設計と実装
- HMM/BN音響モデルの設計と実装(国際ワークショップ"Beyond HMM")
- HMM/BN音響モデルの設計と実装(国際ワークショップ"Beyond HMM")
- 雑音や発話スタイルの変動に頑健な日本語大語彙連続音声認識
- 擬人化音声対話エージェント基本ソフトウェアの開発プロジェクト報告(プロジェクト紹介(2))(第5回音声言語シンポジウム)
- 擬人化音声対話エージェント基本ソフトウェアの開発プロジェクト報告(第5回音声言語シンポジウム : プロジェクト紹介(2))
- モーションキャプチャシステムを用いたマルチモーダル音声コーパスの構築(セッション2)(インタラクション・メディア)
- 一般化事後確率を用いた異なるレベルの大語彙連続音声認識出力の検証
- 一般化事後確率を用いた異なるレベルの大語彙連続音声認識出力の検証
- 一般化事後確率を用いた異なるレベルの大語彙連続音声認識出力の検証(大語彙音声認識)(第6回音声言語シンポジウム)
- 一般化事後確率を用いた異なるレベルの大語彙連続音声認識出力の検証(大語彙音声認識)(第6回音声言語シンポジウム)
- 離散HMMを用いた統計的な発音辞書
- F0パターンの自動推定と目標点の抽出(第8回音声言語シンポジウム)
- 一般化事後確率を用いた異なるレベルの大語彙連続音声認識出力の検証(大語彙音声認識)(第6回音声言語シンポジウム)
- 音節強調された英語音声の認識
- 音場の局所化技術を応用した指向性スピーカシステムの試作と評価
- CENSREC-3 : 実走行車内単語音声データベースと評価環境の構築(ポスターセッション)(第6回音声言語シンポジウム)
- 中国語音韻バランス用文セットの選択手法
- クラスタされた音響モデルによる中国語音声認識
- CORBA 用音声翻訳システム
- 複数トピック分類の信頼度に基づくドメイン外発話の検出(システム・信頼度)(第5回音声言語シンポジウム)
- 誤認識時の言い直し発話における発話スタイルの変動に頑健な音響モデル構築法(音声,聴覚)
- 自然発話音声における音節強調発声に頑健な音響モデルの構築法
- マイクロホン対を用いた雑音除去法における空間分解能と演算精度を考慮した最適対選択法