複数トピック分類の信頼度に基づくドメイン外発話の検出(第5回音声言語シンポジウム : システム・信頼度)
スポンサーリンク
概要
- 論文の詳細を見る
音声言語システムにおいては,バックエンドシステムが受理できない発話(ドメイン外発話)への対処が問題となる.本稿では,このようなドメイン外発話の検出法の枠組みを新たに提案する.本手法は,複数トピックの分類の信頼度を用いて,ドメイン内検証モデルをGPD(Generalized Probabilistic Descent)により学習する。この学習は,ドメイン内データの削除補間に基づいて行うため,ドメイン外の実データを必要とせず,移植性が高い.トピック分類手法として3つの手法(単語N-gram,LSA,SVM)を比較した結果,SVMが最も高い識別能力を得た.ドメイン外検出タスクにおいて,提案手法は,トピック分類結果の単純な組合せによるベースライン法と比較して,6.5ポイントも検出誤り率を改善した.さらに,実際のドメイン外データを用いて学習したシステムと比較しても,ドメイン外データを使用しない提案手法によりほぼ同等の性能が得られることがわかった.
- 社団法人電子情報通信学会の論文
- 2003-12-12
著者
-
松井 知子
統計数理研究所
-
河原 達也
京都大学情報学研究科
-
松井 知子
Atr音声言語コミュニケーション研究所
-
松井 知子
Atr音声翻訳通信研究所
-
Lane Ian
京都大学情報学研究科
-
イアン レーン
京都大学情報学研究科知能情報学専攻:atr音声言語コミュニケーション研究所
-
レーン イアン
京都大学情報学研究科知能情報学専攻:atr音声言語コミュニケーション研究所
-
中村 哲
統計数理研究所
関連論文
- ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理技術の総合開発(総合報告)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- NAMセグメントを用いた個人認証法における未知話者データに対する頑健性の評価(聴覚・音声/一般)
- オンライン変分ベイズ学習に基づくモデル比較を用いた音声区間検出(認識)
- 会議録作成支援のための国会審議の音声認識システム(音声,聴覚)
- パターン認識手法によるWebユーザビリティの低いWebページの検出(セッション4A)
- モデル駆動アーキテクチャに基づくホームネットワークサービスの開発支援(学生セッション A_モデル指向(1))
- dPLRMによる対数パワースペクトルを用いた話者識別
- 話し言葉の整形作業における削除箇所の自動同定(音声言語処理)
- 局所的な係り受けと韻律の素性を用いた話し言葉の節・文境界推定(話し言葉処理)
- 日本語CALLシステムの音声認識における効果的な予測のための決定木に基づく誤りパターンの分類(一般(ポスターセッション),第9回音声言語シンポジウム)
- 日本語話し言葉の係り受け解析と文境界推定の相互作用による高精度化
- 『日本語話し言葉コーパス』における自己修復部(Dタグ)の自動検出および修正に関する検討(合同セッション「対話」)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- 点予測と系列予測の2段階化による品詞推定の精度向上
- 点予測と系列予測の2段階化による品詞推定の精度向上
- スロットベースのベクトル空間モデルの組合せによる音声書籍検索
- ウエーブレットの最適化と雑音プロファイルを用いた雑音抑圧による頑健な音声認識
- SuperHマイコンへの搭載を目的とした連続音声認識ソフトウェアJuliusの計算量削減
- 頑健な音声認識のためのウエーブレットパラメータの最適化に基づく残響抑圧
- ポッドキャストを対象とした音リアクションイベント検出
- 「ユビキタスアプリケーションを支えるツールキット」(全4回) : 第3回 Julius を用いた音声認識インタフェースの作成
- Spoken Term Detection のためのテストコレクション構築とベースライン評価
- 異種コーパスの組合せによるトリガー言語モデルの構築
- 異種コーパスの組合せによるトリガー言語モデルの構築
- 異種コーパスの組合せによるトリガー言語モデルの構築(言語モデル)(第6回音声言語シンポジウム)
- 異種コーパスの組合せによるトリガー言語モデルの構築(言語モデル)(第6回音声言語シンポジウム)
- 異種コーパスの組合せによるトリガー言語モデルの構築(言語モデル)(第6回音声言語シンポジウム)
- Webからの情報抽出を用いた音声対話システム
- 文脈を考慮した確率的モデルによる話し言葉の整形
- 重み付き有限状態トランスデューサーと対数線形モデルを用いた話し言葉の整形
- 国会音声認識システムの音響・言語モデルの半自動更新
- NTCIR-9 SpokenDoc: 音声検索語検出と音声ドキュメント検索の評価枠組の設計
- 音声中の検索語検出のためのテストコレクション構築 : 中間報告
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 頑健な音声認識のためのウエーブレットパラメータの最適化に基づく残響抑圧
- 文化と言語の維持保存に貢献するためのデジタル博物館の試みトランスクリプションデータを流用する字幕映像生成システムの提案
- 点予測による形態素解析
- 文化と言語の維持保存に貢献するためのデジタル博物館の試みトランスクリプションデータを流用する字幕映像生成システムの提案
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- 文脈を考慮した確率的モデルによる話し言葉の整形(音声検索・要約,第11回音声言語シンポジウム)
- 会議音声認識におけるBICに基づく高速な話者正規化と話者適応
- ベイズ推論を用いた連続音声からの言語モデル学習
- 音声認識エンジンREXの開発
- スライド情報を用いた言語モデル適応による講義の音声認識と字幕付与(一般セッション「音声言語処理」)
- スライド情報を用いた言語モデル適応による講義の音声認識と字幕付与(一般セッション「音声言語処理」)
- 単語の頻度と音響の特徴を利用したSVMによる無効入力の棄却
- 音声会話コンテンツにおける聴衆の反応に基づいたホットスポットの抽出
- ポッドキャストを対象とした音リアクションイベント検出
- ウイグル語の形態素に基づく言語モデルと音声認識システム
- Spoken Term Detection のためのテストコレクション構築とベースライン評価
- 3L-3 大規模文書を知識ベースとする音声対話システム(リーディングプロジェクト e-society:自然な音声対話処理技術(1),一般セッション,リーディングプロジェクト e-society)
- 文書検索システムにおけるベイズリスクに基づく対話戦略のオンライン学習(システム,第9回音声言語シンポジウム)
- 文書検索システムにおけるベイズリスクに基づく対話戦略のオンライン学習(システム,第9回音声言語シンポジウム)
- 文書検索システムにおけるベイズリスクに基づく対話戦略のオンライン学習(システム,第9回音声言語シンポジウム)
- 音声会話コンテンツにおける聴衆の反応に基づいたホットスポットの抽出
- 多次元尺度構成法を用いた複数音声コーパスの特徴可視化(言語とコーパス,思考と言語一般)
- 講義音声認識に基づくノートテイクシステム(福祉と音声処理,一般)
- 音声情報案内システムにおけるSVMを用いたタスク外発話の検出
- 局所的な係り受けの情報を用いた話し言葉の節・文境界の推定
- 多数のセンサを用いたポスター会話の収録とその分析(マルチモーダル)
- 係り受けとポーズ・フィラーの情報を用いた話し言葉の段階的チャンキング(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 係り受けとポーズ・フィラーの情報を用いた話し言葉の段階的チャンキング(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 係り受けとポーズ・フィラーの情報を用いた話し言葉の段階的チャンキング(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 視覚情報を話題の対象とする音声対話システム
- 音声版ダイアログナビ : 音声対話によるソフトウェアサポート(音声対話システムB)(テーマ:音声対話システム、音声言語情報処理、一般)
- 音声対話による大規模知識ベース検索システム : 音声版ダイアログナビ(音・音声インタフェース)
- 音声対話によるソフトウェアサポートタスクのための確認戦略
- 『日本語話し言葉コーパス』における自己修復部(Dタグ)の自動検出および修正に関する検討(合同セッション「対話」)
- 統計的言語モデル変換を用いた音響モデルの準教師つき学習
- HTMLのフォーム入力のための文法の自動生成とSALTによる実装
- 音声認識エンジンJulius/JulianのAPI実装
- VoiceXML の動的生成に基づく協調的な電話自動応答システム
- 統計的言語モデル変換を用いた音響モデルの準教師付き学習
- 音声中の検索語検出のためのテストコレクション構築 -中間報告-
- 柔軟な言語モデルとマッチングを用いた音声によるレストラン検索システム
- 柔軟な言語モデルとマッチングを用いた音声によるレストラン検索システム
- 2ZN-1 ポスター会話中の音リアクションイベントに基づくホットスポットの抽出(情報爆発時代における対話インタラクション,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 文強勢と等時性の自動検出に基づく英語韻律学習支援システム
- K-29 音声対話におけるオブジェクト同定のための曖昧性の解消(マルチメディア・仮想環境基礎1,K.ヒューマンコミュニケーション&インタラクション)
- 「統計科学のフロンティア11 計算統計I : 確立計算の新しい手法」, 汪金芳, 田栗正章, 手塚集, 樺島祥介, 上田修功著, 岩波書店, 2003年(私のすすめるこの一冊)(コーヒーブレーク)
- Web ユーザビリティの低いページにおけるインタラクションパターンの抽出
- 音声による個人認証 : 話者認識技術の研究動向
- 複数トピック分類の信頼度に基づくドメイン外発話の検出(システム・信頼度)(第5回音声言語シンポジウム)
- 複数トピック分類の信頼度に基づくドメイン外発話の検出(第5回音声言語シンポジウム : システム・信頼度)
- 複数トピック分類の信頼度に基づくドメイン外発話の検出(第5回音声言語シンポジウム : システム・信頼度)
- 複数トピック分類の信頼度に基づくドメイン外発話の検出
- 話題同定に基づく言語モデル切替えによる対話音声認識
- 話題同定に基づく言語モデル切替えによる対話音声認識
- 話題同定に基づく言語モデル切替えによる対話音声認識
- 話題同定に基づく言語モデル切替えによる対話音声認識
- 時期差による発声変動及び伝送歪みに頑健な話者照合
- 時期差による発声変動を考慮した話者モデルの生成法
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 話者認識で用いる機械学習(話者認識に関する研究の動向)