会議音声の自動話題分割による単語辞書と言語モデルの適応(要約・分割)
スポンサーリンク
概要
- 論文の詳細を見る
広範な話題からなる会議音声を話題単位に自動分割し,得られた話題ごとに単語辞書と言語モデルの適応を行う手法を提案する.音声認識結果に対してPLSA(Probabilistic Latent Semantic Analysis)を通用して,話題を表す特徴ベクトルに変換し,その類似度に基づいて話題分割を行う.そして,話題ごとに類似したテキストを収集して,単語辞書を更新するとともにN-gram言語モデルの適応を行う.衆議院予算委員会の音声で評価を行った結果,提案手法により単語辞書・言語モデルの適応を行うことで,ベースラインから未知語率を約25%,テストセットパープレキシティを約9%削減することができた.
- 社団法人情報処理学会の論文
- 2006-07-07
著者
-
秋田 祐哉
京都大学学術情報メディアセンター
-
秋田 祐哉
京都大学 情報学研究科 知能情報学専攻
-
河原 達也
京都大学 情報学研究科
-
根本 雄介
京都大学 情報学研究科 知能情報学専攻
-
根本 雄介
京都大学大学院情報学研究科
-
河原 達也
京都大学 学術情報メディアセンター
-
秋田 祐哉
京都大学 情報学研究科
関連論文
- 会議録作成支援のための国会審議の音声認識システム (画像符号化・映像メディア処理レター特集)
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(第8回音声言語シンポジウム)
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 会議録作成支援のための国会審議の音声認識システム(音声,聴覚)
- 音声対話による大規模知識ベース検索システム : 音声版ダイアログナビ(音・音声インタフェース)
- 講義音声認識に基づくノートテイクシステム(福祉と音声処理,一般)
- 話し言葉の整形作業における削除箇所の自動同定(音声言語処理)
- 局所的な係り受けと韻律の素性を用いた話し言葉の節・文境界推定(話し言葉処理)
- 話し言葉における引用節・挿入節の自動認定および係り受け解析への応用
- フレーズスポッティングと意味解析の密結合による頑健な音声言語理解
- 音声理解システムにおける制約緩和法の検討
- 会議音声の自動話題分割による単語辞書と言語モデルの適応(要約・分割)
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 頑健な音声認識のためのウエーブレットパラメータの最適化に基づく残響抑圧
- ポッドキャストを対象とした音リアクションイベント検出
- 文脈を考慮した確率的モデルによる話し言葉の整形
- 国会音声認識システムの音響・言語モデルの半自動更新
- 文脈を考慮した確率的モデルによる話し言葉の整形(音声検索・要約,第11回音声言語シンポジウム)
- スライド情報を用いた言語モデル適応による講義音声認識
- スライド情報を用いた言語モデル適応による講義の音声認識と字幕付与(一般セッション「音声言語処理」)
- スライド情報を用いた言語モデル適応による講義の音声認識と字幕付与(一般セッション「音声言語処理」)
- 講義音声認識のためのスライド情報を用いた言語モデル適応
- 文書検索型音声対話システムにおけるベイズリスクに基づく対話制御の最適化(セッション3 : 理解るインタフェース : 音声対話)
- 文書検索型音声対話システムにおけるベイズリスクに基づく対話制御の最適化(セッション3 : 理解るインタフェース : 音声対話)
- ドメインとスタイルを考慮したWebテキストの選択による対話システム用言語モデルの構築(第8回音声言語シンポジウム)
- ドメインとスタイルを考慮した Web テキストの選択による対話システム用言語モデルの構築
- ドメインとスタイルを考慮したWebテキストの選択による対話システム用言語モデルの構築(Session-7 システム,第8回音声言語シンポジウム)
- ドメインとスタイルを考慮したWebテキストの選択による対話システム用言語モデルの構築(Session-7 システム,第8回音声言語シンポジウム)
- ドメインとスタイルを考慮した Web テキストの選択による対話システム用言語モデルの構築
- 限定されたドメインにおける質問応答機能を備えた文書検索・提示型対話システム(検索・対話)
- 音声会話コンテンツにおける聴衆の反応に基づいたホットスポットの抽出
- 講義音声認識に基づくノートテイクシステム(福祉と音声処理,一般)
- 点予測による形態素解析
- 連続音声認識コンソーシアムの活動報告及び最終版ソフトウェアの概要(プロジェクト紹介(2))(第5回音声言語シンポジウム)
- 局所的な係り受けの情報を用いた話し言葉の節・文境界の推定
- 隣接文節間の係り受け情報に着目した話し言葉のチャンキングの評価
- 視覚情報を話題の対象とする音声対話システム
- 視覚情報を話題の対象とする音声対話システム
- 統計的言語モデル変換を用いた音響モデルの準教師つき学習
- 会議録作成支援のための国会審議の音声認識システム(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 会議録作成支援のための国会審議の音声認識システム(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 会議録作成支援のための国会審議の音声認識システム(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 2000-SLP-31-11 種々のタスクにおける大語彙連続音声認識システムの性能評価と診断
- VoiceXMLの動的生成に基づく自然言語音声対話システム
- VoiceXMLの動的生成に基づく自然言語音声対話システム
- 講義の自動アーカイブ化のための韻律情報を用いた講義音声の文境界の抽出
- 日本語モーラリズム習得支援システム : 調音法に基づいたリズムパターンテンプレートの設定
- 統計的言語モデル変換を用いた音響モデルの準教師付き学習
- ICSLPにおける研究動向 : 言語モデル・対話システムを中心に(第8回音声言語シンポジウム)
- ICSLPにおける研究動向 : 言語モデル・対話システムを中心に
- ICSLPにおける研究動向 : 言語モデル・対話システムを中心に(Session-7 システム,第8回音声言語シンポジウム)
- ICSLPにおける研究動向 : 言語モデル・対話システムを中心に(Session-7 システム,第8回音声言語シンポジウム)
- ICSLPにおける研究動向 : 言語モデル・対話システムを中心に
- ICSLPにおける研究動向 : 言語モデル・対話システムを中心に
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出
- 柔軟な言語モデルとマッチングを用いた音声によるレストラン検索システム
- 文脈を考慮した確率的モデルによる話し言葉の整形 (音声)
- ICASSP2007報告(研究動向を探るセッション)
- 言語モデルと発音辞書の統計的話し言葉変換に基づく国会音声認識(音声認識・識別,第9回音声言語シンポジウム)
- 言語モデルと発音辞書の統計的話し言葉変換に基づく国会音声認識(音声認識・識別,第9回音声言語シンポジウム)
- 言語モデルと発音辞書の統計的話し言葉変換に基づく国会音声認識(音声認識・識別,第9回音声言語シンポジウム)
- 話し言葉の整形作業における削除箇所の自動同定(音声言語処理)
- 音声言語を用いた仮想空間との対話による試着システム
- 大学講義のノートテイク支援のための音声認識用言語モデルの適応(言語モデル)
- 統計的機械翻訳の枠組みに基づく言語モデルの話し言葉スタイルへの変換(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 統計的機械翻訳の枠組みに基づく言語モデルの話し言葉スタイルへの変換(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 統計的機械翻訳の枠組みに基づく言語モデルの話し言葉スタイルへの変換(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 話し言葉音声認識のための汎用的な統計的発音変動モデル(音声, 聴覚)
- 大語彙連続音声認識を用いた落語のリアルタイム字幕付与(認識, 信頼度)
- 国会音声認識のための発音モデル生成と言語モデル適応
- 『日本語話し言葉コーパス』を用いた汎用的な発音変動モデルの統計的学習(音声言語情報処理一般)(テーマ:音声対話システム、音声言語情報処理、一般)
- 多数話者モデルを用いた討論音声の教師なし話者インデキシング(音声,聴覚)
- 話題と話者に関するPLSAに基づく言語モデル適応(言語モデル・要約)(第5回音声言語シンポジウム)
- 話題と話者に関するPLSAに基づく言語モデル適応(第5回音声言語シンポジウム : 言語モデル・要約)
- 話題と話者に関するPLSAに基づく言語モデル適応(第5回音声言語シンポジウム : 言語モデル・要約)
- 討論音声認識のための言語モデルと音響モデルの適応の検討
- 討論音声を対象とした、話者モデル選択による話者インデキシングと自動書き起こし
- 討論音声を対象とした話者モデル選択による話者インデキシングと自動書き起こし
- 討論音声を対象とした話者モデル選択による話者インデキシングと自動書き起こし
- 談話標識の抽出に基づいた講演音声の自動インデキシング(音声言語情報処理とその応用)
- Web からの情報抽出を用いた音声対話システム
- 文書検索タスクにおける検索要求明確化のための対話戦略
- 音声対話理解のためのネットワーク上のMessage Passingに基づく部分文解析
- 統計的言語モデル変換を用いた音響モデルの準教師付き学習(音声,聴覚)
- 談話標識の統計的選択に基づいたCSJの講演からの重要文抽出(言語モデル・要約)(第5回音声言語シンポジウム)
- 談話標識と話題語に基づく統計的尺度による講演からの重要文抽出(自然言語情報処理研究会と一部合同開催 : NL・SLP合同開催 : 音声対話1)
- 講演に対する読点の複数アノテーションに基づく自動挿入
- 談話標識の抽出に基づいた講演音声の自動インデキシング
- 談話標識の抽出に基づいた講演音声の自動インデキシング
- 多数話者音声データベースを用いた討論音声の教師なし話者インデキシング
- 会議音声の自動アーカイブ化システム
- 会議音声の自動アーカイブ化システム
- 会議音声の自動アーカイブ化システム
- 予稿の話し言葉変換に基づく言語モデルによる講演音声認識 (言語理解とコミュニケーション)
- 予稿の話し言葉変換に基づく言語モデルによる講演音声認識 (音声)
- 予稿の話し言葉変換に基づく言語モデルによる講演音声認識(言語モデル・辞書,第13回音声言語シンポジウム)
- 予稿の話し言葉変換に基づく言語モデルによる講演音声認識(言語モデル・辞書,第13回音声言語シンポジウム)
- 講演に対する読点の複数アノテーションに基づく自動挿入
- 予稿の話し言葉変換に基づく言語モデルによる講演音声認識
- 予稿の話し言葉変換に基づく言語モデルによる講演音声認識