文脈を考慮した確率的モデルによる話し言葉の整形
スポンサーリンク
概要
- 論文の詳細を見る
自動音声認識 (ASR) の結果には認識誤りのみならず,言いよどみや口語的表現など,会議録にふさわしくない現象が多く含まれている.これらの現象を整形し,自然な会議録を作成するために,認識結果 (または忠実な書き起こし) と会議録を異なる言語とみなし,統計的機械翻訳を用いて認識結果から会議録へと "翻訳" する.本研究では,この枠組みの中で 2 つの手法を提案する.まず,文脈情報を考慮した翻訳モデルを導入し,システムのさらなる精度向上を目指す.また,翻訳モデルの条件付き確率と同時確率の対数線形補間を行うことで,高頻度の翻訳パターンを優先的に利用することを可能とする.有限状態トランスデューサー (WFST) による実装を行い,国会会議録と音声認識結果を用いた評価実験を行った.
- 2009-12-14
著者
-
森 信介
京都大学学術情報メディアセンター
-
秋田 祐哉
京都大学学術情報メディアセンター
-
河原 達也
京都大学情報学研究科
-
秋田 祐哉
京都大学情報学研究科
-
秋田 祐哉
京都大学 情報学研究科 知能情報学専攻
-
Neubig Graham
京都大学情報学研究科
-
森 信介
京都大学情報学研究科
-
Graham Neubig
京都大学情報学研究科
-
秋田 祐哉
京都大学
関連論文
- 擬似確率的単語分割コーパスによる言語モデルの改良
- ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理技術の総合開発(総合報告)
- 会議録作成支援のための国会審議の音声認識システム (画像符号化・映像メディア処理レター特集)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- オンライン変分ベイズ学習に基づくモデル比較を用いた音声区間検出(認識)
- 会議録作成支援のための国会審議の音声認識システム(音声,聴覚)
- モデル駆動アーキテクチャに基づくホームネットワークサービスの開発支援(学生セッション A_モデル指向(1))
- 講義音声認識に基づくノートテイクシステム(福祉と音声処理,一般)
- 話し言葉の整形作業における削除箇所の自動同定(音声言語処理)
- 局所的な係り受けと韻律の素性を用いた話し言葉の節・文境界推定(話し言葉処理)
- 日本語CALLシステムの音声認識における効果的な予測のための決定木に基づく誤りパターンの分類(一般(ポスターセッション),第9回音声言語シンポジウム)
- 日本語話し言葉の係り受け解析と文境界推定の相互作用による高精度化
- 『日本語話し言葉コーパス』における自己修復部(Dタグ)の自動検出および修正に関する検討(合同セッション「対話」)
- 会議音声の自動話題分割による単語辞書と言語モデルの適応(要約・分割)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- 点予測と系列予測の2段階化による品詞推定の精度向上
- 点予測と系列予測の2段階化による品詞推定の精度向上
- スロットベースのベクトル空間モデルの組合せによる音声書籍検索
- ウエーブレットの最適化と雑音プロファイルを用いた雑音抑圧による頑健な音声認識
- SuperHマイコンへの搭載を目的とした連続音声認識ソフトウェアJuliusの計算量削減
- 頑健な音声認識のためのウエーブレットパラメータの最適化に基づく残響抑圧
- 音声認識のための言語処理 : 何が足りないか?(言語モデル)
- ポッドキャストを対象とした音リアクションイベント検出
- 「ユビキタスアプリケーションを支えるツールキット」(全4回) : 第3回 Julius を用いた音声認識インタフェースの作成
- 異種コーパスの組合せによるトリガー言語モデルの構築
- 異種コーパスの組合せによるトリガー言語モデルの構築
- 異種コーパスの組合せによるトリガー言語モデルの構築(言語モデル)(第6回音声言語シンポジウム)
- 文脈を考慮した確率的モデルによる話し言葉の整形
- 重み付き有限状態トランスデューサーと対数線形モデルを用いた話し言葉の整形
- 国会音声認識システムの音響・言語モデルの半自動更新
- 点予測による形態素解析
- 文脈を考慮した確率的モデルによる話し言葉の整形(音声検索・要約,第11回音声言語シンポジウム)
- ベイズ推論を用いた連続音声からの言語モデル学習
- スライド情報を用いた言語モデル適応による講義音声認識
- スライド情報を用いた言語モデル適応による講義の音声認識と字幕付与(一般セッション「音声言語処理」)
- スライド情報を用いた言語モデル適応による講義の音声認識と字幕付与(一般セッション「音声言語処理」)
- 講義音声認識のためのスライド情報を用いた言語モデル適応
- ウイグル語の形態素に基づく言語モデルと音声認識システム
- 3種類の辞書による自動単語分割の精度向上
- 音声とテキストを用いた認識単語辞書の自動構築
- 講義音声認識に基づくノートテイクシステム(福祉と音声処理,一般)
- 局所的な係り受けの情報を用いた話し言葉の節・文境界の推定
- 統計的言語モデル変換を用いた音響モデルの準教師つき学習
- 会議録作成支援のための国会審議の音声認識システム(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 会議録作成支援のための国会審議の音声認識システム(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 会議録作成支援のための国会審議の音声認識システム(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 統計的言語モデル変換を用いた音響モデルの準教師付き学習
- ICSLPにおける研究動向 : 言語モデル・対話システムを中心に(第8回音声言語シンポジウム)
- ICSLPにおける研究動向 : 言語モデル・対話システムを中心に
- ICSLPにおける研究動向 : 言語モデル・対話システムを中心に(Session-7 システム,第8回音声言語シンポジウム)
- ICSLPにおける研究動向 : 言語モデル・対話システムを中心に(Session-7 システム,第8回音声言語シンポジウム)
- ICSLPにおける研究動向 : 言語モデル・対話システムを中心に
- ICSLPにおける研究動向 : 言語モデル・対話システムを中心に
- 文脈を考慮した確率的モデルによる話し言葉の整形 (音声)
- ICASSP2007報告(研究動向を探るセッション)
- 言語モデルと発音辞書の統計的話し言葉変換に基づく国会音声認識(音声認識・識別,第9回音声言語シンポジウム)
- 言語モデルと発音辞書の統計的話し言葉変換に基づく国会音声認識(音声認識・識別,第9回音声言語シンポジウム)
- 言語モデルと発音辞書の統計的話し言葉変換に基づく国会音声認識(音声認識・識別,第9回音声言語シンポジウム)
- 話し言葉の整形作業における削除箇所の自動同定(音声言語処理)
- 大学講義のノートテイク支援のための音声認識用言語モデルの適応(言語モデル)
- 統計的機械翻訳の枠組みに基づく言語モデルの話し言葉スタイルへの変換(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 統計的機械翻訳の枠組みに基づく言語モデルの話し言葉スタイルへの変換(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 統計的機械翻訳の枠組みに基づく言語モデルの話し言葉スタイルへの変換(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 話し言葉音声認識のための汎用的な統計的発音変動モデル(音声, 聴覚)
- 大語彙連続音声認識を用いた落語のリアルタイム字幕付与(認識, 信頼度)
- 国会音声認識のための発音モデル生成と言語モデル適応
- 『日本語話し言葉コーパス』を用いた汎用的な発音変動モデルの統計的学習(音声言語情報処理一般)(テーマ:音声対話システム、音声言語情報処理、一般)
- 多数話者モデルを用いた討論音声の教師なし話者インデキシング(音声,聴覚)
- 話題と話者に関するPLSAに基づく言語モデル適応(言語モデル・要約)(第5回音声言語シンポジウム)
- 話題と話者に関するPLSAに基づく言語モデル適応(第5回音声言語シンポジウム : 言語モデル・要約)
- 話題と話者に関するPLSAに基づく言語モデル適応(第5回音声言語シンポジウム : 言語モデル・要約)
- 討論音声認識のための言語モデルと音響モデルの適応の検討
- 討論音声を対象とした、話者モデル選択による話者インデキシングと自動書き起こし
- 討論音声を対象とした話者モデル選択による話者インデキシングと自動書き起こし
- 討論音声を対象とした話者モデル選択による話者インデキシングと自動書き起こし
- 談話標識の抽出に基づいた講演音声の自動インデキシング(音声言語情報処理とその応用)
- 自動獲得した未知語の読み・文脈情報による仮名漢字変換
- 統計的言語モデル変換を用いた音響モデルの準教師付き学習(音声,聴覚)
- 述語項の類似度に基づく情報推薦を行う音声対話システム
- 講演に対する読点の複数アノテーションに基づく自動挿入
- 部分的アノテーションから学習可能な係り受け解析器
- 部分的アノテーションから学習可能な係り受け解析器
- テキストと音声を用いた単語と読みの自動獲得
- テキストと音声を用いた単語と読みの自動獲得(単語辞書・発音モデル)
- 点予測による自動単語分割
- 確率的タグ付与コーパスからの言語モデル構築
- 3種類の辞書による自動単語分割の精度向上
- 音声対話システムにおける 簡略表現認識のための自動語彙拡張
- 述語項の類似度に基づく情報抽出・推薦を行う音声対話システム
- 点予測による形態素解析
- 素性頻度ファイルと部分的アノテーションコーパスからの単語分割器の学習
- 予稿の話し言葉変換に基づく言語モデルによる講演音声認識 (言語理解とコミュニケーション)
- 予稿の話し言葉変換に基づく言語モデルによる講演音声認識 (音声)
- 自然言語処理における分野適応(知識の転移)
- 方言対訳コーパスを用いた日本語方言音声認識システム (音声・第14回音声言語シンポジウム)
- 講演に対する読点の複数アノテーションに基づく自動挿入
- 自然言語処理における分野適応
- IwaCamを用いたメディア処理による遠隔コミュニケーションの支援 : 同時調理を題材とした映像と音声の役割に関する考察(調理支援,データ工学と食メディア)
- レシピテキストからのフローグラフコーパス作成(データ工学と食メディア)