重み付き有限状態トランスデューサーと対数線形モデルを用いた話し言葉の整形
スポンサーリンク
概要
- 論文の詳細を見る
自然な話し言葉には,フィラーや言いよどみ,口語的表現,助詞の脱落など,書き言葉に出現しない現象が多く含まれている.音声認識の結果から読みやすい書き起こしを作成する際に,このような現象に対応し,書き言葉に整形する必要がある.本研究では,話し言葉の整形を統計的機械翻訳の問題として扱い,この枠組みの中で様々なモデルを提案する.特に,話し言葉固有の現象を捉える複数の特徴量を組み合わせる対数線形モデルを導入する.このモデルを重み付き有限状態トランスデューサー (WFST) を用いて実装した.国会審議の書き起こしを対象とした評価実験において,ルールベースや単純な統計的モデルを用いた手法に比べて提案手法は精度を大幅に改善することができた.
- 2009-07-10
著者
-
森 信介
京都大学学術情報メディアセンター
-
河原 達也
京都大学情報学研究科
-
Neubig Graham
京都大学情報学研究科
-
森 信介
京都大学情報学研究科
-
Graham Neubig
京都大学情報学研究科
関連論文
- 擬似確率的単語分割コーパスによる言語モデルの改良
- ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理技術の総合開発(総合報告)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- オンライン変分ベイズ学習に基づくモデル比較を用いた音声区間検出(認識)
- 会議録作成支援のための国会審議の音声認識システム(音声,聴覚)
- モデル駆動アーキテクチャに基づくホームネットワークサービスの開発支援(学生セッション A_モデル指向(1))
- 講義音声認識に基づくノートテイクシステム(福祉と音声処理,一般)
- 話し言葉の整形作業における削除箇所の自動同定(音声言語処理)
- 局所的な係り受けと韻律の素性を用いた話し言葉の節・文境界推定(話し言葉処理)
- 日本語CALLシステムの音声認識における効果的な予測のための決定木に基づく誤りパターンの分類(一般(ポスターセッション),第9回音声言語シンポジウム)
- 日本語話し言葉の係り受け解析と文境界推定の相互作用による高精度化
- 『日本語話し言葉コーパス』における自己修復部(Dタグ)の自動検出および修正に関する検討(合同セッション「対話」)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- 点予測と系列予測の2段階化による品詞推定の精度向上
- 点予測と系列予測の2段階化による品詞推定の精度向上
- スロットベースのベクトル空間モデルの組合せによる音声書籍検索
- ウエーブレットの最適化と雑音プロファイルを用いた雑音抑圧による頑健な音声認識
- SuperHマイコンへの搭載を目的とした連続音声認識ソフトウェアJuliusの計算量削減
- 頑健な音声認識のためのウエーブレットパラメータの最適化に基づく残響抑圧
- 音声認識のための言語処理 : 何が足りないか?(言語モデル)
- ポッドキャストを対象とした音リアクションイベント検出
- 「ユビキタスアプリケーションを支えるツールキット」(全4回) : 第3回 Julius を用いた音声認識インタフェースの作成
- 異種コーパスの組合せによるトリガー言語モデルの構築
- 異種コーパスの組合せによるトリガー言語モデルの構築
- 異種コーパスの組合せによるトリガー言語モデルの構築(言語モデル)(第6回音声言語シンポジウム)
- 異種コーパスの組合せによるトリガー言語モデルの構築(言語モデル)(第6回音声言語シンポジウム)
- 異種コーパスの組合せによるトリガー言語モデルの構築(言語モデル)(第6回音声言語シンポジウム)
- Webからの情報抽出を用いた音声対話システム
- 文脈を考慮した確率的モデルによる話し言葉の整形
- 重み付き有限状態トランスデューサーと対数線形モデルを用いた話し言葉の整形
- 国会音声認識システムの音響・言語モデルの半自動更新
- NTCIR-9 SpokenDoc: 音声検索語検出と音声ドキュメント検索の評価枠組の設計
- 頑健な音声認識のためのウエーブレットパラメータの最適化に基づく残響抑圧
- 文化と言語の維持保存に貢献するためのデジタル博物館の試みトランスクリプションデータを流用する字幕映像生成システムの提案
- 点予測による形態素解析
- 文化と言語の維持保存に貢献するためのデジタル博物館の試みトランスクリプションデータを流用する字幕映像生成システムの提案
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- 文脈を考慮した確率的モデルによる話し言葉の整形(音声検索・要約,第11回音声言語シンポジウム)
- 会議音声認識におけるBICに基づく高速な話者正規化と話者適応
- ベイズ推論を用いた連続音声からの言語モデル学習
- スライド情報を用いた言語モデル適応による講義の音声認識と字幕付与(一般セッション「音声言語処理」)
- スライド情報を用いた言語モデル適応による講義の音声認識と字幕付与(一般セッション「音声言語処理」)
- 音声会話コンテンツにおける聴衆の反応に基づいたホットスポットの抽出
- ポッドキャストを対象とした音リアクションイベント検出
- ウイグル語の形態素に基づく言語モデルと音声認識システム
- 3L-3 大規模文書を知識ベースとする音声対話システム(リーディングプロジェクト e-society:自然な音声対話処理技術(1),一般セッション,リーディングプロジェクト e-society)
- 文書検索システムにおけるベイズリスクに基づく対話戦略のオンライン学習(システム,第9回音声言語シンポジウム)
- 文書検索システムにおけるベイズリスクに基づく対話戦略のオンライン学習(システム,第9回音声言語シンポジウム)
- 文書検索システムにおけるベイズリスクに基づく対話戦略のオンライン学習(システム,第9回音声言語シンポジウム)
- 音声会話コンテンツにおける聴衆の反応に基づいたホットスポットの抽出
- 3種類の辞書による自動単語分割の精度向上
- 音声とテキストを用いた認識単語辞書の自動構築
- 講義音声認識に基づくノートテイクシステム(福祉と音声処理,一般)
- 局所的な係り受けの情報を用いた話し言葉の節・文境界の推定
- 多数のセンサを用いたポスター会話の収録とその分析(マルチモーダル)
- 係り受けとポーズ・フィラーの情報を用いた話し言葉の段階的チャンキング(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 係り受けとポーズ・フィラーの情報を用いた話し言葉の段階的チャンキング(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 係り受けとポーズ・フィラーの情報を用いた話し言葉の段階的チャンキング(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 視覚情報を話題の対象とする音声対話システム
- 音声版ダイアログナビ : 音声対話によるソフトウェアサポート(音声対話システムB)(テーマ:音声対話システム、音声言語情報処理、一般)
- 音声対話による大規模知識ベース検索システム : 音声版ダイアログナビ(音・音声インタフェース)
- 音声対話によるソフトウェアサポートタスクのための確認戦略
- 『日本語話し言葉コーパス』における自己修復部(Dタグ)の自動検出および修正に関する検討(合同セッション「対話」)
- 統計的言語モデル変換を用いた音響モデルの準教師つき学習
- HTMLのフォーム入力のための文法の自動生成とSALTによる実装
- 音声認識エンジンJulius/JulianのAPI実装
- VoiceXML の動的生成に基づく協調的な電話自動応答システム
- 統計的言語モデル変換を用いた音響モデルの準教師付き学習
- 音声中の検索語検出のためのテストコレクション構築 -中間報告-
- 柔軟な言語モデルとマッチングを用いた音声によるレストラン検索システム
- 柔軟な言語モデルとマッチングを用いた音声によるレストラン検索システム
- 2ZN-1 ポスター会話中の音リアクションイベントに基づくホットスポットの抽出(情報爆発時代における対話インタラクション,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 文強勢と等時性の自動検出に基づく英語韻律学習支援システム
- K-29 音声対話におけるオブジェクト同定のための曖昧性の解消(マルチメディア・仮想環境基礎1,K.ヒューマンコミュニケーション&インタラクション)
- 大規模な日本語話し言葉データベースを用いた講演音声認識
- 話し言葉音声認識のための言語モデルとデコーダの改善
- 話し言葉音声認識のための言語モデルとデコーダの改善
- 話し言葉の整形作業における削除箇所の自動同定(音声言語処理)
- 大学講義のノートテイク支援のための音声認識用言語モデルの適応(言語モデル)
- 大語彙連続音声認識を用いた落語のリアルタイム字幕付与(認識, 信頼度)
- 自動獲得した未知語の読み・文脈情報による仮名漢字変換
- 述語項の類似度に基づく情報推薦を行う音声対話システム
- 部分的アノテーションから学習可能な係り受け解析器
- 部分的アノテーションから学習可能な係り受け解析器
- テキストと音声を用いた単語と読みの自動獲得
- テキストと音声を用いた単語と読みの自動獲得(単語辞書・発音モデル)
- 点予測による自動単語分割
- 確率的タグ付与コーパスからの言語モデル構築
- 3種類の辞書による自動単語分割の精度向上
- 音声対話システムにおける 簡略表現認識のための自動語彙拡張
- 述語項の類似度に基づく情報抽出・推薦を行う音声対話システム
- 点予測による形態素解析
- 素性頻度ファイルと部分的アノテーションコーパスからの単語分割器の学習
- 自然言語処理における分野適応(知識の転移)
- 方言対訳コーパスを用いた日本語方言音声認識システム (音声・第14回音声言語シンポジウム)
- 自然言語処理における分野適応
- IwaCamを用いたメディア処理による遠隔コミュニケーションの支援 : 同時調理を題材とした映像と音声の役割に関する考察(調理支援,データ工学と食メディア)
- レシピテキストからのフローグラフコーパス作成(データ工学と食メディア)