講演の書き起こしに対する統計的手法を用いた文体の整形
スポンサーリンク
概要
- 論文の詳細を見る
講演音声のような話し言葉の書き起こしや音声認識結果には、話し言葉特有の表現が数多く含まれて二次利用しにくいため、文章として適した形態に整形する必要がある。本稿では、統計的機械翻訳の考え方に基づいて講演の書き起こしを自動的に整形された文章に変換する方法を提案する。本研究で扱う処理は、フィラーの削除、句点の挿入、助詞の挿入、書き言葉表現への変換、文体の統一である。これらの処理を統合的に行うようにビームサーチを導入した。以上の手法により、実際の講演の書き起こしを整形された文章に変換し、講演録編集者によって一次整形されたものを正解として、句点の挿入、助詞の挿入、文体の統一に関して定量的な評価を行った。
- 一般社団法人情報処理学会の論文
- 2002-05-24
著者
関連論文
- ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理技術の総合開発(総合報告)
- 音源分離との統合によるミッシングフィーチャマスク自動生成に基づく同時発話音声認識
- 非線形振動子による引き込みを利用した仮想空間における歩行
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- オンライン変分ベイズ学習に基づくモデル比較を用いた音声区間検出(認識)
- ニホンアマガエルの同期した発声行動に関する数理的研究および音響信号解析 (第5回生物数学の理論とその応用)
- 会議録作成支援のための国会審議の音声認識システム(音声,聴覚)
- モデル駆動アーキテクチャに基づくホームネットワークサービスの開発支援(学生セッション A_モデル指向(1))
- 話し言葉の整形作業における削除箇所の自動同定(音声言語処理)
- 局所的な係り受けと韻律の素性を用いた話し言葉の節・文境界推定(話し言葉処理)
- 日本語CALLシステムの音声認識における効果的な予測のための決定木に基づく誤りパターンの分類(一般(ポスターセッション),第9回音声言語シンポジウム)
- 日本語話し言葉の係り受け解析と文境界推定の相互作用による高精度化
- 『日本語話し言葉コーパス』における自己修復部(Dタグ)の自動検出および修正に関する検討(合同セッション「対話」)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- 点予測と系列予測の2段階化による品詞推定の精度向上
- 点予測と系列予測の2段階化による品詞推定の精度向上
- スロットベースのベクトル空間モデルの組合せによる音声書籍検索
- ウエーブレットの最適化と雑音プロファイルを用いた雑音抑圧による頑健な音声認識
- SuperHマイコンへの搭載を目的とした連続音声認識ソフトウェアJuliusの計算量削減
- 頑健な音声認識のためのウエーブレットパラメータの最適化に基づく残響抑圧
- ポッドキャストを対象とした音リアクションイベント検出
- 「ユビキタスアプリケーションを支えるツールキット」(全4回) : 第3回 Julius を用いた音声認識インタフェースの作成
- 異種コーパスの組合せによるトリガー言語モデルの構築
- 異種コーパスの組合せによるトリガー言語モデルの構築
- 異種コーパスの組合せによるトリガー言語モデルの構築(言語モデル)(第6回音声言語シンポジウム)
- 異種コーパスの組合せによるトリガー言語モデルの構築(言語モデル)(第6回音声言語シンポジウム)
- 異種コーパスの組合せによるトリガー言語モデルの構築(言語モデル)(第6回音声言語シンポジウム)
- Webからの情報抽出を用いた音声対話システム
- 文脈を考慮した確率的モデルによる話し言葉の整形
- 重み付き有限状態トランスデューサーと対数線形モデルを用いた話し言葉の整形
- 国会音声認識システムの音響・言語モデルの半自動更新
- NTCIR-9 SpokenDoc: 音声検索語検出と音声ドキュメント検索の評価枠組の設計
- 頑健な音声認識のためのウエーブレットパラメータの最適化に基づく残響抑圧
- 文化と言語の維持保存に貢献するためのデジタル博物館の試みトランスクリプションデータを流用する字幕映像生成システムの提案
- 点予測による形態素解析
- 文化と言語の維持保存に貢献するためのデジタル博物館の試みトランスクリプションデータを流用する字幕映像生成システムの提案
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- 文脈を考慮した確率的モデルによる話し言葉の整形(音声検索・要約,第11回音声言語シンポジウム)
- 会議音声認識におけるBICに基づく高速な話者正規化と話者適応
- ベイズ推論を用いた連続音声からの言語モデル学習
- スライド情報を用いた言語モデル適応による講義の音声認識と字幕付与(一般セッション「音声言語処理」)
- スライド情報を用いた言語モデル適応による講義の音声認識と字幕付与(一般セッション「音声言語処理」)
- 音声会話コンテンツにおける聴衆の反応に基づいたホットスポットの抽出
- ポッドキャストを対象とした音リアクションイベント検出
- ウイグル語の形態素に基づく言語モデルと音声認識システム
- 3L-3 大規模文書を知識ベースとする音声対話システム(リーディングプロジェクト e-society:自然な音声対話処理技術(1),一般セッション,リーディングプロジェクト e-society)
- 文書検索システムにおけるベイズリスクに基づく対話戦略のオンライン学習(システム,第9回音声言語シンポジウム)
- 文書検索システムにおけるベイズリスクに基づく対話戦略のオンライン学習(システム,第9回音声言語シンポジウム)
- 文書検索システムにおけるベイズリスクに基づく対話戦略のオンライン学習(システム,第9回音声言語シンポジウム)
- 音声会話コンテンツにおける聴衆の反応に基づいたホットスポットの抽出
- ミッシングフィーチャー理論を利用した音源分離と音声認識のインターフェースと複数ロボットへの適用
- 講義音声認識に基づくノートテイクシステム(福祉と音声処理,一般)
- 局所的な係り受けの情報を用いた話し言葉の節・文境界の推定
- 多数のセンサを用いたポスター会話の収録とその分析(マルチモーダル)
- 係り受けとポーズ・フィラーの情報を用いた話し言葉の段階的チャンキング(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 係り受けとポーズ・フィラーの情報を用いた話し言葉の段階的チャンキング(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 係り受けとポーズ・フィラーの情報を用いた話し言葉の段階的チャンキング(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 視覚情報を話題の対象とする音声対話システム
- 音声版ダイアログナビ : 音声対話によるソフトウェアサポート(音声対話システムB)(テーマ:音声対話システム、音声言語情報処理、一般)
- 音声対話による大規模知識ベース検索システム : 音声版ダイアログナビ(音・音声インタフェース)
- 音声対話によるソフトウェアサポートタスクのための確認戦略
- 『日本語話し言葉コーパス』における自己修復部(Dタグ)の自動検出および修正に関する検討(合同セッション「対話」)
- 統計的言語モデル変換を用いた音響モデルの準教師つき学習
- HTMLのフォーム入力のための文法の自動生成とSALTによる実装
- 音声認識エンジンJulius/JulianのAPI実装
- VoiceXML の動的生成に基づく協調的な電話自動応答システム
- 統計的言語モデル変換を用いた音響モデルの準教師付き学習
- 音声中の検索語検出のためのテストコレクション構築 -中間報告-
- 柔軟な言語モデルとマッチングを用いた音声によるレストラン検索システム
- 柔軟な言語モデルとマッチングを用いた音声によるレストラン検索システム
- 2ZN-1 ポスター会話中の音リアクションイベントに基づくホットスポットの抽出(情報爆発時代における対話インタラクション,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- G-007 ミッシングフィーチャー理論による音源分離と混合音声認識の統合型インターフェース(G.音声・音楽)
- 文強勢と等時性の自動検出に基づく英語韻律学習支援システム
- 音声対話システムにおける物体指示のための信念ネットワークを用いた曖昧性の解消
- K-29 音声対話におけるオブジェクト同定のための曖昧性の解消(マルチメディア・仮想環境基礎1,K.ヒューマンコミュニケーション&インタラクション)
- 大規模な日本語話し言葉データベースを用いた講演音声認識
- 話し言葉音声認識のための言語モデルとデコーダの改善
- 話し言葉音声認識のための言語モデルとデコーダの改善
- 話し言葉の整形作業における削除箇所の自動同定(音声言語処理)
- 大学講義のノートテイク支援のための音声認識用言語モデルの適応(言語モデル)
- 大語彙連続音声認識を用いた落語のリアルタイム字幕付与(認識, 信頼度)
- 話題と話者に関するPLSAに基づく言語モデル適応(第5回音声言語シンポジウム : 言語モデル・要約)
- 話題と話者に関するPLSAに基づく言語モデル適応(第5回音声言語シンポジウム : 言語モデル・要約)
- 複数特徴の重み付き統合による雑音に頑健な発話区間検出(耐雑音)
- 談話標識と話題語に基づく統計的尺度による講演からの重要文抽出
- RNNPBによる視聴覚情報変換を利用したロボットの身体・音声表現(ヒューマンインタラクションとパターン認識・メディア解理・言語理解,ヒューマンインタラクションとパターン認識・メディア解理・言語理解,一般)
- RNNPBによる視聴覚情報変換を利用したロボットの身体・音声表現(ヒューマンインタラクションとパターン認識・メディア理解・言語理解)
- RNNPBによる視聴覚情報変換を利用したロボットの身体・音声表現(ヒューマンインタラクションとパターン認識・メディア理解・言語理解)
- RNNPBによる視聴覚情報変換を利用したロボットの身体・音声表現
- RNNPBによる視聴覚情報変換を利用したロボットの身体・音声表現
- MAHL:演奏者間のインタラクション分析のためのスコアアライメント手法の提案
- ロボットとの音声対話におけるユーザの心的状態の分析
- 環境音を対象とした擬音語自動認識 : 擬音語表現における音素決定曖昧性の解消
- バス運行情報案内システムにおけるユーザモデルを用いた適応的応答の生成
- 音声対話システムにおける 簡略表現認識のための自動語彙拡張
- 講演の書き起こしに対する統計的手法を用いた文体の整形
- 講演の書き起こしに対する統計的手法を用いた文体の整形
- 多数話者音声データベースを用いた討論音声の教師なし話者インデキシング