話し言葉の整形作業における削除箇所の自動同定(音声言語処理)
スポンサーリンク
概要
- 論文の詳細を見る
『日本語話し言葉コーパス』(CSJ)のコアに対して、講演録の作成を想定して、削除・置換・挿入などの一次整形のアノテーションを付与した。本稿では、この話し言葉の整形作業において削除される箇所を自動推定する手法を提案する。本研究では、削除箇所についてIOB体系でラベリングを行い、このラベルについてのテキストチャンキングの問題とみなし、SVMに基づくチャンカであるYamChaを利用する。素性として、同一表現の繰り返しや文節・係り受けといった言語的情報、基本周波数などの韻律的情報などを検討し、また言い直しなどの自己修復部との関係についても調べた。書き起こしと音声認識結果の両方に対して評価実験を行い、書き起こしについてはF値0.8が得られた。
- 社団法人情報処理学会の論文
- 2008-05-15
著者
-
秋田 祐哉
京都大学学術情報メディアセンター
-
尾嶋 憲治
京都大学情報学研究科
-
河原 達也
京都大学情報学研究科
-
秋田 祐哉
京都大学情報学研究科
-
内元 清貴
情報通信研究機構
-
内元 清貴
通信総合研
-
秋田 祐哉
京都大学 情報学研究科 知能情報学専攻
-
秋田 祐哉
京都大学
関連論文
- ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理技術の総合開発(総合報告)
- 会議録作成支援のための国会審議の音声認識システム (画像符号化・映像メディア処理レター特集)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- オンライン変分ベイズ学習に基づくモデル比較を用いた音声区間検出(認識)
- 会議録作成支援のための国会審議の音声認識システム(音声,聴覚)
- モデル駆動アーキテクチャに基づくホームネットワークサービスの開発支援(学生セッション A_モデル指向(1))
- 講義音声認識に基づくノートテイクシステム(福祉と音声処理,一般)
- 話し言葉の整形作業における削除箇所の自動同定(音声言語処理)
- 局所的な係り受けと韻律の素性を用いた話し言葉の節・文境界推定(話し言葉処理)
- 日本語CALLシステムの音声認識における効果的な予測のための決定木に基づく誤りパターンの分類(一般(ポスターセッション),第9回音声言語シンポジウム)
- 日本語話し言葉の係り受け解析と文境界推定の相互作用による高精度化
- 『日本語話し言葉コーパス』における自己修復部(Dタグ)の自動検出および修正に関する検討(合同セッション「対話」)
- 会議音声の自動話題分割による単語辞書と言語モデルの適応(要約・分割)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- 点予測と系列予測の2段階化による品詞推定の精度向上
- 点予測と系列予測の2段階化による品詞推定の精度向上
- スロットベースのベクトル空間モデルの組合せによる音声書籍検索
- ウエーブレットの最適化と雑音プロファイルを用いた雑音抑圧による頑健な音声認識
- SuperHマイコンへの搭載を目的とした連続音声認識ソフトウェアJuliusの計算量削減
- 頑健な音声認識のためのウエーブレットパラメータの最適化に基づく残響抑圧
- ポッドキャストを対象とした音リアクションイベント検出
- 「ユビキタスアプリケーションを支えるツールキット」(全4回) : 第3回 Julius を用いた音声認識インタフェースの作成
- 異種コーパスの組合せによるトリガー言語モデルの構築
- 異種コーパスの組合せによるトリガー言語モデルの構築
- 異種コーパスの組合せによるトリガー言語モデルの構築(言語モデル)(第6回音声言語シンポジウム)
- 異種コーパスの組合せによるトリガー言語モデルの構築(言語モデル)(第6回音声言語シンポジウム)
- 異種コーパスの組合せによるトリガー言語モデルの構築(言語モデル)(第6回音声言語シンポジウム)
- Webからの情報抽出を用いた音声対話システム
- 文脈を考慮した確率的モデルによる話し言葉の整形
- 重み付き有限状態トランスデューサーと対数線形モデルを用いた話し言葉の整形
- 国会音声認識システムの音響・言語モデルの半自動更新
- NTCIR-9 SpokenDoc: 音声検索語検出と音声ドキュメント検索の評価枠組の設計
- 頑健な音声認識のためのウエーブレットパラメータの最適化に基づく残響抑圧
- 文化と言語の維持保存に貢献するためのデジタル博物館の試みトランスクリプションデータを流用する字幕映像生成システムの提案
- 点予測による形態素解析
- 文化と言語の維持保存に貢献するためのデジタル博物館の試みトランスクリプションデータを流用する字幕映像生成システムの提案
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- 文脈を考慮した確率的モデルによる話し言葉の整形(音声検索・要約,第11回音声言語シンポジウム)
- 会議音声認識におけるBICに基づく高速な話者正規化と話者適応
- ベイズ推論を用いた連続音声からの言語モデル学習
- スライド情報を用いた言語モデル適応による講義音声認識
- スライド情報を用いた言語モデル適応による講義の音声認識と字幕付与(一般セッション「音声言語処理」)
- スライド情報を用いた言語モデル適応による講義の音声認識と字幕付与(一般セッション「音声言語処理」)
- 講義音声認識のためのスライド情報を用いた言語モデル適応
- 音声会話コンテンツにおける聴衆の反応に基づいたホットスポットの抽出
- ポッドキャストを対象とした音リアクションイベント検出
- ウイグル語の形態素に基づく言語モデルと音声認識システム
- 3L-3 大規模文書を知識ベースとする音声対話システム(リーディングプロジェクト e-society:自然な音声対話処理技術(1),一般セッション,リーディングプロジェクト e-society)
- 文書検索システムにおけるベイズリスクに基づく対話戦略のオンライン学習(システム,第9回音声言語シンポジウム)
- 文書検索システムにおけるベイズリスクに基づく対話戦略のオンライン学習(システム,第9回音声言語シンポジウム)
- 文書検索システムにおけるベイズリスクに基づく対話戦略のオンライン学習(システム,第9回音声言語シンポジウム)
- 音声会話コンテンツにおける聴衆の反応に基づいたホットスポットの抽出
- 講義音声認識に基づくノートテイクシステム(福祉と音声処理,一般)
- 局所的な係り受けの情報を用いた話し言葉の節・文境界の推定
- 多数のセンサを用いたポスター会話の収録とその分析(マルチモーダル)
- 係り受けとポーズ・フィラーの情報を用いた話し言葉の段階的チャンキング(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 係り受けとポーズ・フィラーの情報を用いた話し言葉の段階的チャンキング(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 係り受けとポーズ・フィラーの情報を用いた話し言葉の段階的チャンキング(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 視覚情報を話題の対象とする音声対話システム
- 統計的言語モデル変換を用いた音響モデルの準教師つき学習
- 会議録作成支援のための国会審議の音声認識システム(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 会議録作成支援のための国会審議の音声認識システム(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 会議録作成支援のための国会審議の音声認識システム(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 統計的言語モデル変換を用いた音響モデルの準教師付き学習
- ICSLPにおける研究動向 : 言語モデル・対話システムを中心に(第8回音声言語シンポジウム)
- ICSLPにおける研究動向 : 言語モデル・対話システムを中心に
- ICSLPにおける研究動向 : 言語モデル・対話システムを中心に(Session-7 システム,第8回音声言語シンポジウム)
- ICSLPにおける研究動向 : 言語モデル・対話システムを中心に(Session-7 システム,第8回音声言語シンポジウム)
- ICSLPにおける研究動向 : 言語モデル・対話システムを中心に
- ICSLPにおける研究動向 : 言語モデル・対話システムを中心に
- 文脈を考慮した確率的モデルによる話し言葉の整形 (音声)
- ICASSP2007報告(研究動向を探るセッション)
- 言語モデルと発音辞書の統計的話し言葉変換に基づく国会音声認識(音声認識・識別,第9回音声言語シンポジウム)
- 言語モデルと発音辞書の統計的話し言葉変換に基づく国会音声認識(音声認識・識別,第9回音声言語シンポジウム)
- 言語モデルと発音辞書の統計的話し言葉変換に基づく国会音声認識(音声認識・識別,第9回音声言語シンポジウム)
- 話し言葉の整形作業における削除箇所の自動同定(音声言語処理)
- 大学講義のノートテイク支援のための音声認識用言語モデルの適応(言語モデル)
- 統計的機械翻訳の枠組みに基づく言語モデルの話し言葉スタイルへの変換(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 統計的機械翻訳の枠組みに基づく言語モデルの話し言葉スタイルへの変換(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 統計的機械翻訳の枠組みに基づく言語モデルの話し言葉スタイルへの変換(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 話し言葉音声認識のための汎用的な統計的発音変動モデル(音声, 聴覚)
- 大語彙連続音声認識を用いた落語のリアルタイム字幕付与(認識, 信頼度)
- 国会音声認識のための発音モデル生成と言語モデル適応
- 『日本語話し言葉コーパス』を用いた汎用的な発音変動モデルの統計的学習(音声言語情報処理一般)(テーマ:音声対話システム、音声言語情報処理、一般)
- 多数話者モデルを用いた討論音声の教師なし話者インデキシング(音声,聴覚)
- 話題と話者に関するPLSAに基づく言語モデル適応(言語モデル・要約)(第5回音声言語シンポジウム)
- 話題と話者に関するPLSAに基づく言語モデル適応(第5回音声言語シンポジウム : 言語モデル・要約)
- 話題と話者に関するPLSAに基づく言語モデル適応(第5回音声言語シンポジウム : 言語モデル・要約)
- 討論音声認識のための言語モデルと音響モデルの適応の検討
- 討論音声を対象とした、話者モデル選択による話者インデキシングと自動書き起こし
- 討論音声を対象とした話者モデル選択による話者インデキシングと自動書き起こし
- 討論音声を対象とした話者モデル選択による話者インデキシングと自動書き起こし
- 談話標識の抽出に基づいた講演音声の自動インデキシング(音声言語情報処理とその応用)
- 統計的言語モデル変換を用いた音響モデルの準教師付き学習(音声,聴覚)
- 講演に対する読点の複数アノテーションに基づく自動挿入
- 予稿の話し言葉変換に基づく言語モデルによる講演音声認識 (言語理解とコミュニケーション)
- 予稿の話し言葉変換に基づく言語モデルによる講演音声認識 (音声)
- 講演に対する読点の複数アノテーションに基づく自動挿入