談話標識の抽出に基づいた講演音声の自動インデキシング(<特集>音声言語情報処理とその応用)
スポンサーリンク
概要
- 論文の詳細を見る
講演音声において話題(セクション)の転換点で用いられる特徴的な単語(談話標識)を用いて,自動インデキシングを行う方法を提案する.本研究では,種々の講演の中でも流れが比較的明確で共通性のある学会講演を対象とする.学習データの講演の書き起こしからポーズ情報を用いてセクション境界候補を検出し,統計的言語モデルを用いて句点を挿入して,各セクションの先頭の1文を抽出する.その中に含まれる名詞から単語頻度と文頻度に基づいて談話標識を選定する.これらの過程は人手によるタグを必要としない教師なし学習により行われる.評価データの各文について談話標識の単語頻度と文頻度の統計量に基づく評価値を計算し,その合計が閾値以上であればインデックスを付与する。実際の講演音声の書き起こしと音声認識結果に対して評価を行った結果,再現率85%程度(適合率は20%程度)の精度でインデキシングできることを示す.
- 一般社団法人情報処理学会の論文
- 2002-07-15
著者
-
秋田 祐哉
京都大学学術情報メディアセンター
-
秋田 祐哉
京都大学 情報学研究科 知能情報学専攻
-
河原 達也
京都大学大学院 情報学研究科
-
秋田 祐哉
京都大学大学院情報学研究科,京都大学学術情報メディアセンター
-
長谷川 将宏
京都大学大学院情報学研究科知能情報学専攻
関連論文
- 会議録作成支援のための国会審議の音声認識システム (画像符号化・映像メディア処理レター特集)
- 会議録作成支援のための国会審議の音声認識システム(音声,聴覚)
- 講義音声認識に基づくノートテイクシステム(福祉と音声処理,一般)
- 話し言葉の整形作業における削除箇所の自動同定(音声言語処理)
- 局所的な係り受けと韻律の素性を用いた話し言葉の節・文境界推定(話し言葉処理)
- 話し言葉における引用節の自動認定および引用符の付与(第8回音声言語シンポジウム)
- 話し言葉における引用節の自動認定および引用符の付与(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 話し言葉における引用節の自動認定および引用符の付与
- 会議音声の自動話題分割による単語辞書と言語モデルの適応(要約・分割)
- 文脈を考慮した確率的モデルによる話し言葉の整形
- 国会音声認識システムの音響・言語モデルの半自動更新
- 文脈を考慮した確率的モデルによる話し言葉の整形(音声検索・要約,第11回音声言語シンポジウム)
- スライド情報を用いた言語モデル適応による講義音声認識
- スライド情報を用いた言語モデル適応による講義の音声認識と字幕付与(一般セッション「音声言語処理」)
- スライド情報を用いた言語モデル適応による講義の音声認識と字幕付与(一般セッション「音声言語処理」)
- 講義音声認識のためのスライド情報を用いた言語モデル適応
- 質問応答・情報推薦機能を備えた音声による情報案内システム(音声質問応答,インタラクションの理解とデザイン)
- ドメインとスタイルを考慮したWebテキストの選択による音声対話システム用言語モデルの構築(音声,聴覚)
- 講義音声認識に基づくノートテイクシステム(福祉と音声処理,一般)
- シナリオ記述を状況に依存して実行する対話エージェントのアーキテクチャ
- シナリオ記述を状況に依存して実行する対話エージェントのアーキテクチャ
- 局所的な係り受けの情報を用いた話し言葉の節・文境界の推定
- ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
- ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
- ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
- 話し言葉における引用節の自動認定および引用符の付与(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 統計的言語モデル変換を用いた音響モデルの準教師つき学習
- 会議録作成支援のための国会審議の音声認識システム(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 会議録作成支援のための国会審議の音声認識システム(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 会議録作成支援のための国会審議の音声認識システム(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 対話音声認識を指向した音響モデルの構築
- 発話検証に基づく音声操作プロジェクタとそれによる講演の自動ハイパーテキスト化 (音声言語情報処理)
- 文法カテゴリ対制約を用いたA^*探索に基づく大語彙連続音声認識パーザ (音声言語情報処理)
- 単語トレリスインデックスを用いた段階的探索による大語彙連続音声認識
- 文法カテゴリ対制約を用いたA^*探索に基づく大語彙連続音声認識パーザ
- 汎用的な情報検索音声対話プラットフォーム
- 文法カテゴリ対制約を用いたA^*探索に基づく大語彙連続音声認識パーザ
- 汎用的な情報検索音声対話プラットフォーム
- 文法カテゴリ対制約を用いたA^*探索に基づく大語彙連続音声認識パーザ
- 汎用的な情報検索音声対話プラットフォーム
- 統計的言語モデル変換を用いた音響モデルの準教師付き学習
- ICSLPにおける研究動向 : 言語モデル・対話システムを中心に(第8回音声言語シンポジウム)
- ICSLPにおける研究動向 : 言語モデル・対話システムを中心に
- ICSLPにおける研究動向 : 言語モデル・対話システムを中心に(Session-7 システム,第8回音声言語シンポジウム)
- ICSLPにおける研究動向 : 言語モデル・対話システムを中心に(Session-7 システム,第8回音声言語シンポジウム)
- ICSLPにおける研究動向 : 言語モデル・対話システムを中心に
- ICSLPにおける研究動向 : 言語モデル・対話システムを中心に
- 音声対話によるソフトウェアサポートタスクのための効率的な確認戦略(音声, 聴覚)
- 文脈を考慮した確率的モデルによる話し言葉の整形 (音声)
- 2ZN-1 ポスター会話中の音リアクションイベントに基づくホットスポットの抽出(情報爆発時代における対話インタラクション,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- ICASSP2007報告(研究動向を探るセッション)
- 英語韻律発音学習支援システムのための英語文強勢のモデル化と自動検出
- CALLシステムのための英語文強勢知覚のモデル化
- 言語モデルと発音辞書の統計的話し言葉変換に基づく国会音声認識(音声認識・識別,第9回音声言語シンポジウム)
- 言語モデルと発音辞書の統計的話し言葉変換に基づく国会音声認識(音声認識・識別,第9回音声言語シンポジウム)
- 言語モデルと発音辞書の統計的話し言葉変換に基づく国会音声認識(音声認識・識別,第9回音声言語シンポジウム)
- 講演音声認識のための音響・言語モデルの検討
- 講演音声認識のための音響・言語モデルの検討
- 講演音声認識のための音響・言語モデルの検討
- 講演ディクテーションのための話題独立言語モデルと話題適応
- 講演ディクテーションのための話題独立言語モデルと話題適応
- 話し言葉の整形作業における削除箇所の自動同定(音声言語処理)
- 複合的言語制約に基づくキーフレーズ検出を用いた汎用的なデータベース検索音声対話プラットフォーム
- 音声言語を用いた仮想空間との対話による試着システム(次世代ヒューマンインタフェース・インタラクション)
- 音声言語を用いた仮想空間との対話による試着システム
- 京大総合情報メディアセンターにおけるCALLの試み
- 京大総合情報メディアセンターにおけるCALLの試み
- 京大総合情報メディアセンターにおけるCALLの試み
- 大学講義のノートテイク支援のための音声認識用言語モデルの適応(言語モデル)
- 統計的機械翻訳の枠組みに基づく言語モデルの話し言葉スタイルへの変換(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 統計的機械翻訳の枠組みに基づく言語モデルの話し言葉スタイルへの変換(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 統計的機械翻訳の枠組みに基づく言語モデルの話し言葉スタイルへの変換(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 話し言葉音声認識のための汎用的な統計的発音変動モデル(音声, 聴覚)
- 大語彙連続音声認識を用いた落語のリアルタイム字幕付与(認識, 信頼度)
- 国会音声認識のための発音モデル生成と言語モデル適応
- 『日本語話し言葉コーパス』を用いた汎用的な発音変動モデルの統計的学習(音声言語情報処理一般)(テーマ:音声対話システム、音声言語情報処理、一般)
- 多数話者モデルを用いた討論音声の教師なし話者インデキシング(音声,聴覚)
- 話題と話者に関するPLSAに基づく言語モデル適応(言語モデル・要約)(第5回音声言語シンポジウム)
- 話題と話者に関するPLSAに基づく言語モデル適応(第5回音声言語シンポジウム : 言語モデル・要約)
- 話題と話者に関するPLSAに基づく言語モデル適応(第5回音声言語シンポジウム : 言語モデル・要約)
- 討論音声認識のための言語モデルと音響モデルの適応の検討
- 討論音声を対象とした、話者モデル選択による話者インデキシングと自動書き起こし
- 討論音声を対象とした話者モデル選択による話者インデキシングと自動書き起こし
- 討論音声を対象とした話者モデル選択による話者インデキシングと自動書き起こし
- 談話標識の抽出に基づいた講演音声の自動インデキシング(音声言語情報処理とその応用)
- 統計的言語モデル変換を用いた音響モデルの準教師付き学習(音声,聴覚)
- 講演に対する読点の複数アノテーションに基づく自動挿入
- 談話標識の抽出に基づいた講演音声の自動インデキシング
- 談話標識の抽出に基づいた講演音声の自動インデキシング
- 多数話者音声データベースを用いた討論音声の教師なし話者インデキシング
- 会議音声の自動アーカイブ化システム
- 会議音声の自動アーカイブ化システム
- 会議音声の自動アーカイブ化システム
- 予稿の話し言葉変換に基づく言語モデルによる講演音声認識 (言語理解とコミュニケーション)
- 予稿の話し言葉変換に基づく言語モデルによる講演音声認識 (音声)
- 予稿の話し言葉変換に基づく言語モデルによる講演音声認識(言語モデル・辞書,第13回音声言語シンポジウム)
- 予稿の話し言葉変換に基づく言語モデルによる講演音声認識(言語モデル・辞書,第13回音声言語シンポジウム)
- 講演に対する読点の複数アノテーションに基づく自動挿入
- 予稿の話し言葉変換に基づく言語モデルによる講演音声認識
- 予稿の話し言葉変換に基づく言語モデルによる講演音声認識