F0パターンに基づく講義音声の文単位へのセグメンテーション
スポンサーリンク
概要
- 論文の詳細を見る
講演や講義の音声をディジタルアーカイブとして保存するシステムを構築しているが, 再生時の利便性から, 音声を文単位にセグメンテーションしておくことが望ましい. しかし, 講義のような自発性の高い音声では, 単純にポーズ長に基づいて文境界を抽出することは困難である. そこで, 基本周波数(F0)パターンに基づいて文境界を抽出する手法を実装・評価した. 本手法は, ポーズ長のみで抽出する手法に比べて高い性能を示し, 実際の講義音声に対しても再現率60%で適合率55%, 再現率78%で適合率50%となった. 誤りの大半はフィラー(間投語)によるものであったので, F0パターンを用いてフィラーを取り除く処理を導入したところ, 適合率が約5%向上した. セグメンテーションされた音声に対して人間の主観的な評価を行い, 本手法の有効性を確認した. 本手法は雑音等にも頑健であり, しきい値設定のためのデータは2〜3分で十分である.
- 社団法人電子情報通信学会の論文
- 1999-05-21
著者
関連論文
- 音質の感性的評価のモデルの検討
- 「WCC98に参加して/IFIP TC : この1年」
- 遺伝アルゴリズムを用いたBPNモデルの構造及び学習パラメタの探索
- 2群対判別法による不特定話者日本語単音節中の子音の識別
- キーワード抽出に基づく意味解析による音声対話システム
- フレーズスポッティングと意味解析の密結合による頑健な音声言語理解
- 音声理解システムにおける制約緩和法の検討
- 会話音声中の単語スポッティングのための音語モデルの検討
- 座談会 「人工知能研究の現状と問題点」
- 対話システムにおける知識の相違および認識誤りの解消
- 2群対判別法における対の組合せの選択手順
- モンテギュー文法に基づく英文和訳システムの試作
- 状態遷移モデルに基づく日本語の動作動詞の分析
- 遠隔講義機器設定タスクにおける発話内容の抽象化
- 調音位置・調音方式の識別に基づく発音学習支援システム
- 単語対制約をヒューリスティックとするA^*探索に基づく会話音声認識
- パネル討論音声の話者と話題に関する自動インデキシングの検討
- 音声対話に基づく知的情報検索システム
- 音声対話システムのための対話の認知プロセスモデル
- F0パターンに基づく講義音声の文単位へのセグメンテーション
- 発話検証に基づく音声操作プロジェクタとそれによる講演の自動ハイパーテキスト化 (音声言語情報処理)
- The Satisfiability Problems for Some Classes of Extended Horn Sets in the Propositional Logic (Mathematical Studies of Information Processing)
- Horn節集合による計算について (数理情報科学の基礎理論と応用)
- Complexity of Some Strategies Proving Theorems in the Propositional Logic (Studies on Computational Complexities and Related Topics)
- 入カ導出を階層化した導出について (計算機科学の数学的基礎)
- 系列パターン認識システムの考え方 : 系列パターンの誤り処理 (時系列パターンの認識システムの研究)
- 京都大学統合情報通信システムKUINSの基本概念とシステム設計
- AI・ニューロ・ファジィ : 1990年11月25日(於:池袋サンシャイン集会室)
- 自然言語における空間描写の解析と情景の再構成
- 自然言語における空間描写の解析と情景の再構成
- 2次元平面におけるポテンシャルモデルを用いた位置関係の推定
- 初等力学問題文における空間的状況記述理解
- フレーズスポッティングに基づく頑健な音声理解
- 対話による協調的問題解決のモデリング
- 文頭からの意味的区切りの抽出による意味表現の生成
- 断片的発話からの増進的な意味解析
- Murray Hillにて思うこと
- 対話の構造と単語の概念を利用した発話の理解
- キーフレーズの検出と検証の組合せによる柔軟な音声理解
- キーフレーズの検出と検証の組合せによる柔軟な音声理解
- 概念階層構造を持つネットワークを用いた漸進的音声言語理解
- 会話音声認識における探索へのネットワークによる意味制約の利用
- 会話スタイル依存の言語モデルを用いたキーフレーズの検出・検証
- 会話スタイル依存の言語モデルを用いたキーフレーズの検出・検証
- 会話スタイル依存の言語モデルを用いたキーフレーズの検出・検証
- 発話検証用モデルを用いた音声操作プロジェクタ
- 最大事後確率推定によるN-gram言語モデルのタスク適応
- MAP推定によるN-gram言語モデル
- MAP推定を用いたN-gram言語モデルのタスク適応
- ヒューリスティックな言語モデルを用いた会話音声中の単語スポッティング
- 意味主導型パーサによる自由発話の解析
- 京都大学統合情報通信システムKUINSにおける複合交換網の実現
- 単共振フィルタによる音声の分析
- 情報科学から情報学へ (第2回社会と情報に関するシンポジウム)
- 述語項の類似度に基づく情報推薦を行う音声対話システム
- ウエーブレットに基づくウイナーフィルタを用いた雑音及び残響に頑健な音声認識
- 構文主義A^*探索による音声認識における未知語の処理
- 中国語解析システムにおけるヒューリスティックな知識の利用
- A^*探索に基づいたフレーズスポッティングによる頑健な音声理解
- フレーズスポッティングに基づく頑健な音声理解
- 自由発話認識・理解のためのフレーズスポッティング
- マルチテンプレートを用いた対判別組合せ法による男女話者音素認識
- ポスター発表における質問者と質問の種類の推定のためのマルチモーダルな聞き手行動分析
- 単語の共起情報を用いたニュース朗読音声の話題同定機構
- キーワードスポッティングに基づくニュース音声の話題同定
- 定性的推論システムQR-1の説明文生成サブシステム
- 声質の感性的評価の処理モデル
- 顔画像特徴, 歩行画像特徴および音声特徴の統合による個人識別
- 述語項の類似度に基づく情報抽出・推薦を行う音声対話システム
- 音声会話コンテンツにおける聴衆の反応に基づく音響イベントとホットスポットの検出
- 統合パーサによる統合的自然言語解析
- 統合パーサによる統合的自然言語解析
- 協調的対話におけるシステムの理解度に応じた発話生成
- マルチエージェント分散対話スケジューリングシステムにおけるマシン対マシン通信プロトコルの設計
- 対話事例ベースによる発話内容の推定および未知語の解析
- 様相論理とその情報処理への応用 (III) 知識情報処理と自然言語処理への応用
- 様相論理とその情報処理への応用 (II) ハードウエア・ソフトウエアへの応用
- 音声理解のための統計的フレーズ言語モデルの自動構築
- 点予測による形態素解析
- 情報コンシェルジェ : Mind Probingに基づくマルチモーダルインタラクションシステム(「コミュニケーションと気づき」及び一般)
- 例題からのプログラム合成について
- 人工知能向きオブジェクト指向言語Monad
- 素性頻度ファイルと部分的アノテーションコーパスからの単語分割器の学習
- ウエーブレットパケット分解による残響に頑健な音声認識
- ポスター会話におけるパラ言語・非言語情報を用いた話者交替及び次話者の予測 (一般セッションと「法と社会のインタフェース」関する特別セッション)
- 話題の追跡 国会審議の会議録作成支援のための音声認識システム
- 招待講演 スマートポスターボード : ポスター会話のマルチモーダルなセンシングと認識 (音声)
- 議会の会議録作成のための音声認識-衆議院のシステムの概要-
- 声質に関する印象評価および心理的類似性と音響的類似性について
- 識別学習に基づく音声認識単語辞書の最適化の評価(言語モデル・辞書,第13回音声言語シンポジウム)
- 識別学習に基づく音声認識単語辞書の最適化の評価(言語モデル・辞書,第13回音声言語シンポジウム)
- 会議音声認識におけるBICに基づく高速な話者正規化と話者適応(音声,聴覚)
- 予稿の話し言葉変換に基づく言語モデルによる講演音声認識(言語モデル・辞書,第13回音声言語シンポジウム)
- 予稿の話し言葉変換に基づく言語モデルによる講演音声認識(言語モデル・辞書,第13回音声言語シンポジウム)
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- A^*探索に基づく大語彙連続音声認識
- 人工知能の新たなる発展を願って
- 動的因果関係解析法による電子回路の定性的解析
- LSIの動作記述からの知識獲得について