ビデオ教材作成支援を目的とした講義音声によるシーン分割(教育工学)
スポンサーリンク
概要
- 論文の詳細を見る
ネットワーク上で利用できるビデオ教材は増えてきつつあるが, まだ少ない.ビデオ教材が少ない原因の一つはビデオ編集に手間と時間を要するためだと考えられる.そこで本論文ではビデオ教材作成支援を目的とし, 編集前の講義ビデオの音声情報から自動的にシーン分割位置を推定する方法について検討する.ビデオの音声情報から認識を行った結果得られたテキスト情報より独立成分分析を用いて求められた指標を動的計画法により順次比較することでシーン分割位置推定を行った.5人の教員による編集前の講義ビデオを用いて実験を行った結果, 提案手法はHearst法と同等以上の分割性能をもちながら, 分割数を自由に設定できることが分かった.また, 音声認識結果を用いたシーン分割性能は書き起こしテキストと同等であることが確認された.
- 社団法人電子情報通信学会の論文
- 2005-05-01
著者
関連論文
- FTTSSに基づいた音声認識LSIの開発(FPGAとその応用及び一般)
- FTTSSに基づいた音声認識LSIの開発
- FTTSSに基づいた音声認識LSIの開発(FPGAとその応用及び一般)
- FTTSSに基づいた音声認識LSIの開発(FPGAとその応用及び一般)
- FTTSSに基づいた音声認識LSIの開発(FPGAとその応用及び一般)
- 雑音下音声認識のための重み付け分散拡大に基づく単語HMMの耐雑音性の改善(音声,聴覚)
- 有声音検出に基づくロンバード音声認識と工場における検反システムへの応用
- 音声認識における単語HMMの重み付け分散拡大による耐雑音性の検討
- 単語HMMの重み付け分散拡大による雑音環境下音声認識
- 粘弾性体による声帯音源の構築
- BPF対バンクによる耐雑音性をもった音声特徴抽出
- 複数の変調スペクトル解像度を用いた音声認識の耐雑音性
- 画像の解像度変換法に関する一考察
- 音声対話による飲食店案内システムの構築
- 汎用ディジタル信号処理プログラムの開発
- 適応フィルタのサブバンド処理を可能とする評価関数の提案
- 確率的な韻律規則を文脈自由文法に組み込んだ連続音声認識
- 単語音声認識における時間変化を表現する特徴量の耐雑音性について(聴覚・音声/一般)
- 統計的な手法による動画シーン分割性能の改善
- D-14-18 スペクトル傾斜検出フィルタによる音声認識とその耐雑音性の検討
- スペクトル傾斜検出フィルタを用いた単語音声認識
- ビデオ教材作成支援を目的とした講義音声によるシーン分割(教育工学)
- G-006 動的計画法を用いた音声による講義ビデオシーン自動分割(G.音声・音楽)
- (76)講義ビデオ作成システムのためのシーン選択システムの構築(セッション22 e-ラーニング(インターネット・マルチメディア利用教育を含む)II)
- 独立成分分析を用いた音声による講義ビデオシーン分割
- 石川高専ネットワ-クの現状と課題
- 講義音声認識と講義ビデオシーン自動分割への応用 (テーマ:「e-Learningとインタラクティブ技術--音声言語処理・対話技術の教育への応用と展開」および一般)
- Kohonen特徴地図を利用した単語音声認識のためのHMM出力確率の平滑化
- 自動シーン分割を利用したビデオ教材作成支援システム
- パターンマッチング方式BPFP法による耐雑音性のあるピッチ抽出
- ピッチ乱れ,波形変動及び雑音付加に対するBPFPピッチ抽出法の性能評価
- 変調スペクトルの重要な成分のみを選択的に用いた雑音に強い音声認識
- 特徴空間における時間正規化を前処理に用いた HMM 単語認識
- BPFP 法による音声特徴量の耐雑音性向上に関する検討
- HMM出力確率の共分散行列に対する制約条件の実験的考察
- フィードバック付き多層相互結合形NNによる音声ピッチ抽出およびU/V判定
- 数値シミュレーションによる声門流れの乱流化の検討
- デ-タベ-ス検索のための音声対話システムの構築
- 非対称声帯モデルによる疾患音声生成の数値シミュレーション(聴覚・音声/一般)
- 音声認識のための特徴量FTTSSの電話音声認識への適用について(聴覚・音声/一般)
- 音声LSPパラメータ量子化ニューラルネットにおける中間層符号パターンと量子化歪の関連
- 音声による講義ビデオシーン分割方法の検討
- 講義音声認識と講義ビデオシーン自動分割への応用 (テーマ:「e-Learningとインタラクティブ技術--音声言語処理・対話技術の教育への応用と展開」および一般)
- 2進符号を教師信号にもつ階層型ニュ-ラルネットの学習
- システム管理者にも情報が漏洩しない情報管理システムの構築
- 階層型ネットワークによる音声LSPパラメータのベクトル量子化
- D-14-17 雑音に強い単語音声認識特徴量
- B-4-39 公共空間における電磁波環境計測と評価 : 中波送信アンテナ近傍の公園の場合
- 単語音声認識におけるHMM出力確率の共分散行列に対する制約条件の実験的考察
- ニューラルネットを用いた音声の音韻セグメンテーション
- 音声変換のための逐次処理による音源波形作成法
- 単音節波形の連接による日本語単語音声合成
- 単音節波形の連接による日本語単語音声合成
- ケプストラム係数の規格化による単語認識改善に関する検討
- スペクトル傾斜に着目した音声認識のための特徴抽出
- BPFPメルケプストラム の音声認識における耐雑音性の検討
- スペクトル傾斜に着目した音声の特徴抽出
- エルゴディック隠れマルコフモデルを用いた単語境界の抽出
- エルゴディック離散/連続HMMを用いた単語境界の抽出
- 3層NNによるLSPパラメータのベクトル量子化と聴取実験による検討
- 実環境下単語音声区間検出のための雑音EHMM再学習の効果
- 実環境下単語音声区間検出のための雑音EHMM再学習の効果
- 有声/無声音混在区間を考慮したU/Vニューラルネットワーク
- SP2000-34 音声の変調スペクトル中に含まれる情報の調査 : 音声認識情報と話者識別情報との比較
- 連続音声認識に適した構文意味解析について
- 時変ディジタルフィルタによる音声基本周波数の抽出
- 電気的喉頭波形を用いた連続音声の 有声/無声/混合 分類
- 音声中の言語情報を担う変調スペクトル特性の検討
- 逐次処理方式による音声分析合成
- 未知入力を伴うARモデルの逐次処理方式による音声分析合成
- ロバストな音声認識実現を目的とした変調スペクトル特性の検討
- ロバストな音声認識実現を目的とした変調スペクトル特性の検討
- ロバストな音声認識実現を目的とした変調スペクトル特性の検討
- 頑強な音声認識のための環境適応係数の識別誤り最小化学習
- 電気的喉頭波形を用いた連続音声のU/V判定とピッチ抽出
- 超だ円面識別ユニットによる音韻認識
- 連続音声認識ニューラルネットの後処理
- 隠れマルコフモデルのテキスト依存型話者認識への応用
- ニューラルネットによる連続音声認識
- ニュ-ラルネットによる連続音声の音韻セグメンテ-ション
- 「音素チャ-ト」に基づく中国語連続音声の母音認識
- 連続音声の音素レベルセグメンテ-ションの高速処理システム
- 帯域フィルタ対バンクによる音声ピッチ抽出
- 状態数の調整によるHMM単語音声認識システムの改善
- 推定された声帯音源波の個人性評価と類似性判断
- 並列ホルマントモデルによる混合音の波形分離
- 2値スペクトルパタ-ン間の類似度による単語音声認識のためのフィルタ群について
- 心表面興奮伝播図の自動表示システム
- カルマンフィルタによる線形予測係数の推定について
- RK-009 時代のニーズに合わせた学習意欲を向上させるための実践的な組込みシステム教育教材の開発と評価(教育工学(5),K分野:教育工学・福祉工学・マルチメディア応用)