ミュージカル映画中の音声区間検出
スポンサーリンク
概要
- 論文の詳細を見る
The process of detecting portions involving utterances, which is essential for captioning films, is generally carried out manually by translators at present. Robust methods are inevitable for automatic voice activity detection (VAD) in films involving other irrelevant sound information such as background music. This paper proposes a new feature for automatic VAD. The proposed method utilizes the gradient of spectrum in high-frequency domain (4-6kHz) and the standard deviation of modulation-filtered cepstrum. For evaluation experiments, we used a portion (about 23 minutes) of an English musical film. The proposed method exhibits a 22.6% reduction in total error rate compared to the conventional one utilizing the short time energy.
- 2007-03-30
著者
関連論文
- 電磁オシログラフ(音の博物館)
- 雑音・残響下における科学技術英語の学習教材の開発(音声・言語・音響教育,一般)
- ニューラルネットワークによる次期の株価予測 : 株価予測におけるフィルタリングによる特徴量抽出
- 小特集「誌上ビギナーズセミナー」にあたって(誌上ビギナーズセミナー)
- 雑音・残響下における発話の音響的特徴の話者変動(言語獲得・学習,合成,生成,韻律,一般)
- 波動音響シミュレータによる指向性の精度検証
- 日立シビックセンター科学館(音の博物館)
- 日本語母語話者成人と発達性構音障害児の摩擦音知覚における音響的手がかり(聴覚・音声・言語とその障害,一般)
- 日本語母語話者の摩擦音知覚における音響的手がかりについて(聴覚・音声・言語とその障害, 一般)
- 音バリアフリーの現状と課題
- 電気残響可変システムを付加したホールにおける定常部抑圧処理の評価 : 音声明瞭度改善のための前処理の実環境導入へむけて
- 残響環境における音声明瞭度の改善のための前処理 : 高齢者を対象とした音声定常部抑圧処理の効果
- 高齢者を対象とした残響環境下における音声定常部抑圧処理の評価実験(聴覚・音声・言語とその障害, 一般)
- 高齢者を対象とした残響環境下における音声定常部抑圧処理の評価実験
- 小・中規模ホール環境を想定した定常部抑圧による拡声音声の明瞭度改善(国際ワークショップ:Speech dynamics by Ear, Eye, Mouth and Machine)
- 定常部抑圧による音声明瞭度改善のための前処理 : 異なる残響環境下について
- 音韻・韻律情報を用いた両耳融合聴課題に関する検討(言語獲得・学習,合成,生成,韻律,一般)
- 失語症者におけるピッチアクセント異同弁別能力
- 連載企画「音の博物館」を終えるにあたって(音の博物館)
- 母音のエネルギー定常部抑圧による高齢者に対する音節強調の検討
- 開鼻声の聴覚判定における嗄声の影響 : 音源フィルタ理論による検討
- 変調スペクトルの貢献度に基づく連続音声認識(国際ワークショップ:Speech dynamics by Ear, Eye, Mouth and Machine)
- 音声の定常部抑圧の残響に対する効果
- 定常部抑圧処理による残響環境下の音声強調(ANC・エコーキャンセラー・ノイズキャンセラー/一般)
- 四次元MRIによる発音時の鼻咽腔閉鎖運動の観察 : 鼻咽腔閉鎖パターンと口蓋帆挙筋の動きとの関連の検討(第8回音声言語シンポジウム)
- 四次元MRIによる発音時の鼻咽腔閉鎖運動の観察 : 鼻咽腔閉鎖パターンと口蓋帆挙筋の動きとの関連の検討(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 小特集「音支援(音バリアフリー)を考える」にあたって
- 定常部抑圧による単音節の子音強調と高齢者への実験
- 高齢者を対象にした定常部抑圧による単音節強調処理の検討(聴覚・音声・言語とその障害, 一般)
- 言語聴覚士のための音響教育 : 基礎から実用へ(現代のニーズに即した魅力ある音響教育)
- 変調スペクトルの貢献度に基づく連続音声認識
- ノイズの変調 Wavelet を用いた音声認識特徴量の選択的利用
- 変調スペクトルの貢献度に基づく音声認識特徴量
- 複数の変調スペクトル解像度を用いた音声認識の耐雑音性
- 音声コミュニケーションに関わるバリアフリー(音支援(音バリアフリー)を考える)
- 発話の困難な障害者のための声質変換・HMM音声合成を用いた日英音声合成システムの構築(音声合成・分析)
- 発話の困難な障害者のための声質変換・HMM音声合成を用いた日英音声合成システムの構築(音声合成・分析)
- 聴取による話者識別における鼻音・口音の非対称性と音響的距離との関連
- 聴取による話者識別における音韻間の格差と音響的対応(聴覚・音声・言語とその障害, 一般)
- 声道の共鳴現象の可視化への試み : 音声科学における音響教育の充実を図る
- 口蓋裂児の発声行動について : 口蓋形成術前と術後での発声行動の変化について(聴覚・音声・言語とその障害, 一般)
- PLPにおける聴覚特性を応用した音声強調の検討
- 聴覚障碍者のための口形つきアニメーションの教材に関する検討 (The Clinical Relation between Phonetics and Speech Pathology)
- 聴覚障碍者のための口形つきアニメーションの教材に関する検討
- 聴覚障碍者のための口形つきアニメーションの教材に関する検討
- 日本人ALS患者のための日英バイリンガル音声合成システムの構築
- 日本人ALS患者のための日英バイリンガル音声合成システムの構築
- 声道模型の音源に関する検討 : ホーンスピーカのドライバユニットの応用
- ディジタル補聴器のための臨界帯域圧縮アルゴリズム
- ディジタル補聴器のための臨界帯域圧縮アルゴリズム
- 変調スペクトルを用いた環境音の分析
- 聴覚フィルタの広がりの補償を目的とした臨界帯域圧縮処理の模擬難聴環境下での評価(聴覚・音声・言語とその障害,一般)
- ミュージカル映画中の音声区間検出
- 鼻音化母音におけるフォルマントの周波数シフトとその補償
- 軟らかい素材による軟口蓋を伴う声道の物理模型(ポスターセッション,第10回音声言語シンポジウム)
- 軟らかい素材による軟口蓋を伴う声道の物理模型(ポスターセッション,第10回音声言語シンポジウム)
- 軟らかい素材による軟口蓋を伴う声道の物理模型(ポスターセッション,第10回音声言語シンポジウム)
- 人にやさしい音声の話題
- 浜松科学館(音の博物館)
- 「音声によるバリアフリー」に向けた、公共空間で高齢者が聞き取りやすい拡声音情報の調査
- 単音節による雑音下の個人性知覚
- 変調スペクトルの重要な成分のみを選択的に用いた雑音に強い音声認識
- Q&Aコーナー(コーヒーブレーク)
- 鼻腔をともなう声道模型の生成音に関する検討
- 国際交流委員長挨拶(新会長および新委員長の就任挨拶)
- 肺の模型と声道形状を視覚的に捉えられる頭部模型を用いた音響教育教材
- 「より直感に訴える音響教育」を音声科学に取り入れるには
- 雑音・残響環境下の拡声音声に適した発話に関する検討(音声・言語・音響教育,一般)
- 日本語における変調スペクトルとリズムの単位(リズムとタイミング)
- 音響管を用いた音響学・音声科学の教育(音声・言語・音響教育,一般)
- 小中学生に対する音響教育(現代のニーズに即した魅力ある音響教育)
- 小特集「現代のニーズに即した魅力ある音響教育」にあたって
- 声道模型(音の博物館)
- C7. 強さ曲線と変調スペクトルの日本語音節との関係(研究発表,日本音声学会創立80周年記念式典・第20回全国大会発表要旨)
- 声道模型を用いた音響教育--音声生成のしくみ
- B5. 韻律類型論への音響的アプローチ : 音源特徴の聴取による韻律類型の識別(研究発表,第18回全国大会発表要旨)
- B1. 韻律類型論への音響的アプローチ(第17回全国大会発表要旨)
- SP2000-34 音声の変調スペクトル中に含まれる情報の調査 : 音声認識情報と話者識別情報との比較
- A4. 千葉・梶山による声道模型の復元とその教材としての応用(第16回全国大会発表要旨)
- 音響と調音のインタフェース(音声学・音韻論の過去・現在・未来)
- C9. 日本人学習者のフランス語鼻母音生成のための方策 : F1変化をもたらす調音方法の観察(研究発表,第19回全国大会発表要旨)
- 小特集「子どもの音声」にあたって(子どもの音声)
- 高齢者における聴覚特性の劣化が無声摩擦音・破擦音の識別に及ぼす影響
- 小特集「子どもの音声」にあたって
- B3-2. 語頭の無声摩擦音・破擦音識別におけるcue trading : 摩擦部の持続時間と振幅に着目して(研究発表,音声学会2011年度(第25回)全国大会発表要旨)
- 異音は音素より知覚しにくいのか : 英語話者が英語閉鎖音を知覚した場合(口頭発表,第323回研究例会発表要旨)
- S2. 音声信号の可視化とその音声学的価値(講演,シンポジウム「見て理解する音声学」,第19回全国大会発表要旨)
- 高齢者における聴覚特性の劣化が無声摩擦音・破擦音の識別に及ぼす影響
- Q&Aコーナー(コーヒーブレーク)
- 「電子メール」と「携帯電話」(ちょっとしたエッセイ)(コーヒーブレーク)
- 最近の国際会議における音響教育の話題(音響教育特集号)