音声・音楽識別を目的とした特徴量の検討

概要

論文の詳細を見る
音声・音楽識別は音響コンテンツへのインデキシングやその前処理など、様々な応用が期待されており、現在多くの手法が提案されている。本研究では特に音声・音楽識別に用いられる特徴量に注目し、先行研究で有効性が示されている4種の特徴量の評価を行った。評価には性別やBGMの有無、歌声と楽器音の重畳などを考慮し設定した7種のクラスによりラベル付けをしたデータセットを用い、各特徴量の誤認識の傾向を分析した。
一般社団法人情報処理学会の論文
2002-12-19

著者

白井克彦
早稲田大学
大川茂樹
千葉工業大学
谷口徹
早稲田大学基幹理工学研究科情報理工学専攻
白井克彦
早稲田大学理工学部コンピュータ・ネットワーク工学部

関連論文

正弦波トラジェクトリに基づく楽器音中の音声強調
1983年IEEE音響・音声・信号処理国際会議 : ICASSP83
1990年音声言語処理国際会議
J-028 音声対話システム利用時における感情表出誘因性に関する考察(ヒューマンコミュニケーション&インタラクション,一般論文)
検索語の共起情報を利用した単語クラスタリングとWeb検索への応用
検索語の共起情報を利用した単語クラスタリングとWeb検索への応用(QA・Web検索)
係り受け解析のための辞書の構成とその学習機能
多次元心的状態を扱う音声対話システムの構築
音声対話システム汎用プラットホームにおける行動管理部の構築
音声対話システム汎用プラットフォームの検討
人間型ロボットの対話インタフェースにおける発話交替時の非言語情報の制御 (ヒューマンインタフェースとインタラクション)
人間型対話インタフェースにおけるまばたき制御の検討
人間とロボットのコミュニケーションにおける非言語情報の利用
A-4-23 「通る」歌声の分析(A-4.信号処理,一般セッション)
A-10-2 べき級数展開によるフォルマント表現(A-10.応用音響,一般セッション)
A-10-7 べき級数展開によるスペクトル予測推定(A-10. 応用音響,一般セッション)
サブバンド信号振幅変化に着目した音源分離(音声合成・分析)
新しい字幕制作実用化モデルシステムの設計・開発(デジタル放送技術, デジタル設備および一般)
多様な字幕表示形式を選択可能な字幕放送受信システム
9-8 字幕番組制作技術の研究開発フェーズ2における計画の概要
17-6 オフライン自動字幕番組制作システムの評価
8-5 字幕番組データを自動制作する新しい字幕制作システムの開発
聴覚障害者向けニュースの字幕提示方法に関する主観評価(人間の視覚・聴覚情報)
8-1 聴覚障害者のための字幕放送制作技術の研究状況 (第四報)
多様な提示法の字幕番組評価実験結果と実験用字幕番組の制作概要(人間とマルチメディア及び一般)
多様な提示法の字幕番組評価実験結果と実験用字幕番組の制作概要
8-3 聴覚障害者のための字幕放送制作技術の研究状況 (第三報)
多様な提示方法の実験字幕番組の自動制作手法と字幕評価実験概要 : 聴覚障害者向け自動字幕制作システムの研究開発
E-073 適応的言語処理を用いた音声認識利用による楽曲検索システムの検討(E分野:自然言語・音声・音楽)
中国語読解支援システムCHIDAOの設計
人間形会話ロボット : パラ言語の生成・理解機能を持つマルチモーダルインタフェース
D-14-14 品詞情報を用いた操作要求発話判別(D-14. 音声,一般セッション)
D-5-7 相手にあわせた発話調整機能のための言語情報からのユーザモデル生成手法の検討(D-5. 言語理解とコミュニケーション,一般セッション)
D-5-6 再利用可能情報収集のための構造化データベースの提案(D-5. 言語理解とコミュニケーション,一般セッション)
ユーザの発話を利用した聞き取りやすい英語への音声変換手法 (言語理解とコミュニケーション)
D-14-11 韻律条件付言語モデルを用いた音声認識のリスコアリング(D-14. 音声,一般セッション)
D-14-2 文頭・文末の音韻情報を加味した単文に有効な言語識別手法(D-14. 音声,一般セッション)
D-14-1 対話支援システムのための雑談判別(D-14. 音声,一般セッション)
音声対話システムにおける発話意図推定
ユーザの嗜好に適応させた選曲システムの提案
D-14-3 質問者の発話による発表スライド特定提示法(D-14.音声,一般セッション)
A-15-24 PC操作情報とソーシャルタグに基づいた楽曲推薦手法(A-15.ヒューマン情報処理,一般セッション)
サブバンド信号振幅変化に着目した音源分離(音声合成・分析)
情報系学長,おおいに語る
AMとFMの長時間分析に基づく音声認識
狭帯域解析信号と非線形識別分析を用いた音声認識(認識,理解,対話,一般)
可変長セグメントパタンマッチングに基づく楽音の音高・楽器推定
音声・楽器音・歌声が混在した音響信号中の音カテゴリ検出
母音および摩擦音発生時の発声器官の運動推定(2部ヒトの機能と特性)
箏曲異種楽譜の比較による歌の旋律分析
3G-5 箏曲の声楽部における旋律の分析
マルチモーダル入力環境下における音声の協調的利用 : 音声作図システムS-tgifの設計と評価
音声認識技術を利用した日本語発音学習システム
マルチメディアインタフェースにおける音声対話
音声・マウス・キーボードを併用した作図システムS-tgifとその評価
音声・マウス・キーボードを用いたマルチモーダル作図システム
ロボットの知能(これからのロボットと社会的インパクト)
音声母音スペクトルのべき級数展開とその零点分布(研究速報)
箏曲の歌における旋律とリズムの知識表現
箏曲の歌の旋律型とリズム型
筝曲の歌の旋律型とリズム型
楽譜情報に基づいた箏曲の音律と音階の分析
箏曲の歌におけるメリスマの表現
箏曲における歌の音階に関する考察
予測や予備運動が指運動の反応時間に与える影響
情報理論に基づく遮音性能評価の基礎的検討
1N-8 共起情報を用いた同表記異義の処理
Sinusoidal trajectoryを利用した音楽中の音声検出法
音声・楽器音・歌声が重畳した音響信号中のカテゴリ識別
音声・楽器音・歌声が重畳した音響信号中のカテゴリ識別
HMMを用いた音声・音楽識別(信号処理・符号化・一般)
HMMを用いた音声・音楽識別(信号処理・符号化・一般)
HMMを用いた音声・音楽自動識別の検討
音声・音楽識別を目的とした特徴量の検討
音声・音楽識別を目的とした特徴量の検討
音声・音楽識別を目的とした特徴量の検討
放送音源における音声・音楽区間セグメンテーション手法の検討
対面および非対面における対話の違い : 頭の振りの役割分析
画像特徴に基づくシーンの分類
ロボットとの対話における非言語情報の役割
人間型対話ロボットにおける非言語情報の役割
分散処理を意識した設計支援システムSYARDSの構築
マルチプロセッサによる分散処理を意識した専用プロセッサ設計支援システムSYARDSの構築
専用プロセッサ設計支援システム(SYARDS)におけるハードウェア指向・ソフトウェア指向合成法の評価
専用プロセッサ設計システム(SYARDS)と論理合成システムとの接続
専用プロセッサ設計支援システム(SYARDS)におけるパイプライン処理システムのための最適化
並列モジュール記述を可能とした高位記述言語による専用プロセッサ設計支援システム(SYARDS)の構築
新聞記事データベースを用いた大語い連続音声認識
新聞記事を用いた大語彙連続音声認識の検討
人類の文化としてのロボティクス
音声認識から音声対話へ
D-5-5 子どもの質問に対するわかりやすい回答提示システム(D-5.言語理解とコミュニケーション,一般セッション)
ユーザの発話を利用した聞き取りやすい英語への音声変換手法(一般(ポスターセッション),第11回音声言語シンポジウム)
ユーザの発話を利用した聞き取りやすい英語への音声変換手法(一般(ポスターセッション),第11回音声言語シンポジウム)
J-006 時空を越えたコミュニケーションを実現する音声インタフェースの提案(ヒューマンコミュニケーション&インタラクション,一般論文)
J-040 子供を対象とする音声対話インタフェースの検討(J分野:ヒューマンコミュニケーション&インタラクション)
音声認識のためのダイナミック非線形手法
I-046 音響信号処理に基づくサッカー映像のインデクシング手法(I.画像認識・メディア理解)
多様な字幕表示形式を選択可能な字幕放送受信システム
多様な字幕表示形式を選択可能な字幕放送受信システム

音声・音楽識別を目的とした特徴量の検討

スポンサーリンク

概要

著者

関連論文

スポンサーリンク