基準となる聴覚心理を用いたオーディオ圧縮の特性評価
スポンサーリンク
概要
- 論文の詳細を見る
オーディオ圧縮において聴覚心理モデルと周波数分析の組み合わせが主流となって10年以上がたつ。聴覚心理の利用によって性能が向上した反面、音質評価に単純な客観尺度を用いることができなくなった。最近になってlTU-Rの勧告に基づく客観評価ツール等も利用できるようになってきたが、符号化方式そのものの改良や比較にこれらのツールを使うことは、若干疑問が残る点がある。本報告では事前に準備した参照聴覚心理によるな歪割当を利用して符号化方式を評価する方法を提案する。再生された音の品質は評価できないがエントロピー圧縮効果は精度よく測定可能で、これによりオーディオ符号化を改良した場合の効果を評価するために主観評価試験と合わせて補足的に利用することができる。MPEG/Audio Layer IIの評価を行った例を示し、評価方法自体の特徴、利害得失を示す。
- 社団法人電子情報通信学会の論文
- 2001-06-19
著者
関連論文
- 正弦波トラジェクトリに基づく楽器音中の音声強調
- 1983年IEEE音響・音声・信号処理国際会議 : ICASSP83
- 1990年音声言語処理国際会議
- J-028 音声対話システム利用時における感情表出誘因性に関する考察(ヒューマンコミュニケーション&インタラクション,一般論文)
- 検索語の共起情報を利用した単語クラスタリングとWeb検索への応用
- 検索語の共起情報を利用した単語クラスタリングとWeb検索への応用(QA・Web検索)
- 係り受け解析のための辞書の構成とその学習機能
- 多次元心的状態を扱う音声対話システムの構築
- 音声対話システム汎用プラットホームにおける行動管理部の構築
- 音声対話システム汎用プラットフォームの検討
- 人間型ロボットの対話インタフェースにおける発話交替時の非言語情報の制御 (ヒューマンインタフェースとインタラクション)
- 人間型対話インタフェースにおけるまばたき制御の検討
- 人間とロボットのコミュニケーションにおける非言語情報の利用
- A-4-23 「通る」歌声の分析(A-4.信号処理,一般セッション)
- A-10-2 べき級数展開によるフォルマント表現(A-10.応用音響,一般セッション)
- A-10-7 べき級数展開によるスペクトル予測推定(A-10. 応用音響,一般セッション)
- サブバンド信号振幅変化に着目した音源分離(音声合成・分析)
- 新しい字幕制作実用化モデルシステムの設計・開発(デジタル放送技術, デジタル設備および一般)
- 多様な字幕表示形式を選択可能な字幕放送受信システム
- 9-8 字幕番組制作技術の研究開発フェーズ2における計画の概要
- 17-6 オフライン自動字幕番組制作システムの評価
- 8-5 字幕番組データを自動制作する新しい字幕制作システムの開発
- 聴覚障害者向けニュースの字幕提示方法に関する主観評価(人間の視覚・聴覚情報)
- 8-1 聴覚障害者のための字幕放送制作技術の研究状況 (第四報)
- 多様な提示法の字幕番組評価実験結果と実験用字幕番組の制作概要(人間とマルチメディア及び一般)
- 多様な提示法の字幕番組評価実験結果と実験用字幕番組の制作概要
- 8-3 聴覚障害者のための字幕放送制作技術の研究状況 (第三報)
- 多様な提示方法の実験字幕番組の自動制作手法と字幕評価実験概要 : 聴覚障害者向け自動字幕制作システムの研究開発
- E-073 適応的言語処理を用いた音声認識利用による楽曲検索システムの検討(E分野:自然言語・音声・音楽)
- 中国語読解支援システムCHIDAOの設計
- 人間形会話ロボット : パラ言語の生成・理解機能を持つマルチモーダルインタフェース
- D-14-14 品詞情報を用いた操作要求発話判別(D-14. 音声,一般セッション)
- D-5-7 相手にあわせた発話調整機能のための言語情報からのユーザモデル生成手法の検討(D-5. 言語理解とコミュニケーション,一般セッション)
- D-5-6 再利用可能情報収集のための構造化データベースの提案(D-5. 言語理解とコミュニケーション,一般セッション)
- ユーザの発話を利用した聞き取りやすい英語への音声変換手法 (言語理解とコミュニケーション)
- D-14-11 韻律条件付言語モデルを用いた音声認識のリスコアリング(D-14. 音声,一般セッション)
- D-14-2 文頭・文末の音韻情報を加味した単文に有効な言語識別手法(D-14. 音声,一般セッション)
- D-14-1 対話支援システムのための雑談判別(D-14. 音声,一般セッション)
- 音声対話システムにおける発話意図推定
- ユーザの嗜好に適応させた選曲システムの提案
- D-14-3 質問者の発話による発表スライド特定提示法(D-14.音声,一般セッション)
- A-15-24 PC操作情報とソーシャルタグに基づいた楽曲推薦手法(A-15.ヒューマン情報処理,一般セッション)
- サブバンド信号振幅変化に着目した音源分離(音声合成・分析)
- 情報系学長,おおいに語る
- AMとFMの長時間分析に基づく音声認識
- 狭帯域解析信号と非線形識別分析を用いた音声認識(認識,理解,対話,一般)
- 可変長セグメントパタンマッチングに基づく楽音の音高・楽器推定
- 音声・楽器音・歌声が混在した音響信号中の音カテゴリ検出
- 母音および摩擦音発生時の発声器官の運動推定(2部 ヒトの機能と特性)
- 箏曲異種楽譜の比較による歌の旋律分析
- 3G-5 箏曲の声楽部における旋律の分析
- マルチモーダル入力環境下における音声の協調的利用 : 音声作図システムS-tgifの設計と評価
- 音声認識技術を利用した日本語発音学習システム
- マルチメディアインタフェースにおける音声対話
- 音声・マウス・キーボードを併用した作図システムS-tgifとその評価
- 音声・マウス・キーボードを用いたマルチモーダル作図システム
- ロボットの知能(これからのロボットと社会的インパクト)
- 音声母音スペクトルのべき級数展開とその零点分布(研究速報)
- 箏曲の歌における旋律とリズムの知識表現
- 箏曲の歌の旋律型とリズム型
- 筝曲の歌の旋律型とリズム型
- 楽譜情報に基づいた箏曲の音律と音階の分析
- 箏曲の歌におけるメリスマの表現
- 箏曲における歌の音階に関する考察
- 予測や予備運動が指運動の反応時間に与える影響
- 情報理論に基づく遮音性能評価の基礎的検討
- 1N-8 共起情報を用いた同表記異義の処理
- Sinusoidal trajectoryを利用した音楽中の音声検出法
- 音声・楽器音・歌声が重畳した音響信号中のカテゴリ識別
- 音声・楽器音・歌声が重畳した音響信号中のカテゴリ識別
- HMMを用いた音声・音楽識別(信号処理・符号化・一般)
- HMMを用いた音声・音楽識別(信号処理・符号化・一般)
- HMMを用いた音声・音楽自動識別の検討
- 音声・音楽識別を目的とした特徴量の検討
- 音声・音楽識別を目的とした特徴量の検討
- 音声・音楽識別を目的とした特徴量の検討
- 放送音源における音声・音楽区間セグメンテーション手法の検討
- 対面および非対面における対話の違い : 頭の振りの役割分析
- 画像特徴に基づくシーンの分類
- ロボットとの対話における非言語情報の役割
- 人間型対話ロボットにおける非言語情報の役割
- 分散処理を意識した設計支援システムSYARDSの構築
- マルチプロセッサによる分散処理を意識した専用プロセッサ設計支援システムSYARDSの構築
- 専用プロセッサ設計支援システム(SYARDS)におけるハードウェア指向・ソフトウェア指向合成法の評価
- 専用プロセッサ設計システム(SYARDS)と論理合成システムとの接続
- 専用プロセッサ設計支援システム(SYARDS)におけるパイプライン処理システムのための最適化
- 並列モジュール記述を可能とした高位記述言語による専用プロセッサ設計支援システム(SYARDS)の構築
- 新聞記事データベースを用いた大語い連続音声認識
- 新聞記事を用いた大語彙連続音声認識の検討
- 人類の文化としてのロボティクス
- 音声認識から音声対話へ
- D-5-5 子どもの質問に対するわかりやすい回答提示システム(D-5.言語理解とコミュニケーション,一般セッション)
- ユーザの発話を利用した聞き取りやすい英語への音声変換手法(一般(ポスターセッション),第11回音声言語シンポジウム)
- ユーザの発話を利用した聞き取りやすい英語への音声変換手法(一般(ポスターセッション),第11回音声言語シンポジウム)
- J-006 時空を越えたコミュニケーションを実現する音声インタフェースの提案(ヒューマンコミュニケーション&インタラクション,一般論文)
- J-040 子供を対象とする音声対話インタフェースの検討(J分野:ヒューマンコミュニケーション&インタラクション)
- 音声認識のためのダイナミック非線形手法
- I-046 音響信号処理に基づくサッカー映像のインデクシング手法(I.画像認識・メディア理解)
- 多様な字幕表示形式を選択可能な字幕放送受信システム
- 多様な字幕表示形式を選択可能な字幕放送受信システム