チャネル間相関を用いた多チャネル信号の可逆圧縮符号化(<特集>産学連携論文)
スポンサーリンク
概要
- 論文の詳細を見る
本稿では, 多チャネル時系列信号を対象に, 各チャネルごとの時間領域の線形予測とその残差信号のチャネル間相関に基づく適応的差分を柔軟に利用した可逆圧縮符号化法を提案する.予測残差信号のチャネル間相関関数を基準に, 符号化対象のチャネル信号から参照チャネルに最適重み係数を乗じた信号を引いた差信号を求め, 信号の振幅が小さくなる傾向を利用してエントロピー符号化を行う.参照チャネルと符号化対象チャネルは逐次芋づる式に求め, 参照チャネルの番号と重み係数を補助情報とする.また全体のチャネルを複数の集合に分割することで, 処理量の増大を防ぐ手法や, 重み係数と参照チャネルの探索を複数回繰り返す改善法を示した.通常の2から8チャネルの音響信号, 256チャネルの脳磁計を対象に本手法の符号化実験を行い, 2チャネルを対にした従来のジョイント・ステレオ符号化より最大約3%圧縮率を改善できることを示した.これらの提案手法はISO/IECのMPEG (Moving Picture Experts Group)で標準化が進められているロスレス・オーディオ信号の符号化モジュールとして提案され, オーディオ信号だけでなく, 広範囲の時系列信号の符号化に国際的に広く利用される見込みである.この研究は東京大学大学院情報理工学系研究科と日本電信電話株式会社との産学連携講座に基づく共同研究の成果である.
- 一般社団法人情報処理学会の論文
- 2005-05-15
著者
-
守谷 健弘
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
西本 卓也
東京大学情報理工学系研究科システム情報学専攻
-
西本 卓也
東京大学大学院情報理工学系研究科
-
嵯峨山 茂樹
東京大学大学院情報理工学系研究科
-
鎌本 優
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
鎌本 優
東京大学大学院情報理工学系研究科
-
守谷 健弘
東京大学大学院情報理工学系研究科
関連論文
- スパース性に基づくブラインド音源分離を用いたステレオ入力音声認識(音声,聴覚)
- オーディオ符号化技術の現状と最新動向
- 生体信号に適用するMPEG-4 ALSロスレス符号化のエンコーダのアルゴリズムとアーカイブフォーマット
- 音声認識応用に関する学会試行標準
- 音楽知識に基づく音高・音長の組合せ特徴量を用いたMIDIデータからの作曲家判別(音楽解析)
- 文字構造の文法記述に基づくオンライン手書き漢字列認識(テーマセッション4,文字・文書の認識・理解)
- 日本語歌詞からの自動作曲(音楽とOR)
- テンポ曲線と隠れマルコフモデルを用いた多声音楽MIDI演奏のリズムとテンポの同時推定(演奏認識/合成,便利で身近な音楽情報処理)
- ラジオ放送番組におけるスポーツ実況中継の分析(視覚障害/聴覚障害,一般)
- ラジオ放送番組におけるスポーツ実況中継の分析
- 調波音・打楽器音分離手法を用いた音楽音響信号からの自動和音認識(音響分析一般(2))
- Orpheus : 歌詞の韻律に基づいた自動作曲システム(自動作曲)
- パワースペクトログラムの伸縮に基づく多重音信号の再生速度と音高の実時間制御
- 早口合成音声の聴取実験によるテキスト音声合成の評価(視覚障害/聴覚障害/一般)
- 視覚障害者の聴覚認知の解明と音声対話への利用に向けて(ヒューマンコミュニケーショングループ (HCG) シンポジウム)
- 音声対話技術コンソーシアム(ISTC)の活動成果報告(SIG-SLP内組織の活動報告)
- マルチモーダル対話システムのための階層的アーキテクチャの提案
- 対面朗読者と視覚障害者の対話の分析とその応用(セッション3 : 理解るインタフェース : 音声対話)
- 対面朗読者と視覚障害者の対話の分析(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- スパース性に基づくブラインド音源分離を用いたステレオ入力音声認識
- 音声音響符号化技術と標準化動向
- HP-1-5 ラジオ放送支援システム「オラビー」の開発(HP-1.放送メディアにおける福祉情報の現状と可能性,パネル討論,ソサイエティ企画)
- MPEGオーディオ
- スパース性に基づくブラインド音源分離を用いた2チャンネル入力音声認識(音響処理・話者同定,第10回音声言語シンポジウム)
- モルフォロジ収縮処理と構造特徴複製に基づく画像インペインティング(一般セッション,手,顔,身体表現の認識,理解)
- モルフォロジ収縮処理と構造特徴複製に基づく画像インペインティング(一般セッション2)
- 複数残響特性下の音声を単一モデル学習に用いた未知残響環境に頑健な音声認識の検討(福祉と音声処理,一般)
- 4.インターネットと音声合成(バリアフリー社会に向けた音声情報処理)
- 音声CAPTCHAシステムにおける削除法と混合法の比較(福祉と音声処理,一般)
- 超早口音声の聴取における単語親密度の教示効果
- 音韻修復効果を用いた音声CAPTCHAの検討
- 音韻修復効果を用いた音声CAPTCHAの検討(高齢者の認知機能保障技術及び一般)
- 超早口音声の聴取における単語親密度の教示効果(高齢者の認知機能保障技術及び一般)
- 第46回ヒューマンインタフェース学会研究会報告
- 第2回 音声対話システムの開発方法論とプラットフォーム
- 探索的検索のための音声入力インタフェースの検討
- マルコフ確率場を用いた調認識、自動和声付け、および自動対位法
- 調波時間構造化クラスタリング(HTC)による音楽音響特徴量の同時推定
- 7. 擬人化音声対話エージェント(音声情報処理技術の最先端)
- 頭部モーションセンサと音声を用いた対話インタフェースの検討(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 頭部モーションセンサと音声を用いた対話インタフェースの検討(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 頭部モーションセンサと音声を用いた対話インタフェースの検討(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 頭部モーションセンサと音声を用いた対話インタフェースの検討
- 頭部モーションセンサと音声を用いた対話インタフェースの検討
- 音声CAPTCHAのための音韻修復効果の検討
- 調波構造・時間包絡・音色の統合的クラスタリングによる楽音分析(音楽音響信号処理 (2))
- ハーモニッククラスタリングと情報量規準による音楽の音高/音源数の推定(山下記念研究賞受賞記念講演)
- 音声認識技術を用いた音楽情報処理
- Specmurtにおける凖最適共通調波構造パターンの反復推定による多声音楽信号の可視化とMIDI変換(音楽音響信号認識)
- 歌唱曲自動作曲の需要と今後 - 2年間のOrpheus運用を通じて
- 単旋律と和音の確率モデルの組み合わせによるピアノ曲演奏の自動表情付け
- 非和声音規則に基づく経路制約を用いた旋律自動生成
- 単語親密度を統制した超早口音声の聴取に対する慣れの検討(福祉情報工学,ヒューマンコミュニケーション〜人間中心の情報環境構築のための要素技術〜論文)
- G-001 最大エントロピーモデルに基づく統計的な音楽情報の解析(G分野:音声・音楽)
- 第53回WIT研究会におけるリアルタイム映像配信の報告
- 音声言語インタフェースのための情報処理学会試行標準
- 歌唱曲自動作曲の需要と今後 : 2年間の Orpheus 運用を通じて
- 予測誤差のGolomb-Rice符号量を最小化する線形予測分析(電気音響,音響一般)
- 階層的MMIアーキテクチャに基づくプラットフォーム実装方法の検討
- 複素スペクトル円心(CSCC)の推定に基づくマイクロホンアレーによる雑音抑圧
- マルチメディアの基礎技術-1-音声・楽音の情報圧縮
- ブロードバンドサービスを支えるメディア符号化・配信基盤技術 (特集論文 メディア配信技術)
- 音声音響符号化技術と標準化動向
- 音声音響符号化技術と標準化動向
- 音声・オーディオの処理技術
- オーディオ符号化の最新標準化動向
- 音声音響符号化における標準(音響技術における標準)
- MPEG-4 ALSの性能・応用と関連する標準化活動 (高品質ロスレス・オーディオ符号化技術と展開)
- ロスレス・オーディオ符号化MPEG-4 ALSの高性能化 (高品質ロスレス・オーディオ符号化技術と展開)
- 高品質音響信号処理と符号化の研究展望 (高品質ロスレス・オーディオ符号化技術と展開)
- オーディオ符号化技術とMPEG標準
- 音声・オーディオの処理技術
- ISO/IEC MPEG-4 Audio Lossless Coding (ALS)におけるチャネル内とチャネル間の長期予測(国際標準に向けたテレコム技術とその効用論文)
- ISO/IEC MPEG-4 Audio Lossless Coding (ALS)におけるIEEE754浮動小数点信号の可逆符号化(国際標準に向けたテレコム技術とその効用論文)
- R&Dホットコーナー MPEG-4 ALS--歪みを許さない「ロスレス・オーディオ符号化」の国際標準
- 多チャンネル時系列信号のロスレス符号化
- チャネル間相関を用いた多チャネル信号の可逆圧縮符号化(産学連携論文)
- MPEG-4 TwinVQスケーラブルオーディオ符号化の品質評価とパケット損失環境下における品質改善
- 高機能ロスレス・スケーラブルオーディオ符号化 : サンプルレートと振幅分解能の階層的符号化
- D-14-21 MPEG-4標準TwinVQスケーラブルオーディオ符号化のパケット損失における品質評価
- 高圧縮符号化を含むロスレス・スケーラブル符号化
- M-016 チャンネル間相関を用いた多チャンネル信号の可逆圧縮符号化(M.ネットワーク・モバイルコンピューティング)
- 呼吸とリズムを合わせる音楽呈示の可能性-呼吸とフレーズの位相関係の違いの効果-
- (第48回)インタネットで音楽はどのように配信されるのですか(てれび・さろん〜知らないわけではないけれど〜)
- 音声・オーディオの処理技術
- 研究分野の世界の顔 "NTT R&Dフェロー"に聞く(3)100年以上未来の人たちに使ってもらえる歪みの生じないロスレス符号化
- 音声・オーディオの処理技術
- R&D Spirits 音楽配信ビジネスの新たな可能性を拓くロスレス・スケーラブル符号化--守谷健弘 NTTサイバースペース研究所メディア処理プロジェクト主幹研究員
- 5.MPEG-4オーディオの技術と機能(音声圧縮技術)
- 10.音声符号化技術(モバイル社会を支える先端技術 : 小型化と使いやすさを極める)
- 音声音響信号の符号化手法(ディジタル時代の放送とその周辺技術)
- トピックス15 携帯電話・PHS実現の鍵 波形符号化(〈特集〉-音響学における20世紀の成果と21世紀に残された課題-)
- ネットワークオーディオ
- TwinVQとは何か? (特集 Digital Audio探検隊) -- (MP3はもう古い。TwinVQを使ってアプリケーションを作ってみよう)
- 音声と楽音の情報圧縮の原理と標準化
- 音声と楽音の情報圧縮の原理と標準化
- 2-2 MPEG-4カードオーディオ(2.MPEG-4アプリケーション展開)(MPEGの新展開)
- MPEGー4オーディオ標準化とTwinVQ (特別記事:高品質音楽圧縮技術(TwinVQ)とその応用)
- 符号帳の学習アルゴリズム (移動通信用PSI-CELP音声符号化方式)
- A-4-7 減衰及び遅延のある共通要素を持った多チャネル信号の復元(A-4.信号処理,一般セッション)