音響伝達特性を用いたシングルチャネル音源位置推定における局所的回帰に基づく未学習位置の補間 (音声・第14回音声言語シンポジウム)
スポンサーリンク
概要
著者
関連論文
-
階層的強化学習を適用したPOMDPによるカーナビゲーションシステムの音声対話制御 (音声)
-
複数の言語情報を用いたCRFによる音声認識誤りの検出
-
D-11-67 位相限定相関法を用いたマイクロ波レーダからの地表変位推定(D-11.画像工学,一般セッション)
-
D-11-57 ウェーブレット変換を用いた学習型の超解像(D-11.画像工学,一般セッション)
-
D-12-91 3次元パーティクルフィルタとEMDを用いた選手の追跡(D-12.パターン認識・メディア理解,一般セッション)
-
階層的強化学習を適用したPOMDPによるカーナビゲーションシステムの音声対話制御(認識,理解,対話,一般)
-
バイラテラルフィルタによる実雑音下音声認識のための音声特徴量抽出(音声・言語・音響教育,一般)
-
音声・映像認識連携への取り組み : 3.画像と音声情報を統合した発話認識
-
確率スペクトル包絡に基づくNMF基底生成モデルを用いた混合楽音解析
-
D-12-70 階層的領域分割法に基づく木構造条件付確率場による一般物体認識(D-12.パターン認識・メディア理解,一般セッション)
-
構音障害者の音声認識における動的特徴量の考察(福祉と音声処理,一般)
-
ランダムプロジェクションを用いた音声特徴量変換(音響モデル,認識,理解,対話,一般)
-
1ZC-3 多重解像度独立性検定を用いた遺伝子ネットワークの構築(バイオ情報学と医用画像,学生セッション,コンピュータと人間社会)
-
D-12-23 AAMのモデル選択による方位に頑健な不特定人物の顔表情認識(D-12.パターン認識・メディア理解A(パターンメディアの認識・理解・生成),一般セッション)
-
D-12-76 複数特徴量の重み付け統合による一般物体認識(D-12.パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス),一般セッション)
-
AAMを用いた唇領域特徴による音声発話認識(一般セッション,クロスモーダル)
-
AAMを用いた唇領域特徴による音声発話認識(一般セッション,クロスモーダル)
-
AAMを用いた唇領域特徴による音声発話認識(一般セッション,クロスモーダル)
-
AAMを用いた唇領域特徴による音声発話認識(一般セッション,クロスモーダル)
-
Buried Markov Modelを用いた構音障害者の音声認識の検討(テーマセッション,福祉と見守りのための画像・音声処理)
-
Buried Markov Modelを用いた構音障害者の音声認識の検討(テーマセッション,福祉と見守りのための画像・音声処理)
-
Buried Markov Modelを用いた構音障害者の音声認識の検討(テーマセッション,福祉と見守りのための画像・音声処理)
-
音声・状況の同時認識に基づくスポーツ実況中継へのメタ情報付与
-
D-12-122 Bottom-UpとTop-Downアプローチの統合による単眼画像からの人体3次元姿勢推定(D-12.パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス),一般セッション)
-
D-12-122 SIFTとGraph Cutsを用いた物体認識及びセグメンテーション(D-12. パターン認識・メディア理解,一般セッション)
-
多重ベータ混合モデルを用いた調波時間構造のモデル化による音声合成の検討(一般(ポスターセッション),第11回音声言語シンポジウム)
-
多重ベータ混合モデルを用いた調波時間構造のモデル化による音声合成の検討(一般(ポスターセッション),第11回音声言語シンポジウム)
-
AAMを用いた顔方位にロバストな唇領域特徴抽出と音声特徴による構音障害者の音声認識(一般(ポスターセッション),第11回音声言語シンポジウム)
-
ランダムプロジェクションを用いた音響モデルの線形変換(一般(ポスターセッション),第11回音声言語シンポジウム)
-
Buried Markov Modelを用いた音声認識モデルの構築法の検討(一般(ポスターセッション),第11回音声言語シンポジウム)
-
実時間カメラワーク評価に基づく単一ショット訓練指向型オンライン映像撮影ナビゲーションシステム : 映像文法を背景とした映像撮影学習システムに向けて
-
輝度投影相関と二分化テンソルヒストグラムを併用したオンライン処理向けカメラワーク解析法の精度向上 : 訓練指向型オンライン映像撮影ナビゲーションシステム
-
嗜好分類に基づく個人適応型サッカー映像の自動生成技術(スポーツ・運動映像のパターン認識・理解)
-
H-011 人物の顔画像情報に基づくコンテンツの解析(画像認識・メディア理解,一般論文)
-
H-006 高精度画像マッチングを用いたSAR衛星画像からの地表変位推定(画像認識・メディア理解,一般論文)
-
Buried Markov Modelを用いた音声認識モデルの構築法の検討
-
Buried Markov Modelを用いた音声認識モデルの構築法の検討 (音声)
-
多重解像度独立性検定を用いた遺伝子ネットワークの構築
-
多重解像度独立性検定を用いた遺伝子ネットワークの構築
-
D-12-121 Wavelet係数の局所テクスチャ特徴量を用いたGraph Cutsによる画像セグメンテーション(D-12. パターン認識・メディア理解,一般セッション)
-
ランダムプロジェクションを用いた音響モデルの線形変換
-
D-12-104 単眼動画像におけるボールと選手の3次元位置推定(D-12.パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス),一般セッション)
-
D-12-112 AAMと回帰分析による視線,顔方向同時推定(D-12.パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス),一般セッション)
-
局所特徴量によるフィッシャー重みマップに基づく音素認識(Session-5 特徴量・音響モデル,第8回音声言語シンポジウム)
-
局所特徴量によるフィッシャー重みマップに基づく音素認識(Session-5 特徴量・音響モデル,第8回音声言語シンポジウム)
-
局所特徴量によるフィッシャー重みマップに基づく音素認識
-
局所特徴量によるフィッシャー重みマップに基づく音素認識(第8回音声言語シンポジウム)
-
H-015 PCA相関フィルタによる目領域の探索(H分野:画像認識・メディア理解)
-
ランダムプロジェクションを用いた音響モデルの線形変換 (音声)
-
3次キュムラントのBispectrumとMFCCの統合による音声区間検出の検討(第8回音声言語シンポジウム)
-
3次キュムラントのBispectrumとMFCCの統合による音声区間検出の検討(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
-
3次キュムラントのBispectrumとMFCCの統合による音声区間検出の検討(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
-
3次キュムラント音声特徴を用いた音声区間検出(信号処理,符号化,知的マルチメディアシステム,一般)
-
3次キュムラント音声特徴を用いた音声区間検出(信号処理,符号化,知的マルチメディアシステム,一般)
-
3次キュムラント音声特徴を用いた音声区間検出(信号処理,符号化,知的マルチメディアシステム,一般)
-
顔表情からの関心度推定に基づく映像コンテンツへのタギング
-
顔表情からの関心度推定に基づく映像コンテンツへのタギング(一般セッション,パターン認識・メディア理解のための学習理論とその周辺)
-
J-002 ユーザの表情に基づく映像コンテンツへのタギング(J分野:ヒューマンコミュニケーション&インタラクション)
-
多重ベータ混合モデルを用いた調波時間構造のモデル化による音声合成の検討
-
音響伝達特性を用いた単一チャネル音源位置推定における特徴量選択の検討(音声・音響一般,一般,オーガナイズドセッション(雑音を消せ!騒音下で有効な音声信号処理とは))
-
階層的強化学習を適用したPOMDPによる音声対話制御(一般(ポスターセッション),第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
-
階層的強化学習を適用したPOMDPによる音声対話制御(一般(ポスターセッション),第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
-
基底の反復生成と教師ありNMFを用いた信号解析(一般(ポスターセッション),第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
-
基底の反復生成と教師ありNMFを用いた信号解析(一般(ポスターセッション),第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
-
Bag of Grammarとルールベース手法を用いたドメイン依存性の少ないハイブリッド型Whyテキストセグメント判定(情報アクセス(オーガナイズドセッション),第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
-
Bag of Grammarとルールベース手法を用いたドメイン依存性の少ないハイブリッド型Whyテキストセグメント判定(情報アクセス(オーガナイズドセッション),第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
-
音響伝達特性の識別に基づく話者の頭部回転方向の推定(一般,音声・音響信号処理,音声及び一般)
-
音響伝達特性の識別に基づく話者の頭部回転方向の推定(一般,音声・音響信号処理,音声及び一般)
-
音響伝達特性の識別に基づく話者の頭部回転方向の推定(一般,音声・音響信号処理,音声及び一般)
-
Bag of Grammarを用いたドメイン依存性の少ないWhyテキストセグメント識別器の自動構築法(データ工学,Web情報システム)
-
CSP係数の識別に基づく話者の頭部方向推定の検討(アプリケーション,認識,理解,対話,一般)
-
確率スペクトル包絡を用いた混合音解析における制約付きスペクトル生成法の検討(ロバスト音声認識,認識,理解,対話,一般)
-
確率スペクトル包絡を用いた混合音解析における制約付きスペクトル生成法の検討
-
未知語とその周辺単語の音声認識誤りを考慮したCRFによる音声認識誤り訂正(話者照合・音声認識,第13回音声言語シンポジウム)
-
グラフ構造表現による一般物体認識(テーマセッション,実世界文字認識と理解)
-
未知語とその周辺単語の音声認識誤りを考慮したCRFによる音声認識誤り訂正(話者照合・音声認識,第13回音声言語シンポジウム)
-
音響伝達特性を用いたシングルチャネル音源位置推定における局所的回帰に基づく未学習位置の補間 (音声・第14回音声言語シンポジウム)
-
未知語とその周辺単語の音声認識誤りを考慮したCRFによる音声認識誤り訂正
-
未知語とその周辺単語の音声認識誤りを考慮したCRFによる音声認識誤り訂正
-
グラフ構造表現による一般物体認識
-
H-013 3次元特徴量を用いた構造表現による一般物体認識(一般物体認識,H分野:画像認識・メディア理解)
-
雑音環境下におけるセグメント特徴を考慮したNMFによる声質変換
-
辞書選択型非負値行列因子分解による構音障害者の声質変換
-
話者依存型 Conditional Restricted Boltzmann Machine による声質変換
-
ピッチ特徴量を用いた自閉症スペクトラム障害児と定型発達児の識別
-
単眼サッカー映像における時間状況グラフを用いた選手追跡(画像・映像解析,画像の認識・理解論文)
-
Sparse Codingを用いた唇情報からの音声変換(ポスターセッション)
-
シンタックスとセマンティックスに基づく音声認識結果の2段階訂正(ポスターセッション)
-
音響伝達特性を用いたシングルチャネル音源位置推定における局所的回帰に基づく未学習位置の補間(音声分析)
-
距離空間ピラミッドを用いたLLCによる3次元物体認識(一般セッション,大規模データベースとパターン認識)
-
D-12-16 Web画像を用いたマルチモーダル情報による物体認識(D-12.パターン認識・メディア理解A(パターンメディアの認識・理解・生成))
もっと見る
閉じる
スポンサーリンク