音声認識における頑健性 : 音響分析・音響モデル,なにが課題か(企画)
スポンサーリンク
概要
- 論文の詳細を見る
音声認識実用化に向けて「頑健性」の必要性が叫ばれて久しい.頑健性を指向し,主に音響分析・音響モデルの側面から,いまなにが行われ,なにが課題とされているのかを考えてみたい.
- 社団法人情報処理学会の論文
- 2009-01-30
著者
-
滝口 哲也
神戸大学工学部
-
中村 哲
独立行政法人情報通信研究機構:(株)atr音声言語コミュニケーション研究所
-
中村 哲
三重大学大学院医学系研究科耳鼻咽喉・頭頸部外科
-
大淵 康成
日立製作所・中央研究所
-
北岡 教英
名古屋大学
-
中村 哲
NiCT ATR
-
藤本 雅清
NTT研究所
-
大淵 康成
日立
-
滝口 哲也
神戸大
-
藤本 雅清
NTTコミュニケーション科学基礎研究所
-
中村 哲
Atr音声口語コミュニケーション研究所
-
滝口 哲也
神戸大学
-
中村 哲
Atr音声言語コミュニケーション研究所
-
中村 哲
独立行政法人情報通信研究機構|株式会社国際電気通信基礎技術研究所
-
FUJIMOTO Masakiyo
the ATR Spoken Language Communication Research Laboratories
-
Fujimoto Masakiyo
Ntt Communication Science Laboratories Ntt Corporation
-
Fujimoto Masakiyo
Department Of Electronics And Informatics Faculty Of Science And Technology Ryukoku University
-
北岡 教英
名古屋大 大学院情報科学研究科
関連論文
- 京都観光案内対話コーパスにおける対話行為タグの設計と分析(理解)
- 同調的対話システム構築のための音声対話コーパスの構築(「ユニバーサルコミュニケーションを実現するための言語処理技術」シンポジウム)
- Net Tv : Net Newsとテレビ放送のクロスプラットフォームにおける動画インデキシングと音声検索(セッション2:放送とネットワーク技術)
- NetTv : NetNews とテレビ放送のクロスプラットフォームにおける動画インデキシングと音声検索
- NICT知識創成コミュニケーション研究センターの研究と高度言語情報融合フォーラム(ALAGIN)の活動について(Web情報処理,Webとデータベースに関する技術報告)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(3)(SIG-SLP内組織の活動報告)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(2)(雑音・VAD,第9回音声言語シンポジウム)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境 (2)(雑音・VAD,第9回音声言語シンポジウム)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(第8回音声言語シンポジウム)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(Session-1 検出,第8回音声言語シンポジウム)
- 音声翻訳システムの研究開発
- 音声認識における頑健性 : 音響分析・音響モデル,なにが課題か(企画)
- NICTにおける音声・言語研究拠点MASTARプロジェクトについて(「ユニバーサルコミュニケーションを実現するための言語処理技術」シンポジウム)
- 音声翻訳単位の推定における句読点情報の効果(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 多チャンネル三次元音場再現システムの再生方式の違いによる再現性能評価
- マルチモーダル音声言語処理とその応用(マルチモーダル)
- 音声翻訳研究20年の夜明け : 受賞業績 携帯電話によるネットワーク型コーパスベース音声翻訳システムの構築(平成19年度喜安記念業績賞紹介)
- 同時通訳者の知識と韻律情報を用いた講演文章のチャンキング(チャンキング・要約)
- 2D-5 多言語音声翻訳基盤の通信インタフェースの検討と構築(音声対話・翻訳,一般セッション,人工知能と認知科学)
- ストーリへの没入感を実現するダイブイントゥザムービープロジェクト(テーマ関連/オーガナイズドセッション)
- ストーリへの没入感を実現するダイブイゥザムービープロジェクト(オーガナイズドセッション,CV/PR技術のVRへの応用)
- 5.効率的アニメ制作支援のための3次元CG技術(情報技術が支えるアートとコンテンツの世界)
- NICTにおけるユニバーサルコミュニケーションのための音声言語研究(研究動向を探るセッション)
- CENSREC-1-C : 雑音下音声区間検出評価基盤の構築
- HMM/BN音響モデルの設計と実装(国際ワークショップ"Beyond HMM")
- メタモデルと音響モデルの統合による構音障害者の音声認識(福祉と音声処理,一般)
- 統計的対話モデルを用いたWFSTに基づく音声対話システム
- 同調的対話を実現するプロトタイプシステムの開発(対話・インタフェース・インタラクション)
- SLP雑音下音声認識評価WG活動報告 : 評価用データと評価手法について(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 情報家電操作における脳性麻痺構音障害者の音声認識評価(福祉情報工学一般)
- スペクトル平面における勾配ヒストグラムに基づく音声特徴量の検討(ポスターセッション,第10回音声言語シンポジウム)
- 音声翻訳単位の推定における句読点情報の効果(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 音声翻訳単位の推定における句読点情報の効果(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 来場者の声の特徴を反映する映像エンタテインメントシステムのための台詞音声生成システム
- iFACe:デジタルアニメ声優体験システム
- メタモデルと音響モデルの統合による構音障害者の音声認識(福祉と音声処理,一般)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(2)(雑音・VAD,第9回音声言語シンポジウム)
- 個人の音声を反映する映像エンタテインメントシステム
- QAシステムのための音声入力インターフェース
- 音声認識の信頼度・複数候補を利用したWFST対話システムの評価
- 雑音下マルチモーダル音声認識評価基盤CENSREC-1-AVの構築
- 相談型対話のモデル化と対話戦略の最適化
- D-14-7 AdaBoostと音声・唇GMMによる発話区間検出(D-14.音声・聴覚,一般講演)
- 構音障害者の音声認識における動的特徴量の考察(福祉と音声処理,一般)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(Session-1 検出,第8回音声言語シンポジウム)
- SLP雑音下音声認識評価WG活動報告 : 評価用データと評価手法について(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- SLP雑音下音声認識評価WG活動報告 : 評価用データと評価手法について(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 音声認職の信頼度・複数候補を利用したWFST対話システムの評価
- AAMを用いた顔方位にロバストな唇領域特徴抽出と音声特徴による構音障害者の音声認識(一般(ポスターセッション),第11回音声言語シンポジウム)
- Buried Markov Modelを用いた構音障害者の音声認識の検討(テーマセッション,福祉と見守りのための画像・音声処理)
- Buried Markov Modelを用いた構音障害者の音声認識の検討(テーマセッション,福祉と見守りのための画像・音声処理)
- Buried Markov Modelを用いた構音障害者の音声認識の検討(テーマセッション,福祉と見守りのための画像・音声処理)
- HMM/BN音響モデルの設計と実装
- HMM/BN音響モデルの設計と実装(国際ワークショップ"Beyond HMM")
- HMM/BN音響モデルの設計と実装(国際ワークショップ"Beyond HMM")
- ハイブリッドHMM/BNモデルに基づいた調音特徴とスペクトル特徴の統合
- ハイブリッドHMM/BNモデルに基いた大語彙音声認識システム
- ハイブリッドHMM/BNモデルに基いた大語彙音声認識システム
- ベイジアンネットとジャンクションツリー分解を用いて知識を組み込んだ統計的音響モデル(第8回音声言語シンポジウム)
- ベイジアンネットとジャンクションツリー分解を用いて知識を組み込んだ統計的音響モデル(Session-5 特徴量・音響モデル,第8回音声言語シンポジウム)
- ベイジアンネットとジャンクションツリー分解を用いて知識を組み込んだ統計的音響モデル(Session-5 特徴量・音響モデル,第8回音声言語シンポジウム)
- マルチモーダル音声認識のための顔検出
- マルチモーダル音声認識のための顔検出
- 構音障害者の音声認識の検討(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 構音障害者の音声認識の検討(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 構音障害者の音声認識の検討(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- AAMを用いた顔方位にロバストな唇領域特徴抽出と音声特徴による構音障害者の音声認識(一般(ポスターセッション),第11回音声言語シンポジウム)
- 構音障害者の音声認識の検討
- 調音運動ダイナミクスの音声認識への応用(聴覚・音声/一般)
- F0パターンの自動推定と目標点の抽出(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- F0パターンの自動推定と目標点の抽出(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 新映像技術「ダイブイントゥザムービー」
- 音場の局所化技術を応用した指向性スピーカシステムの試作と評価
- スペクトル平面における勾配ヒストグラムに基づく音声特徴量の検討(ポスターセッション,第10回音声言語シンポジウム)
- スペクトル平面における勾配ヒストグラムに基づく音声特徴量の検討(ポスターセッション,第10回音声言語シンポジウム)
- D-12-18 マルチ識別器を用いた花画像検索システムの構築(D-12.パターン認識・メディア理解,一般講演)
- 音声翻訳技術の動向
- D-12-80 顔特徴点移動量・点間距離変化量の組み合わせに基づく顔表情認識(D-12.パターン認識・メディア理解,一般講演)
- 画像セグメンテーションにおけるウェーブレット係数の局所テクスチャ特徴量を用いたGraphCuts(一般セッション,パターン認識・メディア理解のための学習理論とその周辺)
- D-12-88 マルチテンプレート型二次元CSPによる高速目領域検索(D-12.パターン認識・メディア理解,一般講演)
- I_022 二次元CSPによる目領域探索の高速化(I分野:画像認識・メディア理解)
- 新映像技術「ダイブイントゥザムービー」
- 弱識別器にSVMを用いたAdaBoostの検討(一般(ポスターセッション),第9回音声言語シンポジウム)
- 弱識別器にSVMを用いたAdaBoostの検討(一般(ポスターセッション),第9回音声言語シンポジウム)
- 弱識別器にSVMを用いたAdaBoostの検討(一般(ポスターセッション),第9回音声言語シンポジウム)
- Net Tv : Net Newsとテレビ放送のクロスプラットフォームにおける動画インデキシングと音声検索(セッション2:放送とネットワーク技術)
- コンテキストアウェアネスに基づく対話型テレビの検討
- Multi-class AdaBoostを用いた雑音検出(第8回音声言語シンポジウム)
- Multi-class AdaBoostを用いた雑音検出(Session-1 検出,第8回音声言語シンポジウム)
- Multi-class AdaBoostを用いた雑音検出(Session-1 検出,第8回音声言語シンポジウム)
- Bag of Grammarとルールベース手法を用いたドメイン依存性の少ないハイブリッド型Whyテキストセグメント判定(情報アクセス(オーガナイズドセッション),第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- Bag of Grammarとルールベース手法を用いたドメイン依存性の少ないハイブリッド型Whyテキストセグメント判定(情報アクセス(オーガナイズドセッション),第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- 音素部分空間の統合による音声特徴量抽出の検討(特徴量・音響モデル,第9回音声言語シンポジウム)
- 音素部分空間の統合による音声特徴量抽出の検討(特徴量・音響モデル,第9回音声言語シンポジウム)
- 音素部分空間の統合による音声特徴量抽出の検討(特徴量・音響モデル,第9回音声言語シンポジウム)
- 音素PCAを用いた残響下における音声特徴量抽出
- AdaBoostを用いたシステムへの問い合わせと雑談の判別(第8回音声言語シンポジウム)
- AdaBoostを用いたシステムへの問い合わせと雑談の判別(Session-1 検出,第8回音声言語シンポジウム)
- AdaBoostを用いたシステムへの問い合わせと雑談の判別(Session-1 検出,第8回音声言語シンポジウム)
- 音響モデルを利用したシングルチャネルによる音源方向推定(ブラインド信号処理/一般)