2段階クラスタリングを用いた適応化音響モデルの学習
スポンサーリンク
概要
- 論文の詳細を見る
- 2000-09-01
著者
-
尾上 和穂
NHK放送技術研究所
-
安藤 彰男
NHK技研
-
世木 寛之
NHK技研
-
尾上 和穂
NHK技研
-
佐藤 庄衛
NHK技研
-
今井 亨
NHK技研
-
安藤 彰男
工学院大学 情報学部
-
田中 英輝
NHK放送技術研究所
-
田中 英輝
NHK技研
-
田中 英輝
Nhk放送技術研究所:(現在)atr音声翻訳通信研究所
-
世木 寛之
Nhk放送技術研究所 (人間・情報科学)
関連論文
- 高性能シリコンマイクロホンの周波数特性改善および動作電圧低減に向けた要素技術の開発
- シリコンマイクの高域特性の改善
- 放送用コンデンサ型シリコンマイクロホンの試作
- 音楽聴取における音の臨場感と主観的な近さとの関係
- 音楽再生における音の臨場感と感動分類
- 音楽録音用超広帯域マイクロホンの開発
- 母音による話者認識における特徴量変換(「感性情報処理の基礎と応用」及びヒューマン情報処理一般)
- 帯域フィルタ出力の時間変化特徴量を利用した音声認識(音声,聴覚)
- 可変長サブワードHMMに基づく未知語処理を導入した音声認識(第8回音声言語シンポジウム)
- 可変長サブワードHMMに基づく未知語処理を導入した音声認識(Session-6 音声認識,第8回音声言語シンポジウム)
- D-14-8 累積音素尤度によるオンライン発話検出と男女音声認識(D-14.音声・聴覚,一般講演)
- 帯域フィルタ出力の時間変化特徴量を利用したニュース音声認識(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 実況・対談における発声変形を考慮した音響モデルの検討(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- 複数の信頼度尺度を統合した音声認識(ポスターセッション)(第6回音声言語シンポジウム)
- 回折効果を利用したマイクロホンの超広帯域化の検討
- マイクロホンの超広帯域化の検討
- 音の仰角知覚弁別に関する検討
- 法科学的話者照合のための標準化・正規化クロスVQ歪みの利用
- 単独発声母音を用いた話者照合における特徴量変換
- 単一指向性超広帯域マイクロホンのカプセル設計
- 超広帯域マイクロホンの単一指向性化(立体音響・トランスデューサ/一般)
- フレキシブルディスプレイ用スピーカの音響特性 : ひずみ特性を中心に(立体音響・トランスデューサ/一般)
- 中継などの様々な音響下でのニュース音声認識
- 音楽聴取体験の感動評価の要因とその個人差に関する検討(スペシャルセッション : 究極の超臨場感 (1))
- 超臨場感音響システム実現への課題と動向
- 言い換えを利用したリスピーク方式によるスポーツ中継のリアルタイム字幕制作(音声,聴覚)
- EA2010-22 音楽聴取における音の臨場感と主観的な近さとの関係
- フィルターバンクサブトラクションによる雑音環境下の音声認識 (音声認識による字幕サービス 特集号)
- 生字幕放送のための音声認識 : システムの概要とリスピークの効果
- 連続音声認識における動的特徴量の高精度な計算法
- 音声認識における高精度な動的特徴量計算法の提案
- 音声認識における高精度な動的特徴量計算法の提案
- 音声認識における高精度な動的特徴量計算法の提案
- 放送ニュースに字幕をどうつけるか?(NHK) (特集 応用製品も登場、いよいよ実用化時代へ 99音声認識探検隊) -- (応用事例)
- 可変長サブワードHMMに基づく未知語処理を導入した音声認識(Session-6 音声認識,第8回音声言語シンポジウム)
- 帯域フィルタ出力の時間変化特徴量を利用したニュース音声認識(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 雑音環境下単語認識のための複素周波数領域における参照再構成法
- 音楽聴取における"感動"の評価要因----感動の種類と音楽の感情価の関係
- 音声認識を利用した放送用ニュース字幕制作システム
- 混合正規分布型HMMにおける混合数の増加法の検討
- ニュース解説を対象にした音声認識の検討-言語的特徴の利用の試み-
- 連続音声認識のためのスタックデコーダの作成
- 2段階クラスタリングを用いた適応化音響モデルの学習
- ニュース音声認識システム(音声処理技術のデモの紹介)
- ニュース音声認識のための言語モデルの動的適応化
- ニュース音声認識における直前原稿の利用法
- 雑音低減のための複素周波数領域における参照再構成法(第8回音声言語シンポジウム)
- 雑音低減のための複素周波数領域における参照再構成法(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 雑音低減のための複素周波数領域における参照再構成法(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 雑音低減のための複素周波数領域における参照再構成法
- 話し言葉コーパスの係り受け解析を目的とした韻律の分析
- 距離選択収音におけるマイクロホン間遅延の補正法に関する検討
- 2段階クラスタリングに基づく選択学習による音響モデル適応化
- ニュース音声認識システムの検討
- 放送ニュースの話題抽出モデル
- 連続発話認識のための言語モデル
- 帯域フィルタ出力の時間変化特徴量を利用したニュース音声認識(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 実況・対談における発声変形を考慮した音響モデルの検討(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- 実況・対談における発声変形を考慮した音響モデルの検討(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- 音響尤度補正による雑音環境下の音声認識の改善
- 雑音モデルに基づく補正音響尤度を用いた音声認識(雑音下音声処理)(第6回音声言語シンポジウム)
- 複数の信頼度尺度を統合した音声認識(ポスターセッション)(第6回音声言語シンポジウム)
- 雑音モデルに基づく補正音響尤度を用いた音声認識(雑音下音声処理)(第6回音声言語シンポジウム)
- 複数の信頼度尺度を統合した音声認識(ポスターセッション)(第6回音声言語シンポジウム)
- 雑音モデルに基づく補正音響尤度を用いた音声認識(雑音下音声処理)(第6回音声言語シンポジウム)
- 短いフレーム間隔による連続音声認識の検討
- 解説音声認識のための言語/音響モデルの適応化
- ニュース音声認識のための1パストライグラムデコーダの検討
- クロスワード・トライフォンの検討 -2パスデコーダの第1パスでの実装-
- HMM利用による明瞭度測定の検討
- ニュース音声データベースの構築
- ニュース番組における認識率変動要因の検討
- GMMによる音響モデル用学習データの自動選択
- 状態共有トライフォンHMMとtied-mixture HMMのモデル構造の比較
- フィルタバンク・サブトラクションを用いたニュース番組現場リポート音声の認識
- フィルタバンク・サブトラクションを用いたニュース番組現場リポート音声の認識
- フィルタバンク上でのスペクトルサブトラクションを用いた中継音声の認識
- 連続音声認識のための音響モデルの評価法の検討
- タッチスクリーンを使用したスポーツSEミキシング
- 状態共有トライフォンHMMの学習における決定木とモデル数の検討
- 認識結果早期確定のための逐次2パスデコーダ
- 選択学習による音響モデルの適応化 (音声認識による字幕サービス 特集号)
- 現場リポートニュース音声へのクラスタ依存音響モデルの適用
- 単語接続制約を利用した言語モデルの検討
- ニュース音声認識のための未知語登録法の検討
- 意味分類を利用した統計的言語モデルの検討
- SP2000-11 話者クラス音響モデルのための学習データの自動選択手法
- 中継などの様々な音響下でのニュース音声認識
- 発話速度自動計測のための一方法
- 対談番組を対象にした音声認識の検討
- ニュース音声認識のための記者原稿による言語モデル適応化
- ニュース番組自動字幕化のための音声認識システム(音声IF,「マルチモーダルと音声HI」およびヒューマンインタフェース/音声言語情報処理一般)
- ニュース番組自動字幕化のための音声認識システム
- ニュース音声認識用デコーダーの開発
- 記者原稿を用いたニュース音声認識結果の修正法
- 7-7 音声認識によるニュース番組字幕化のためのクロストーク自動判定(第7部門 映像コンテンツ)
- 11-2 番組音声とリスピーク音声の自動認識を利用したニュース字幕制作実験(第11部門 放送現業)
- 10-2 番組音声とリスピーク音声の認識を併用した生字幕制作の検討(第10部門 放送現業)
- 9-1 メタデータ生成のための音声認識の改善(第9部門 メディア認識と評価I)
- Q&Aコーナー(コーヒーブレーク)