スポーツニュースを対象とした音声認識の検討

スポンサーリンク

概要

論文の詳細を見る
2001-03-01

著者

小林彰夫
NHK放送技術研究所
松井淳
NHK放送技術研究所
安藤彰男
工学院大学情報学部
松井淳
NHK 技研
世木寛之
NHK 技研
小林彰夫
NHK 技研
今井亨
NHK 技研
安藤彰男
NHK 技研
世木寛之
Nhk放送技術研究所 (人間・情報科学)

関連論文

単語誤り最小化に基づく識別的リスコアリングによるニュース音声認識(音声,聴覚)
サンプリング技術を利用した文章類似性評価
サンプリング技術を利用した文章類似性評価(文書分類・翻訳)
コンテンツ活用のための報道番組自動書き起こしシステム (システム開発論文特集)
H-007 検索技術を使う新しいテレビ視聴スタイルCurioView(画像認識・メディア理解,一般論文)
RI-003 サッカー選手配置取得のための選手追跡と選手認識の確率的統合法(グラフィクス・画像,査読付き論文)
D-12-26 ベイズ的手法による動画像顔検出の高速化と高精度化(D-12. パターン認識・メディア理解,一般セッション)
D-12-9 サッカー選手配置推定のための顔・背番号認識と選手追跡の統合法(D-12. パターン認識・メディア理解,一般セッション)
多重ハイパーパラメータ正則化モデルとその応用について
ダイレクト方式とリスピーク方式の音声認識を併用したリアルタイム字幕制作システム
単語誤り最小化に基づく識別的リスコアリングによる音声認識(ポスターセッション,第10回音声言語シンポジウム)
放送用リアルタイム字幕制作のための音声認識技術の改善
探索空間のエントロピーに基づく特徴量ストリームの動的な統合(音声認識・識別,第9回音声言語シンポジウム)
帯域フィルタ出力の時間変化特徴量を利用した音声認識(音声,聴覚)
可変長サブワードHMMに基づく未知語処理を導入した音声認識(第8回音声言語シンポジウム)
可変長サブワードHMMに基づく未知語処理を導入した音声認識(Session-6 音声認識,第8回音声言語シンポジウム)
D-14-8 累積音素尤度によるオンライン発話検出と男女音声認識(D-14.音声・聴覚,一般講演)
帯域フィルタ出力の時間変化特徴量を利用したニュース音声認識(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
実況・対談における発声変形を考慮した音響モデルの検討(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
コンテンツ活用のための報道番組自動書き起こしシステム(音声システム,システム開発論文)
複数の信頼度尺度を統合した音声認識(ポスターセッション)(第6回音声言語シンポジウム)
番組分割に向けたクローズドキャプション中の反復句抽出(「ユニバーサルコミュニケーションを実現するための言語処理技術」シンポジウム)
単語誤り最小化に基づく識別的リスコアリングによるニュース音声認識
ディリクレ過程事前分布EMアルゴリズムによる顔画像検出(一般セッション1,複合現実感のためのパターン認識・理解)
D-5-7 マルチモーダル情報を用いた放送番組からの人物相関図生成(D-5. 言語理解とコミュニケーション,一般セッション)
GibbsBoost顔検出と映像監視業務への応用
ヒストグラムを用いたピクセル生成モデルにもとづく逐次モンテカルロ動画像追跡(日本語セッション1,第二回日韓パターン認識ワークショップ(KJPR))
E-034 番組映像とクローズドキャプションの相関性を利用した番組生成モデルの検討(E分野:自然言語・音声・音楽)
センサネットワークのための分散協調型パーティクルフィルタ : 多視点サッカーボール追跡への応用(PRMU一般(1),顔・ジェスチャの認識・理解)
I_017 逐次モンテカルロ動画像追跡 : 速度パラメータ,検索範囲の自動調整による精度向上(I分野:画像認識・メディア理解)
I_008 GibbsBoostによる正面顔画像検出 : 事前情報を考慮するBayes的アプローチ(I分野:画像認識・メディア理解)
逐次モンテカルロ法を用いたBayes的顔画像認識(テーマ関連セッション4)
逐次モンテカルロ法を用いたBayes的顔画像認識(テーマセッション(4),CVのためのパターン認識・学習理論の新展開)
階層的ベイズ推定にもとづく顔画像認識
動画像によるオンライン署名認証 : Sequential Monte Carloを用いたペン先追跡(パターン認識・メディア理解のための学習理論とその周辺)
H-025 ベイズ的動画像顔検出における顔候補領域の逐次予測(H分野:画像認識・メディア理解)
メタデータ制作・活用システムの試作
メタデータ制作・活用システムの試作(高精細画像の処理・表示, 及び一般)
音素情報を利用したBICに基づくオンライン話者識別
コンテンツ活用のための報道番組自動書き起こしシステム
単語誤り最小化に基づく識別的リスコアリングによる音声認識(ポスターセッション,第10回音声言語シンポジウム)
単語誤り最小化に基づく識別的リスコアリングによる音声認識(ポスターセッション,第10回音声言語シンポジウム)
探索空間のエントロピーに基づく特徴量ストリームの動的な統合(音声認識・識別,第9回音声言語シンポジウム)
探索空間のエントロピーに基づく特徴量ストリームの動的な統合(音声認識・識別,第9回音声言語シンポジウム)
可変長サブワードHMMに基づく未知語処理を導入した音声認識(Session-6 音声認識,第8回音声言語シンポジウム)
帯域フィルタ出力の時間変化特徴量を利用したニュース音声認識(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
音声認識を利用した放送用ニュース字幕制作システム
ニュース解説を対象にした音声認識の検討-言語的特徴の利用の試み-
ニュース音声認識システム(音声処理技術のデモの紹介)
2000-SLP-31-8 ニュースの直前原稿を利用した音声認識誤りの自動検出法
ニュース音声認識のための言語モデルの動的適応化
ニュース音声認識における直前原稿の利用法
ニュース音声認識における直前原稿を利用した認識性能の改善
ニュース音声認識における直前原稿を利用した認識性能の改善
ニュース音声認識における直前原稿を利用した認識性能の改善
話題混合モデルによる放送ニュースからの話題抽出
帯域フィルタ出力の時間変化特徴量を利用したニュース音声認識(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
実況・対談における発声変形を考慮した音響モデルの検討(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
実況・対談における発声変形を考慮した音響モデルの検討(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
音響尤度補正による雑音環境下の音声認識の改善
雑音モデルに基づく補正音響尤度を用いた音声認識(雑音下音声処理)(第6回音声言語シンポジウム)
複数の信頼度尺度を統合した音声認識(ポスターセッション)(第6回音声言語シンポジウム)
雑音モデルに基づく補正音響尤度を用いた音声認識(雑音下音声処理)(第6回音声言語シンポジウム)
複数の信頼度尺度を統合した音声認識(ポスターセッション)(第6回音声言語シンポジウム)
雑音モデルに基づく補正音響尤度を用いた音声認識(雑音下音声処理)(第6回音声言語シンポジウム)
短いフレーム間隔による連続音声認識の検討
解説音声認識のための言語/音響モデルの適応化
講演スタイルの解説番組を対象にした音声認識の検討
講演スタイルの解説番組を対象にした音声認識の検討
スポーツニュースを対象とした音声認識の検討
口語表現の特徴を利用した言語モデルの検討
ニュース解説における発話の分析と認識率改善の試み
ニュース解説を対象にした音声認識の検討
ニュース解説を対象にした音声認識の検討
ニュース解説を対象にした音声認識の検討
ニュース音声認識のための時期依存言語モデル (音声言語情報処理)
認識結果早期確定のための逐次2パスデコーダ
音声認識によるリアルタイム字幕放送の進展
話題混合モデルによる放送ニュースからの話題抽出--音声認識の情報検索への応用 (ニュース音声字幕化特集)
放送直前原稿を利用した言語モデル作成方法--ニュース音声認識のための時期依存言語モデル (ニュース音声字幕化特集)
日本語ニュース音声認識用デコーダ
逐次2パスデコーダを用いたニュース音声認識システム
逐次2パスデコーダを用いたニュース音声認識システム
逐次2パスデコーダを用いたニュース音声認識システム
ニュース音声認識のための未知語登録法の検討
単語誤り最小化に基づく識別的スコアリングによる音声認識 (音声処理特集号)
リスク最小化学習に基づく識別的言語モデル
非負値行列因子分解に基づき動的適応したn-gram言語モデルによるパープレキシティ削減効果の分析
マルチ音素クラスのベイズ情報量基準に基づくオンライン話者ダイアライゼーション
ニュース番組自動字幕化のための音声認識システム(音声IF,「マルチモーダルと音声HI」およびヒューマンインタフェース/音声言語情報処理一般)
ニュース番組自動字幕化のための音声認識システム
6-6 コンテンツ検索のための報道番組自動書き起こしシステム(第6部門メディア処理3)
7-7 音声認識によるニュース番組字幕化のためのクロストーク自動判定(第7部門映像コンテンツ)
11-2 番組音声とリスピーク音声の自動認識を利用したニュース字幕制作実験(第11部門放送現業)
マルチ音素クラスのベイズ情報量基準に基づくオンライン話者ダイアライゼーション(音声,聴覚)
10-2 番組音声とリスピーク音声の認識を併用した生字幕制作の検討(第10部門放送現業)
11-3 メタデータ制作・活用システムの試作(第11部門放送現業)
9-1 メタデータ生成のための音声認識の改善(第9部門メディア認識と評価I)
14-1 災害報道字幕制作のための音声認識(第14部門放送現業)
災害報道字幕制作のための言語モデル更新(安全・安心な社会を創る音声・聴覚情報処理,音声/福祉/ディジタル信号処理/聴覚一般)

もっと見る閉じる

スポンサーリンク

論文relation | CiNii API
論文
論文著者
博士論文
研究課題
研究者
図書
論文
著者
お問い合わせ
プライバシー