連続音声認識のためのスタックデコーダの作成
スポンサーリンク
概要
- 論文の詳細を見る
- 2000-09-01
著者
-
本間 真一
NHK放送技術研究所
-
小早川 健
Nhk放送技術研究所
-
安藤 彰男
NHK技研
-
小早川 健
NHK技研
-
世木 寛之
NHK技研
-
本間 真一
NHK技研
-
今井 亨
NHK技研
-
安藤 彰男
工学院大学 情報学部
-
田中 英輝
NHK放送技術研究所
-
田中 英輝
NHK技研
-
田中 英輝
Nhk放送技術研究所:(現在)atr音声翻訳通信研究所
-
世木 寛之
Nhk放送技術研究所 (人間・情報科学)
関連論文
- 単語誤り最小化に基づく識別的リスコアリングによるニュース音声認識(音声,聴覚)
- 単語格子とマルコフモデルによる日本語機能表現の解析 : 日本語機能表現辞書「つつじ」を用いて(解析)
- 生字幕制作のための音声認識
- コンテンツ活用のための報道番組自動書き起こしシステム (システム開発論文特集)
- F-044 野球知識ベースを用いたダイジェスト制作システムの開発(F分野:人工知能・ゲーム)
- K-074 知識を統合しユーザの疑問に答えるTVエージェント(K分野:ヒューマンコミュニケーション&インタラクション)
- ダイレクト方式とリスピーク方式の音声認識を併用したリアルタイム字幕制作システム
- 単語誤り最小化に基づく識別的リスコアリングによる音声認識(ポスターセッション,第10回音声言語シンポジウム)
- 探索空間のエントロピーに基づく特徴量ストリームの動的な統合(音声認識・識別,第9回音声言語シンポジウム)
- 帯域フィルタ出力の時間変化特徴量を利用した音声認識(音声,聴覚)
- 可変長サブワードHMMに基づく未知語処理を導入した音声認識(第8回音声言語シンポジウム)
- 可変長サブワードHMMに基づく未知語処理を導入した音声認識(Session-6 音声認識,第8回音声言語シンポジウム)
- D-14-8 累積音素尤度によるオンライン発話検出と男女音声認識(D-14.音声・聴覚,一般講演)
- 帯域フィルタ出力の時間変化特徴量を利用したニュース音声認識(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 実況・対談における発声変形を考慮した音響モデルの検討(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- コンテンツ活用のための報道番組自動書き起こしシステム(音声システム,システム開発論文)
- 番組分割に向けたクローズドキャプション中の反復句抽出(「ユニバーサルコミュニケーションを実現するための言語処理技術」シンポジウム)
- E-013 半教師あり学習による事物間の関係を表現する典型的な構文構造の抽出(自然言語・音声・音楽,一般論文)
- E-011 クローズドキャプションを対象とした番組シーン分割手法の検討(自然言語・音声・音楽,一般論文)
- マイクロホンの超広帯域化の検討
- 単語誤り最小化に基づく識別的リスコアリングによるニュース音声認識
- 字幕自動監視装置
- 言い換えを利用したリスピーク方式によるスポーツ中継のリアルタイム字幕制作(音声,聴覚)
- E-058 放送に対する反響抽出の課題(E分野:自然言語・音声・音楽)
- 2チャネル音声集音系における楕円積分を乗算係数に用いたスペクトル減算法(音声, 聴覚)
- E-001 クローズドキャプションを対象とした因果関係知識抽出の検討(E分野:自然言語)
- TVエージェントシステムの開発 ('05〔NHK〕技研公開 研究発表 特集号)
- 生字幕放送のためのリスピーク方式音声認識 (音声認識による字幕サービス 特集号)
- フィルターバンクサブトラクションによる雑音環境下の音声認識 (音声認識による字幕サービス 特集号)
- 視線情報を利用した番組選択インタフェースの開発(セッション5 : マルチモーダルデザイン(2))
- K-074 視線情報を利用したテレビ用ユーザインタフェースの開発(K.ヒューマンコミュニケーション&インタラクション)
- 生字幕放送のための音声認識 : システムの概要とリスピークの効果
- 連続音声認識における動的特徴量の高精度な計算法
- 音声認識における高精度な動的特徴量計算法の提案
- 音声認識における高精度な動的特徴量計算法の提案
- 音声認識における高精度な動的特徴量計算法の提案
- 音素情報を利用したBICに基づくオンライン話者識別
- コンテンツ活用のための報道番組自動書き起こしシステム
- 単語誤り最小化に基づく識別的リスコアリングによる音声認識(ポスターセッション,第10回音声言語シンポジウム)
- 単語誤り最小化に基づく識別的リスコアリングによる音声認識(ポスターセッション,第10回音声言語シンポジウム)
- 探索空間のエントロピーに基づく特徴量ストリームの動的な統合(音声認識・識別,第9回音声言語シンポジウム)
- 探索空間のエントロピーに基づく特徴量ストリームの動的な統合(音声認識・識別,第9回音声言語シンポジウム)
- 可変長サブワードHMMに基づく未知語処理を導入した音声認識(Session-6 音声認識,第8回音声言語シンポジウム)
- 帯域フィルタ出力の時間変化特徴量を利用したニュース音声認識(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 文融合法に基づいた放送ニュースリード文の具体化
- 音声認識を利用した放送用ニュース字幕制作システム
- 混合正規分布型HMMにおける混合数の増加法の検討
- ニュース解説を対象にした音声認識の検討-言語的特徴の利用の試み-
- 連続音声認識のためのスタックデコーダの作成
- 2段階クラスタリングを用いた適応化音響モデルの学習
- ニュース音声認識システム(音声処理技術のデモの紹介)
- ニュース音声認識のための言語モデルの動的適応化
- ニュース音声認識における直前原稿の利用法
- 距離選択収音におけるマイクロホン間遅延の補正法に関する検討
- ニュース音声認識システムの検討
- 2)算術符号による画像圧縮とマルチキャスト/IP通信を用いた選挙速報システムKINDSの開発と参議院選挙報道での運用(放送現業研究会)
- 算術符号による画像圧縮とマルチキャスト/IP通信を用いた選挙速報システムKINDSの開発と参議院選挙報道での運用
- 連続発話認識のための言語モデル
- 帯域フィルタ出力の時間変化特徴量を利用したニュース音声認識(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 実況・対談における発声変形を考慮した音響モデルの検討(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- 実況・対談における発声変形を考慮した音響モデルの検討(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- 短いフレーム間隔による連続音声認識の検討
- 解説音声認識のための言語/音響モデルの適応化
- 講演スタイルの解説番組を対象にした音声認識の検討
- 講演スタイルの解説番組を対象にした音声認識の検討
- ニュース解説における発話の分析と認識率改善の試み
- ニュース解説を対象にした音声認識の検討
- ニュース解説を対象にした音声認識の検討
- ニュース解説を対象にした音声認識の検討
- ニュース音声認識のための1パストライグラムデコーダの検討
- クロスワード・トライフォンの検討 -2パスデコーダの第1パスでの実装-
- HMM利用による明瞭度測定の検討
- ニュース音声データベースの構築
- ニュース番組における認識率変動要因の検討
- GMMによる音響モデル用学習データの自動選択
- 状態共有トライフォンHMMとtied-mixture HMMのモデル構造の比較
- フィルタバンク・サブトラクションを用いたニュース番組現場リポート音声の認識
- フィルタバンク・サブトラクションを用いたニュース番組現場リポート音声の認識
- フィルタバンク上でのスペクトルサブトラクションを用いた中継音声の認識
- 連続音声認識のための音響モデルの評価法の検討
- 状態共有トライフォンHMMの学習における決定木とモデル数の検討
- 認識結果早期確定のための逐次2パスデコーダ
- 現場リポートニュース音声へのクラスタ依存音響モデルの適用
- 単語接続制約を利用した言語モデルの検討
- ニュース音声認識のための未知語登録法の検討
- 意味分類を利用した統計的言語モデルの検討
- 放送番組に対する意見マイニングと述語の解析(意見抽出/文書分類,第1回テキストマイニング・シンポジウム)
- 音声/非音声区間切替による背景音抑圧処理法の検討(オーガナイズドセッション「人にやさしい音声情報処理」,福祉と音声処理,一般)
- 音声/非音声区間切替による背景音抑圧処理法の検討(オーガナイズドセッション「人にやさしい音声情報処理」,福祉と音声処理,一般)
- 中継などの様々な音響下でのニュース音声認識
- 単語誤り最小化に基づく識別的スコアリングによる音声認識 (音声処理特集号)
- 字幕制作のためのオンライン発話検出と男女並列音声認識 (音声処理特集号)
- 6-6 コンテンツ検索のための報道番組自動書き起こしシステム(第6部門 メディア処理3)
- 4-6 野球オントロジーを利用したダイジェスト生成手法に関する一検討(第4部門 ヒューマンインフォメーション)
- 6-1 Q&Aシステムのための野球オントロジーの設計に関する検討(第6部門 インターフェース,画像・動画処理,その他)
- 2-3 字幕自動監視装置の試作(第2部門 放送技術(放送現業))
- 11-2 番組音声とリスピーク音声の自動認識を利用したニュース字幕制作実験(第11部門 放送現業)
- マルチ音素クラスのベイズ情報量基準に基づくオンライン話者ダイアライゼーション(音声,聴覚)
- 10-2 番組音声とリスピーク音声の認識を併用した生字幕制作の検討(第10部門 放送現業)
- 大規模データの俯瞰とターゲットデータの抽出に対する文書-単語行列の特異値分解と特異値による重みづけの有効性