放送音声に対する字幕放出タイミング検出手法の検討
スポンサーリンク
概要
- 論文の詳細を見る
- 2000-09-01
著者
-
阿部 芳春
三菱電機・情報総研
-
丸山 一郎
通信・放送機構渋谷上原リサーチセンター
-
白井 克彦
早大・理工
-
丸山 一郎
通信・放送機構渋谷上原リサーチセンター:(現)三菱電機株式会社情報技術総合研究所
-
江原 暉将
NHK技研
-
江原 暉将
通信・放送機構:nhk放送技術研究所
-
阿部 芳春
通信・放送機構渋谷上原リサーチセンター:三菱電機株式会社情報技術総合研究所
関連論文
- 正弦波トラジェクトリに基づく楽器音中の音声強調
- J-028 音声対話システム利用時における感情表出誘因性に関する考察(ヒューマンコミュニケーション&インタラクション,一般論文)
- 日本人英語認識におけるマルチ単語モデルの改良
- 複数単語モデルによる日本人英語音声認識の検討
- 日本人英語の発話様態を考慮した英語音声連続認識の検討
- 発声変形モデルを用いた騒音環境下音声認識
- 日本人英語認識における単語モデル構成法の検討
- 日本人英語音声認識における音響モデルの検討
- 日本人発声者による英語音声の認識
- 重畳雑音のパタン選択とパワー推定を用いた騒音下音声認識手法の改良
- 雑音標準パタンを用いた非定常騒音下音声認識の検討
- A-10-2 べき級数展開によるフォルマント表現(A-10.応用音響,一般セッション)
- 聴覚障害者向け字幕付きテレビ番組の自動制作システム
- 8-3 聴覚障害者のための字幕放送制作技術の研究状況 (第三報)
- D-14-14 品詞情報を用いた操作要求発話判別(D-14. 音声,一般セッション)
- D-5-7 相手にあわせた発話調整機能のための言語情報からのユーザモデル生成手法の検討(D-5. 言語理解とコミュニケーション,一般セッション)
- D-5-6 再利用可能情報収集のための構造化データベースの提案(D-5. 言語理解とコミュニケーション,一般セッション)
- D-14-11 韻律条件付言語モデルを用いた音声認識のリスコアリング(D-14. 音声,一般セッション)
- D-14-2 文頭・文末の音韻情報を加味した単文に有効な言語識別手法(D-14. 音声,一般セッション)
- D-14-1 対話支援システムのための雑談判別(D-14. 音声,一般セッション)
- 音声対話システムにおける発話意図推定
- D-14-3 質問者の発話による発表スライド特定提示法(D-14.音声,一般セッション)
- A-15-24 PC操作情報とソーシャルタグに基づいた楽曲推薦手法(A-15.ヒューマン情報処理,一般セッション)
- 可変長セグメントパタンマッチングに基づく楽音の音高・楽器推定
- 音声・楽器音・歌声が混在した音響信号中の音カテゴリ検出
- マルチモーダル作図システムの音声認識部における非コマンド発話のリジェクション
- 音声母音スペクトルのべき級数展開とその零点分布(研究速報)
- 情報量を基準としたモンゴル語主要二大方言の音響特徴の分析
- 方言間の差異を考慮したモンゴル語音声ベータベースの構築
- 蒙古語方言7母音のフォルマント周波数分析
- 音声/音楽信号の識別とセグメンテーション手法の検討
- モンゴル語音韻の分類および認識性能の評価
- 量子化誤差を評価基準としたスペクトル変換による教師なし話者適応
- ロボットとの対話における非言語情報の役割
- 音素認識誤り傾向の統計的分析法に関する一考察
- ニュース音声を対象とした大語彙連続音声認識
- 新聞記事読み上げタスクを用いた大語彙連続音声認識における音響モデルの検討
- 新聞読み上げタスクを用いた大語彙連続音声認識における言語モデルの検討
- 住所認識のためのメモリ管理方式の検討
- D-5-5 子どもの質問に対するわかりやすい回答提示システム(D-5.言語理解とコミュニケーション,一般セッション)
- ユーザの発話を利用した聞き取りやすい英語への音声変換手法(一般(ポスターセッション),第11回音声言語シンポジウム)
- J-006 時空を越えたコミュニケーションを実現する音声インタフェースの提案(ヒューマンコミュニケーション&インタラクション,一般論文)
- 発話スタイル並列コーパスを用いた発音変形の分析
- ワードスポッティングと動的計画法を用いたテレビ番組に対する字幕提示タイミング検出法
- 大語彙音声認識における言い換え表現の自動生成方式
- 16ビットマイコン用不特定話者音声認識ミドルウェアの検討
- D-14-10 N-gram言語モデルを用いた音声対話システムにおける冗長語処理の検討
- D-12-12 能動的情報収集対話における対話開始判断モデルの構築(D-12.パターン認識・メディア理解,一般セッション)
- A-15-17 ロボットを用いた情報収集対話における対話終了判断方法の検討(A-15. ヒューマン情報処理,一般セッション)
- AUTOMATIC CATEGORIZATION FOR NEWS SPOKEN DOCUMENTS
- 大語彙連続音声認識のための複数言語モデルの並列同時単語列探索法(音声言語)(次世代移動体通信システム)
- 話題混合言語モデル構築のための単語連鎖統計量を用いたコーパス分類尺度
- 単語とサブワードの統計量を用いた言語モデル構築手法の一検討
- 混合言語モデルのためのコーパスの記事単位クラスタリング
- 音節認識結果における誤り傾向を考慮した未知語学習の評価
- D-14-9 スムージングを考慮したMDI法の一検討
- 混合言語モデルのための並行単語列検索
- クラス情報を用いた単語トライグラム言語モデルの一検討
- 分野外の統計量を用いた言語モデルの一検討
- 混合言語モデル作成のためのコーパスのクラスタ分割の検討
- ニュース音声認識システムの検討
- 発話文を単位としたワードスポッティングによる意図抽出機構
- エルゴディックHMMによる対話のモデル化と評価
- 構内案内ロボットにおける音声とジェスチャーの統合に関する検討
- 複合作業における音声の有効性に関する検討
- 高背景音放送音声を対象とする字幕・音声自動同期の検討
- 放送音声に対する字幕放出タイミング検出手法の検討
- ドキュメンタリー番組における字幕送出タイミング検出の一検討
- ニュース字幕の提示タイミングずれに対する許容特性
- A-14-22 字幕提示タイミングずれに対する許容の主観評価
- 15-10 聴覚障害者のための字幕放送制作技術の研究状況(第二報)
- 字幕送出タイミング検出におけるワード列ペアモデルの構成検討
- ワード列ペアモデルによる字幕送出タイミング検出の検討
- 字幕・音声同期におけるワード列ペアモデルのスポッティング精度改良
- ニュース音声データベース構築における文セットの設計
- ピッチパタンの統計モデルに基づく句境界情報を利用した文節スポッティング
- 認識誤り傾向の確率モデルを用いた2段階探索法による大語彙連続音声認識
- ローカルな発話速度が音節認識性能に与える影響について
- クラスタリング情報を用いた未知バイグラム確率推定の一検討
- トピック分割による統計量を用いた言語モデルの一検討
- 大語彙連続音声認識のための音節認識における声道・音源特徴併用の検討
- 音節認識結果における誤り傾向を考慮した未知語学習の一方式
- 手動および自動クラスタリングによる言語モデルの比較
- 二段階探索法による連続音声認識におけるNベスト音節認識結果使用の検討
- 認識誤り傾向の確率モデルを用いた二段階探索法による大語彙連続音声認識
- 少量コーパスにおけるクラス言語モデルの一検討
- 最大分岐密度選択法の音声認識への適用
- 文字連鎖統計量を用いた未知語モデルによる単語推定
- 予備選択における性能向上の一検討
- 1段目の最適解と正解との差分傾向を考慮した2段階探索法
- 15-8 聴覚障害者のための字幕つきテレビ放送制作への自然言語処理の応用
- 種々の統計量を用いた単語リジェクト方式の検討
- 文節スポッティングにおけるスポッティング精度改善のための諸検討
- 複数条件学習による騒音・音楽環境下音声認識の検討
- テキスト音声認識におけるインクリメンタル適応型ビームサーチの検討
- 音響形態素を単位としたテキスト音声認識の検討
- 音節グラフの文脈自由構文解析におけるA^*探索の検討
- 分野非限定の大語い連続音声認識における音響言語探索手法の検討
- 分野非限定の大語い連続音声認識における音響言語結合方式の検討
- 音響的先読みによる仮説棄却取り消しの一検討