時間非同期ビーム探索に基づく第二パスを用いた連続音声確認(音声処理技術のデモの紹介)
スポンサーリンク
概要
- 論文の詳細を見る
本デモンストレーションでは, NTTで開発している音声認識エンジンVoiceRexに, 時間非同期ビーム探索を実装し, Windows-PC上で連続音声認識を動作させる.アプリケーション例としては, 放送ニュース音声の認識, 医療用放射線科所見入力を用意する.認識結果の表示には, VoiceRex用に開発された音声ワープロソフトを用いる.図1にデモンストレーションの動作画面を示す.第2節で音声認識エンジンVoiceRexについて, 第3節で時間非同期ビーム探索についてそれぞれ解説する.
- 一般社団法人情報処理学会の論文
- 2000-06-02
著者
-
松永 昭一
長崎大学工学部
-
野田 喜昭
NTTサイバースペース研究所
-
山口 義和
日本電信電話株式会社 Nttサイバースペース研究所
-
大附 克年
日本電信電話株式会社NTTサイバースペース研究所
-
堀 貴明
日本電信電話株式会社nttコミュニケーション科学基礎研究所
-
大附 克年
早大・理工
-
中川 聡
Nttサイバースペース研究所
-
大附 克年
NTTサイバースペース研究所
-
小川 厚徳
NTTサイバースペース研究所
-
堀 貴明
NTTサイバースペース研究所
-
山口 義和
NTTサイバースペース研究所
-
松永 昭一
NTTサイバースペース研究所
-
大附 克年
マイクロソフトディベロップメント株式会社
-
山口 義和
日本電信電話株式会社nttサイバースペース研究所
-
小川 厚徳
日本電信電話株式会社nttサイバースペース研究所:名古屋大学大学院情報科学研究科
-
野田 喜昭
Ntt 研
関連論文
- 音声認識を用いたマルチメディアコンテンツのインデクシング
- 8-2 日本企業から米国・欧州大学への派遣体験 : 米国マサチューセッツ工科大学編/スイス連邦チューリッヒ工科大学編(8.企業からの客員研究員の海外派遣,私の国際交流の経験)
- 話題構造抽出に基づく会議音声インデクシングシステム(音声,聴覚)
- 音声デザインツールSesign
- 対話型自動プレゼンテーションシステム
- 音声作成ツール : Sesign99
- 音声認識システムSOLONの日本語話し言葉コーパスによる評価(2006年版)(第8回音声言語シンポジウム)
- 音声認識システムSOLONの日本語話し言葉コーパスによる評価(2006年版)(Session-7 システム,第8回音声言語シンポジウム)
- 音声認識システムSOLONの日本語話し言葉コーパス(公開版Ver.1.0)による評価(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 有限状態トランスデューサによる音声認識・文整形・要約処理の統合
- 単語の文脈一貫性と音響尤度を用いた音声ドキュメント認識信頼度の推定(認識,理解,対話,一般)
- 話者照合機能を備えた音声秘書システム
- サーチエラーリスク最小化に基づくViterbiビーム探索とその評価 (音声)
- サーチエラーリスク最小化に基づくViterbiビーム探索とその評価 (言語理解とコミュニケーション)
- 複数音響環境の発話単位遷移モデルに基づく適応学習法の検討(認識,理解,対話,一般)
- 識別的誤り訂正学習における対立単語列と素性の選定(特徴量・音響モデル,第9回音声言語シンポジウム)
- 識別的誤り訂正学習における対立単語列と素性の選定(特徴量・音響モデル,第9回音声言語シンポジウム)
- 識別的誤り訂正学習における対立単語列と素性の選定(特徴量・音響モデル,第9回音声言語シンポジウム)
- テキスト選択に基づくタスク依存言語モデル構築の検討
- 大規模データベースを用いたタスク依存言語モデル構築の検討
- サーチエラーリスク最小化に基づくViterbiビーム探索とその評価(デコーダ,第11回音声言語シンポジウム)
- サーチエラーリスク最小化に基づくViterbiビーム探索とその評価(デコーダ,第11回音声言語シンポジウム)
- CTI向け自由発話対応音声対話システムRexDialog
- 関連語彙獲得に基づく認識辞書のオフライン教師なし適応(音声・音響処理)
- 関連語彙獲得に基づく認識辞書のオフライン教師なし適応(音声・音響処理)
- D-14-11 音声認識結果の単語系列の言語的妥当性に基づく正誤判定(D-14. 音声・聴覚)
- 話題構造抽出に基づく会議音声インデクシング
- 音声認識エンジンREXの開発
- 音声認識システムSOLONの日本語話し言葉コーパスによる評価(2006年版)(Session-7 システム,第8回音声言語シンポジウム)
- 音声認識システムSOLONの日本語話し言葉コーパス(公開版Ver.1.0)による評価(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 音声認識システムSOLONの日本語話し言葉コーパス(公開版Ver.1.0)による評価(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 雑音適応におけるTaylor展開の2次微分項の導入による効果
- 単語グラフを用いた大語彙連続音声認識における近似演算法
- Jacobian適応法による雑音適応の性能評価
- Jacobi行列を用いた音響モデルの適応アルゴリズム
- 単語グラフを用いた大語彙連続音声認識における近似演算手法の検討
- Taylor展開による音響モデルの適応
- Taylor展開による音響モデルの適応
- Taylor展開に基づく高速な音響モデル適応法
- スペクトルサブトラクションとNOVO合成を用いた雑音下音声認識
- N-best候補を用いた話題抽出の検討
- 単語trigramを用いた大語彙連続音声認識
- 大語彙連続音声認識を用いた音声・映像コンテンツのインデクシング
- 音声認識・言語処理の適用によるコンテンツ内容記述メタデータの生成 (特集 メタデータ応用サービスおよび関連技術の動向)
- 音源分離方式SAFIAを用いた高騒音下における近接音源の分離抽出(電気音響, 音響一般)
- チャネル間情報を利用した音源分離手法(SAFIA)による混合音声の認識
- インターネットと音声・オーディオ処理技術
- 確率主成分分析を用いた音声認識の日本語話し言葉コーパスにおける評価
- 高次の音素環境依存モデルを統合した重み付き有限状態トランスデューサの効率的生成法
- 高次の音素環境依存モデルを統合した重み付き有限状態トランスデューサの効率的生成法(大語彙音声認識)(第6回音声言語シンポジウム)
- 混成主成分分析を用いた音声認識(ポスターセッション)
- 混合主成分分析を用いた音声認識
- 高次の音素環境依存モデルを統合した重み付き有限状態トランスデューサの効率的生成法(大語彙音声認識)(第6回音声言語シンポジウム)
- 高次の音素環境依存モデルを統合した重み付き有限状態トランスデューサの効率的生成法(大語彙音声認識)(第6回音声言語シンポジウム)
- 混合主成分分析を用いた音声認識(ポスターセッション)
- 混合主成分分析を用いた音声認識(ポスターセッション)
- 書き起こし想定発話の音声認識における言語モデルの検討
- 音素履歴近似とDelayed Bigramを用いた効率的探索手法の検討
- 時間非同期ビーム探索に基づく第二パスを用いた連続音声確認(音声処理技術のデモの紹介)
- 音声認識エンジンVoiceRexの応用--応用事例と適用のコツ (特集 ここまできた音声認識・音声合成)
- 音声認識機能を持つ住所入力システム
- 音声入力機能を持つ住所入力システム
- 音声認識機能を持つ住所入力システム
- 音声認識における新しい高速化
- クライアント・サーバ構成のHMM-LR連続音声認識システムとその応用
- 実時間音声認識における高精度探索方式--音素環境依存モデルを用いたHMM-LR音声認識方式の高速化 (インタラクティブな音声インタフェ-スの実現を目指して)
- D-14-19 ニュースコンテンツにおける音響信号自動判別の検討
- F-4 概念ベクトルによるトピックセグメンテーションのニュース音声への適用(音声・音声言語情報処理,F.音声・音楽)
- 話題の連続/不連続変化を考慮したトピックモデルに基づく音声認識(言語モデル・システム,第10回音声言語シンポジウム)
- 話題の連続/不連続変化を考慮したトピックモデルに基づく音声認識(言語モデル・システム,第10回音声言語シンポジウム)
- 話題の連続/不連続変化を考慮したトピックモデルに基づく音声認識(言語モデル・システム,第10回音声言語シンポジウム)
- 小学生音声データベースを用いた子供音声認識の検討(音声,聴覚)
- D-14-15 日本人英語音声認識における話者適応の検討
- 小学生音声データベースの構築とそれを用いた子供音声認識の一検討
- 小学生音声データベースの構築と評価
- マルチパス探索における第2パス探索法
- 音声認識エンジンVoiceRexを用いたリハビリ所見入力用音声ワープロ
- 音声認識エンジンVoiceRexによるニュース放送音声認識
- マルチパス探索における第2パス探索法の検討
- 音声認識エンジンVoiceRexによる文書作成--連続音声認識機能を用いた音声ワープロ (特集 ここまできた音声認識・音声合成)
- 適応音響モデルを用いた放送ニュース音声認識
- 音源識別のための環境音クラスタリングの効果(合成,生成,韻律,一般)
- マルチメディア時代を支える音声認識技術 (特集論文 メディア処理技術)
- 音声認識エンジンVoiceRexの開発
- 音声認識エンジンVoiceRexを開発--幅広い応用に対応できる音声認識ソフトウェア (特集 ここまできた音声認識・音声合成)
- 混合主成分分析を用いた音声認識
- コンフュージョンネットワークを用いたオープン語彙発話検索法とその評価
- HMM状態-単語の同時確率を用いた音声言語処理のための複雑度指標
- 高次の音素環境依存モデルを統合した重み付き有限状態トランスデューサの効率的生成法
- Advanced INへの音声認識適用法に関する検討
- 前向きヒューリスティック関数を用いたビーム探索によるHMM-LR連続音声認識
- スカラー量子化による4階層共有構造HMMの高速計算
- 動的リジェクト機能をもつ前向きヒューリスティック関数によるビーム探索
- 前向き尤度を用いたA^*ビーム探索によるHMM-LR音声認識
- 複数人会話シーン分析におけるマイクロホンアレイ音声処理(一般,音声・音響信号処理,音声及び一般)
- 複数人会話シーン分析におけるマイクロホンアレイ音声処理(一般,音声・音響信号処理,音声及び一般)
- 複数人会話シーン分析におけるマイクロホンアレイ音声処理(一般,音声・音響信号処理,音声及び一般)
- 単語の文脈一貫性を用いた音声ドキュメント認識信頼度の推定
- 単語の文脈一貫性を用いた音声ドキュメント認識信頼度の推定
- 文脈類似度と認識信頼度に基づく音声認識辞書の自動語彙適応(言語モデル・音声対話)