単語固有セルでのゆう度判定を用いた音声認識処理の高速化手法
スポンサーリンク
概要
- 論文の詳細を見る
音声認識技術を用いた実用システムを構築する上で,音声認識処理の高速化は重要な課題の一つである.本論文では,Treeサーチを用いる音声認識システムを例に,高速手法として音声区間終了以前でも認識処理を終了して認識結果を出力する手法について示す.本手法では,フレーム同期に音声認識処理を進め,毎フレームごとに単語固有セルのゆう度を判定し,認識処理終了条件を満たした場合に認識結果を出力する.予備実験の結果,認識処理終了条件として「Tree内で最もゆう度が高い単語固有セルが連続して一つの単語に対応」を採用することとした.本手法を,当社で研究開発中のオペレータ作業支援システムに適用して評価した結果,音声区間すべてに対して認識処理を行う場合と比較して認識率を低下させることなく約40%の高速化が可能となった.
- 社団法人電子情報通信学会の論文
- 1996-12-25
著者
-
谷戸 文廣
帝京科学大学
-
山本 誠一
国際電電 大阪支社
-
山本 誠一
国際電信電話株式会社研究所
-
谷戸 文廣
国際電信電話株式会社研究所
-
井ノ上 直己
国際電信電話株式会社研究所
-
中村 誠
国際電信電話株式会社研究所
-
酒寄 信一
国際電信電話株式会社交換サービス技術部
-
中村 誠
(株)ケイディディアイ
-
酒寄 信一
(株)ケイディディアイ
-
井ノ上 直己
国際電電 研
-
井ノ上 直己
国際電信電話(株)上福岡研究所
関連論文
- 協調フィルタリングにおける評価値予測アルゴリズムを応用した検索式拡張手法
- D-15-25 類似検索技術を応用した学術論文情報配信システム
- D-4-10 汎用XML文書符号化方式「XEUS」によるMML検索性能評価(D-4. データ工学, 情報・システム1)
- 通信環境におけるボコ-ダの品質評価
- 適応的な探索手続きによる実時間ピッチ抽出法
- 携帯電話のためのSVG拡張仕様及び符号化方式(セッション1:オントロジ・SVGによる高度コンテンツ処理)
- 携帯電話のためのSVG拡張仕様及び符号化方式
- SVGによる空間情報端末と機器インターフェース
- ATR音声言語翻訳実験システムASURA
- 擬似学習集合の生成による決定木の再構成手法と学習特性
- 実時間エキスパートシステム
- スタック型忘却随伴メモリメンテナンスシステムの動特性について
- (3)パケット交換網を利用した国際ファクシミリ伝送実験(画像通信システム研究会(第44回))
- パケット交換網を利用した国際ファクシミリ伝送試験
- ファクシミリ国際標準化の動向
- 画像形デ-タ通信について
- 不完全な履歴情報からの状態遷移経路同定方法の提案
- B-15-15 統合PDA端末の開発(5) : エラー耐性を強化した通信放送融合型データ配信システムの実装(B-15. モバイルマルチメディア通信, 通信1)
- B-15-11 統合PDA端末の開発(1) : 端末実装(B-15. モバイルマルチメディア通信, 通信1)
- 部分文仮説のゆう度を用いた連続音声認識のための音声区間検出法
- 国際電話網における音声認識の応用
- 特徴ベクトル間の交角を用いた話者照合方式
- ホームカントリーダイレクトサービスのための悪戯呼排除システムの評価
- Nベスト意味探索と再評価法を用いた大規模内線受付装置の試作
- 単語固有セルでのゆう度判定を用いた音声認識処理の高速化手法
- オペレータ作業支援システムのフィールド試験結果
- ホームカントリーダイレクトサービスのための悪戯呼排除システム
- オペレータ作業支援システムにおける不要語への対処
- 非音声のリジェクションによる音声区間始端検出誤りの削減
- Treeサーチにおける単語固有セルでの尤度判定条件を考慮した音声認識処理の高速化
- 音声認識システム利用者の発話の特徴
- 音声認識技術を用いたオペレータ作業支援システム
- ケプストラム移動平均値正規化を用いた電話音声の認識
- ホームカントリーダイレクトサービスのための悪戯呼排除システム
- 大規模内線電話受付システム
- 内線電話受付システムのフィールドテスト
- 機械との対話における発話分析 : 内線電話受付システムにより収集した対話データの分析
- 電話音声を対象とする孤立単語認識装置
- 電話音声の連続音声認識に基づく内線電話受付装置の試作と評価
- 音声認識を用いたホームカントリーダイレクト向けいたずら電話自動排除システム
- 音声信号の大局的な構造を利用した音声認識方式
- 時差・エリアコード案内システムの試作
- 発声内容を考慮した実時間ケプストラム平均値正規化の検討
- D-5-2 情報検索システムにおける高齢者に適応した質問文拡張手法
- 通信網への音声認識技術の適用
- 携帯電話のためのSVGデータ符号化方式
- 携帯電話のためのSVGデータ符号化方式(映像メディア及び一般)
- 携帯電話のためのSVGデータ符号化方式(映像メディア及び一般)
- 音声認識を用いたKDDジャパンダイレクト向けいたずら電話自動排除システム
- B-7-44 位置依存コンテンツの不感地帯への配信方法の検討
- D-15-26 学習用コンテンツの選択的プリフェッチに基づくキャッシングの検討
- 英日翻訳支援システムの翻訳品質の評価
- 波形素片接続型音声合成のための音声データの収集
- 話者照合におけるVQ歪みを用いたDP距離正規化法
- 音声信号処理, 今井聖(著):"音声信号処理",森北出版(1996-11);A5判,定価3,780円
- 人間の感性をベースにした音声信号の心理評価に関する検討
- 複雑な周波数特性近似のための効率的なIIRフィルタ設計方法
- 複雑な周波数特性近似のための効率的なIIRフィルタ設計方法
- 複雑な周波数特性近似のための効率的なIIRフィルタ設計方法
- 任意の周波数特性を実現するIIRフィルタの設計方法
- IIRフィルタによる音場空間伝達関数の設計
- 音声翻訳実験システム(ASURA)のシステム構成と性能評価
- 発話状態の予測に基づく対話音声認識手法とその効果
- 対話音声認識における次発話予測の効果
- オペレ-タ作業支援システムのための音声認識方式
- D-14-23 高齢者音声の収集および認識実験
- 情報検索タスクにおける音声対話システムの対話管理手法の考察
- 情報検索タスクにおける音声対話の分析
- 汎用XML文書符号化方式「XEUS」による高速検索手法(セッション3 : XML 検索・変換)(テーマ:デジタルコンテンツの管理と応用)
- D-4-6 P2P における高速インデックス検索技術
- 内線電話への接続をタスクとする電話対話収集システム
- 基本周波数および音素持続時間を考慮した音声合成用波形素片データセットの作成
- 漢字仮名変換を用いた仮名漢字変換率評価 : 大規模テキストを対象とした仮名漢字変換評価システムの構成と性能評価
- 自動通訳システムにおけるマルチモーダルインタフェースの検討
- 発話タイプの予測を用いた対話音声認識方式
- タスク環境を考慮した日韓自動通訳システムのインタフェース改良
- タスク環境を考慮した日韓自動通訳システムのインタフェース改良
- 日韓音声翻訳システムの設計
- 文書構造抽出を用いる機械翻訳システム
- ユーザの音楽嗜好に基づく音楽情報検索手法
- ユーザの音楽嗜好に基づく音楽情報検索手法
- 道案内タスクにおけるマルチモーダル対話の会話文の特徴分析
- ガーベジ HMM を用いた自由発話文中の不要語処理手法
- モバイル・地図へと応用広がるWebグラフィクス標準規格SVG
- コーパスに基づく共起知識の獲得とその応用 ( 「コーパスに基づく音声・自然言語処理」)
- 日英文対応データの自動付与方法
- モバイル・地図へと応用広がるWebグラフィックス標準規格
- 音声翻訳システムASURAの開発