音声自動認識に関する情報工学的諸考察
スポンサーリンク
概要
- 論文の詳細を見る
本論文は, 音声自動認識についてのさまざまな問題点を列挙し, それらに対する諸考察を実験結果を基に述べている. それらは, 一貫して音声自動認識をシステム的にとらえたもので, より本質的な能率のよい効果的な認識方法を見い出すことに主眼をおいている. 主な研究結果として, 音韻識別へのグルーピング手法の導入, 音韻識別部の能力が単語識別率に与える影響評価, 単語音声の記述法とそれに基づいた単語音声認識手法の分類と評価, 単語音声の認識時間を短縮するために単語音声の大局・局所的特徴を用いた予備選択(前照合)の概念の導入とその可能の検討, 認識対象語の彙の認識困難度の評価, 韻律情報の音声認識への利用法の検討, 準最適な単語列を得るための新しい木探索法の提案, 音声理解に適した文解析法の提案, 言語情報の有効性の評価などがあげられる.
- 一般社団法人情報処理学会の論文
- 1980-09-15
著者
関連論文
- 長時間分析に基づく位相情報を用いた音声認識の検討 (音声)
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 1992年音響・音声・信号処理国際会議(ICASSP-92)報告
- 1987年音響・音声・信号処理国際会議(ICASSP 87)
- 文字コードに依存しない情報検索の実現
- 中間言語を用いたインドネシア語-日本語対訳辞書の拡充
- 非頻出語に対して頑健な日本語固有表現の抽出(語彙・固有表現・同義語)
- ワードスポッティング法を用いた文脈自由文法制御フレーム同期型HMM連続音声認識法
- ニュース番組における字幕生成のための文内短縮による要約
- 3W-5 ニュース音声の認識結果を用いた要約による字幕生成
- ニュース音声の認識とその要約・検索による検討
- 機械学習を用いた複数の大語彙連続音声認識モデルの出力の混合 : 旅行会話音声における評価
- 連続出力分布型HMMによる日本語音韻認識
- 認識結果の正解確率に基づく信頼度のリジェクション(音声情報処理 : 現状と将来技術論文特集)
- スペクトルサブトラクションと時間方向スムージングを用いた雑音環境下音声認識
- 認識結果の正解確率に基づく信頼度とリジェクション
- スペクトルサブトラクションを用いた雑音環境下音声認識における時間方向スムージングと分析窓長増加の効果
- スペクトルサブトラクションを用いた雑音環境下音声認識における時間方向スムージングの効果
- E-055 VADが音声認識性能に与える影響(E分野:自然言語・音声・音楽)
- 長時間分析に基づく位相情報を用いた音声認識の検討(認識,理解,対話,一般)
- Hidden Conditional Neural Fieldsを用いた音声認識における目的関数と階層的音素事後確率特徴量の検討
- 重要文抽出に基づく講義音声の自動要約
- Spoken Term Detection のためのテストコレクション構築とベースライン評価
- Hidden Conditional Neural Fieldsを用いた音声認識の検討
- 複数の対話エージェントを扱う音声対話システムの構築と評価
- 距離付きn-gramインデックスによる認識誤りと未知語に頑健な高速検索法
- NTCIR-9 SpokenDoc: 音声検索語検出と音声ドキュメント検索の評価枠組の設計
- 自動車内情報システムインタフェース制御のための運転過負荷状態の検出
- 音声中の検索語検出のためのテストコレクション構築 : 中間報告
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- 複数の対話エージェントを扱う音声対話システムの開発
- DI-1-1 音声処理技術の新たな展開(DI-1. メディア情報技術の新たな展開:音声・言語・画像技術はどう拡大・発展するのか、どう融合するのか,依頼シンポジウム,ソサイエティ企画)
- 音声に含まれるプライバシ情報の保護(センシングウェブ)
- フィラー予測モデルに基づく話し言葉言語モデルの構築
- 日本語講義音声コンテンツコーパスの作成と分析
- 特集「音声ドキュメント処理」の編集にあたって
- 位相情報を利用した話者識別・照合法の評価(ポスターセッション,第10回音声言語シンポジウム)
- 位相情報を利用した話者識別・照合法の評価(ポスターセッション,第10回音声言語シンポジウム)
- 1992年音声言語処理国際会議
- 座談会 : 音声研究 (音声研究)
- 非頻出語に対して頑健な日本語固有表現の抽出(語彙・固有表現・同義語)
- フィラーの書き起こしのないコーパスからのフィラー付き言語モデルの構築(話し言葉処理)
- 機械学習を用いた日本語機能表現のチャンキング
- 日本語複合辞用例データベースの作成と分析(自然言語,情報処理技術のフロンティア)
- 誤認識に対処した自然で効率的な音声対話戦略の評価(音声対話・セグメンテーション)
- 誤認識に対処した自然で効率的な音声対話戦略の評価(音声対話・セグメンテーション)
- 講義音声ドキュメントのコンテンツ化と視聴システム(教育システムにおけるプラットホームとコンテンツ開発論文)
- 講義音声自動要約のための重要文手がかり表現の自動抽出(学生セッション II)
- 講義音声自動要約のための重要文手がかり表現の自動抽出(学生セッション II)
- 講義音声認識における収録装置とケプストラム正規化法の検討(第8回音声言語シンポジウム)
- 講義音声認識における収録装置とケプストラム正規化法の検討(Session-6 音声認識,第8回音声言語シンポジウム)
- 講義音声認識における収録装置とケプストラム正規化法の検討(Session-6 音声認識,第8回音声言語シンポジウム)
- 講義音声認識における収録装置とケプストラム正規化法の検討
- 講義音声の認識・要約・インデックス化の検討(要約・分割)
- Trigram・4-gramと文脈依存音響モデルを用いた1パス大語彙連続認識アルゴリズムとその高精度化(認識・理解・対話・一般)
- 誤認識の修復のための自然で効率的な音声対話戦略
- D-14-9 音響特徴を用いた対システム発話と対人間発話の識別(D-14.音声・聴覚,一般講演)
- 発話位置依存CMNとマルチマイクロフォンアレイ処理の併用による遠隔発話の音声認識(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 複数の雑音抑圧手法の統合に基づく雑音下音声認識(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 位相情報を利用した話者識別・照合法の評価(ポスターセッション,第10回音声言語シンポジウム)
- 重要文の連続性を考慮した講義音声の自動要約(チャンキング・要約)
- セグメント単位入力HMMによる雑音環境下での音声認識
- 発話スタイルによる話速・音韻間距離・ゆう度の違いと音声認識性能の関係(音声情報処理 : 現状と将来技術論文特集)
- HMMに基づく音声認識のための音節モデルとtriphoneモデルの比較
- SP2000-18 発話間のVQ歪みを用いたオンライン話者交替識別と話者クラスタリング
- 話速・音韻間距離・尤度と音声認識性能の関係
- 音節モデルによる連続音声認識の性能の検討
- STRAIGHTによるスペクトル包絡特性を用いた連続音節認識
- 雑音重畳音声のフレーム間相関と音声認識性能に関する考察
- 音声知覚実験による音声認識モデル単位の検討
- HMMを用いた英単語音声からの強勢音節の自動検出とそれに基づく発音能力の韻律的評定
- HMMを用いた英単語音声からの強勢音節検出と発音の韻律評価
- Spoken Term Detection のためのテストコレクション構築とベースライン評価
- ニュース文の音声要約のための韻律情報の利用
- ここまでできるぞ音声/言語処理技術 : 音声編
- 音素モデルに基づく中国語連続音声認識システムの性能評価
- 日本人の英語発音の評価法
- 文字コードに依存しない情報検索の実現
- 表層的言語情報と韻律情報を用いた講演音声の重要文抽出
- ニュース音声認識システムの検討
- SD-2-1 日本語音声教育のための音声データベース
- 音声による対話システムにおける発話の確認方法
- 音声スペクトルの時間軸・周波数軸・強度軸の同時非線形伸縮に基づく不特定話者の単語音声の認識
- 音声自動認識に関する情報工学的諸考察
- 日本語算術文の音声認識におけるピッチパタ-ンの利用
- 日本語音声スペクトルの特徴分析および音声認識・話者認識への考察
- 個人差の種々の学習機能をもつ実時間単語音声識別システム
- 不特定話者・連続音声向き単語音声の識別 (パターン情報処理)
- 自然な発話を対象としたパソコン/ワークステーション用連続音声認識ソフトウェア
- 日本人話者による英語文・単語音声データベースの構築
- 発話位置依存ケプストラム平均正規化に基づくGMMと話者適応化音節HMMの併用による遠隔発話の話者認識
- NTCIR-3音声入力ウェブ検索タスクにおける複数音声認識モデル混合の評価
- SVMを用いた複数の大語彙連続音声認識モデルの出力の混合
- それぞれの役割(ちょっとしたエッセイ,コーヒーブレーク)
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 音声ドキュメント処理ワーキンググループ活動報告