ニュース音声認識における言語モデルの検討
スポンサーリンク
概要
- 論文の詳細を見る
ニュース音声は読み上げ音声に比べ音声認識が困難な題材であるが、高齢者・聴覚障害者のための字幕付与サービスなどへの応用が期待されている。今年になって、NHKニュース放送音声のデータベースが構築され、これを対象とした音声認識タスクが研究されている。大語彙音声認識には精度の良い言語モデルが不可欠であるが、本研究では、(1)付属語連鎖・複合名詞を連語として登録し一単語として扱う連語モデル、(2)名詞語彙をタスクに合わせて入れ換える名詞フラットモデル、(3)品詞に基づいて語彙を分類した品詞クラスモデル、という3種類のN-gram言語モデルを作成した。その結果、(1)についてはパープレキシティの改善が見られた。これらの言語モデルをニュース音声認識に適用した結果について報告する。
- 社団法人電子情報通信学会の論文
- 1997-12-12
著者
関連論文
- 母音による話者認識における特徴量変換(「感性情報処理の基礎と応用」及びヒューマン情報処理一般)
- 帯域フィルタ出力の時間変化特徴量を利用した音声認識(音声,聴覚)
- 可変長サブワードHMMに基づく未知語処理を導入した音声認識(第8回音声言語シンポジウム)
- 可変長サブワードHMMに基づく未知語処理を導入した音声認識(Session-6 音声認識,第8回音声言語シンポジウム)
- D-14-8 累積音素尤度によるオンライン発話検出と男女音声認識(D-14.音声・聴覚,一般講演)
- 帯域フィルタ出力の時間変化特徴量を利用したニュース音声認識(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 実況・対談における発声変形を考慮した音響モデルの検討(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- 複数の信頼度尺度を統合した音声認識(ポスターセッション)(第6回音声言語シンポジウム)
- 法科学的話者照合のための標準化・正規化クロスVQ歪みの利用
- 単独発声母音を用いた話者照合における特徴量変換
- 言い換えを利用したリスピーク方式によるスポーツ中継のリアルタイム字幕制作(音声,聴覚)
- フィルターバンクサブトラクションによる雑音環境下の音声認識 (音声認識による字幕サービス 特集号)
- 生字幕放送のための音声認識 : システムの概要とリスピークの効果
- 連続音声認識における動的特徴量の高精度な計算法
- 可変長サブワードHMMに基づく未知語処理を導入した音声認識(Session-6 音声認識,第8回音声言語シンポジウム)
- 帯域フィルタ出力の時間変化特徴量を利用したニュース音声認識(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 雑音環境下単語認識のための複素周波数領域における参照再構成法
- マルチSNR・マルチバンド法を用いた話者識別における様々な学習雑音に対する性能評価
- マルチSNR部分帯域モデルを用いた話者識別システムの耐雑音性能改善
- マルチSNR部分帯域モデルを用いた雑音環境下での話者識別
- フレーム単位で最適 SNR 部分帯域モデルを選択する話者認識
- マルチSNR部分帯域GMMを用いた雑音環境下での話者認識
- マルチSNR部分帯域GMMを用いた雑音環境下での話者認識
- 日本語連続音声認識におけるスコア関数の比較
- 雑音低減のための複素周波数領域における参照再構成法(第8回音声言語シンポジウム)
- 雑音低減のための複素周波数領域における参照再構成法(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 雑音低減のための複素周波数領域における参照再構成法(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 雑音低減のための複素周波数領域における参照再構成法
- 話し言葉コーパスの係り受け解析を目的とした韻律の分析
- [若手研究者育成レクチャーシリーズ]韻律と統語構造
- 韻律情報を用いた日本語読み上げ文の係り受け解析におけるニューラルネットワークの利用
- 日本語読み上げ文の係り受け解析における複数ポーズ情報の利用
- 文節間係り受け整合度と文節重要度を用いて自動簡約した日本語文の主観評価
- 韻律を利用した係り受け解析におけるポーズ・基本周波数情報の結合法の検討
- 日本語読み上げ文の係り受け解析における韻律的特徴量の有効性
- 係り受け解析におけるポーズ・ピッチの利用法の検討
- 文節重要度と係り受け整合度に基づく日本語文簡約アルゴリズム
- ニュース音声認識システムの検討
- 帯域フィルタ出力の時間変化特徴量を利用したニュース音声認識(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 実況・対談における発声変形を考慮した音響モデルの検討(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- 実況・対談における発声変形を考慮した音響モデルの検討(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- 誤認識関数を最小化する標準パターン学習アルゴリズム
- 音響尤度補正による雑音環境下の音声認識の改善
- 雑音モデルに基づく補正音響尤度を用いた音声認識(雑音下音声処理)(第6回音声言語シンポジウム)
- 複数の信頼度尺度を統合した音声認識(ポスターセッション)(第6回音声言語シンポジウム)
- 雑音モデルに基づく補正音響尤度を用いた音声認識(雑音下音声処理)(第6回音声言語シンポジウム)
- 複数の信頼度尺度を統合した音声認識(ポスターセッション)(第6回音声言語シンポジウム)
- 雑音モデルに基づく補正音響尤度を用いた音声認識(雑音下音声処理)(第6回音声言語シンポジウム)
- 真の認識率の事後確率に基づく認識システムの性能比較
- 決定木による日本語長文の短文分割
- 分類木を用いた日本語文の自動文節分割
- 文節間係り受け距離の統計的性質を用いた日本語文の係り受け解析
- 文節間係り受け距離の統計的性質とその係り受け解析への応用
- アフィン変換を用いた音声特徴量の正規化
- 選択学習による音響モデルの適応化 (音声認識による字幕サービス 特集号)
- 文節重要度と係り受け整合度に基づいた文簡約実験
- 雑音重畳音声の認識における連語言語モデルの比較
- 1994年音声言語処理国際会議
- 間投詞・非流暢発話と休止による対話音声区分化の検討
- 単語クラスタリングに基づく言語モデルを用いたニュース音声認識
- ニュース音声認識のための言語モデルの比較
- ニュース音声認識における言語モデルの検討
- ニュース音声認識における言語モデルの検討
- ニュース音声認識における言語モデルの検討
- 種々の音響条件におけるニュース音声認識についての考察
- 複数の単語bigramモデルを線形結合した言語モデルの検討
- 韻律情報を利用した係り受け解析
- 韻律情報を利用した係り受け解析
- 非負値行列因子分解を用いた音素配列情報の抽出による言語識別の検討(ポスターセッション,第13回音声言語シンポジウム)
- 非負値行列因子分解を用いた音素配列情報の抽出による言語識別の検討(ポスターセッション,第13回音声言語シンポジウム)
- 11-2 番組音声とリスピーク音声の自動認識を利用したニュース字幕制作実験(第11部門 放送現業)
- 10-2 番組音声とリスピーク音声の認識を併用した生字幕制作の検討(第10部門 放送現業)
- 非負値行列因子分解を用いた音素配列情報の抽出による言語識別の検討
- 非負値行列因子分解を用いた音素配列情報の抽出による言語識別の検討
- Myアルゴリズムで聞き分け率アップ! ボイス制御マシンにも使える!? ラズベリー・パイでトライ! 音声認識 お試しプログラムも用意!(第1回)最初のステップ!音声の波形表示&解析 (特設コーナ 音声信号処理の世界)
- Myアルゴリズムで聞き分け率アップ!ボイス制御マシンにも使える!? ラズベリー・パイでトライ! 音声認識 : お試しプログラムも用意!(第4回)話す人が違ってもOK!音や文章を抽出するためのキー・テクノロジ 本格認識の前に…声の特徴を表すデータベース音響モデル入門 (特設コーナ 音声信号処理の世界)
- Myアルゴリズムで聞き分け率アップ!ボイス制御マシンにも使える!? ラズベリー・パイでトライ! 音声認識 お試しプログラムも用意!(第6回)データ量は生音の15%! 必要な値だけ計算すればOK 認識処理に使う重要データ!音声特徴量MFCCを求める (特設コーナ 音声信号処理の世界)