音声とテキストを用いた認識単語辞書の自動構築
スポンサーリンク
概要
- 論文の詳細を見る
大語彙連続音声認識(LVCSR)システムを新しい分野に導入する場合,その分野特有の単語を認識単語辞書に追加しなければならないが,計算量や認識単語辞書のメンテナンスを考慮すると,必要な分野特有の単語とその正しい読みのみを選択的に追加することが望ましい.しかし,日本語は,単語間に空白が置かれず,読みにもあいまい性があるため,対象分野のテキストデータのみから分野特有の単語とその読みを正しく自動的に獲得することは困難である.本論文では,対象分野のテキストデータに加えて,音声データも利用することで,対象分野特有の単語とその読みを含む小さいサイズの認識単語辞書を自動構築する方法を提案する.提案手法では,最初にテキストデータから再現率を重視した方法で大きいサイズの認識単語辞書を作成した後,その中から,音声データを利用して必要な単語と読みを選択し,小さいサイズの認識単語辞書を構築する.実験により,音声データを利用することで,最初の認識単語辞書のサイズの10%以下の小さい認識単語辞書の追加で,対象分野のLVCSRシステムを構築することができ,それが従来手法と比較して良い認識精度を示すことを確認した.
- 一般社団法人情報処理学会の論文
- 2008-08-15
著者
-
森 信介
京都大学学術情報メディアセンター
-
西村 雅史
日本アイ・ビー・エム東京基礎研究所
-
伊東 伸泰
日本アイ・ビー・エム東京基礎研究所
-
倉田 岳人
日本アイ・ビー・エム株式会社東京基礎研究所
-
西村 雅史
日本アイ・ビー・エム株式会社東京基礎研究所
-
西村 雅史
日本アイ・ビー・エム(株)
-
西村 雅史
(株)アイテス 技術事業部 コンポーネント・テクノロジー保証
-
倉田 岳人
日本アイ・ビー・エム株式会社,東京基礎研究所
関連論文
- 擬似確率的単語分割コーパスによる言語モデルの改良
- 音声認識応用に関する学会試行標準
- コーパスベース日本語音声合成フロントエンド (システム開発論文特集)
- 波形重畳型音声合成の韻律と音質のためのF0傾きモデルの利用(音声合成・韻律,第9回音声言語シンポジウム)
- コーパスベース日本語音声合成フロントエンド(音声システム,システム開発論文)
- ユーザの発話傾向分析に基づく車載機器操作のための音声入力手法の検討(音声システム,システム開発論文)
- 剖検記録の音声認識のための言語モデル作成
- 単語クラスタリングによる確率的言語モデルの分野適応
- 電話音声による列車時刻問合せシステムの評価
- LSAにもとづく電話音声情報検索システム
- 子供音声データベース
- 構造を仮定しない文解釈の一手法
- 自由発話向け言語モデルの現状と課題
- 講義コーパスを用いた自由発話の大語彙連続音声認識(音声情報処理 : 現状と将来技術論文特集)
- 形態素係り受けモデルによる構文解析
- 2000-SLP-32-3 構文構造を反映した確率的言語モデル
- 放送大学コーパスを用いた自由発話の大語彙連続音声認識
- 口語体言語モデルのためのコーパス
- 単語を認識単位とした日本語の大語彙連続音声認識 (音声言語情報処理)
- 音声ワープロ : 過去・現在・未来
- 放送音声の書き起こしに関する検討
- 音声認識・合成によるホームページの閲覧方式
- 単語単位による日本語言語モデルの検討
- ニュース音声書き起こしシステムに関する検討
- 単語を認識単位とした日本語の大語彙連続音声認識
- 講義音声認識に基づくノートテイクシステム(福祉と音声処理,一般)
- 7 音声インタフェースの現状とイノベーションの可能性(音声認識技術の実用化への取り組み)
- 音声インタフェースの現状とイノベーションの可能性 (特集 音声認識技術の実用化への取り組み)
- 点予測と系列予測の2段階化による品詞推定の精度向上
- 点予測と系列予測の2段階化による品詞推定の精度向上
- 波形重畳型音声合成の韻律と音質のためのF0傾きモデルの利用(音声合成・韻律,第9回音声言語シンポジウム)
- 波形重畳型音声合成の韻律と音質のためのF0傾きモデルの利用(音声合成・韻律,第9回音声言語シンポジウム)
- 音声認識のための言語処理 : 何が足りないか?(言語モデル)
- 電話音声による列車時刻問合せシステムの評価
- 日本語自由発話電話音声からの固有表現抽出
- 長時間スペクトル変動と調波構造に基づく発話区間検出法の音声認識による評価
- 文脈を考慮した確率的モデルによる話し言葉の整形
- 重み付き有限状態トランスデューサーと対数線形モデルを用いた話し言葉の整形
- 点予測による形態素解析
- 日本語生コーパスから自動獲得した未知語と言語モデルによる大語彙連続音声認識([特別セッション]音声言語獲得・学習技術(2), 未知語処理)
- ベイズ推論を用いた連続音声からの言語モデル学習
- ウイグル語の形態素に基づく言語モデルと音声認識システム
- 音声言語インタフェースのための情報処理学会試行標準
- 3種類の辞書による自動単語分割の精度向上
- 音声とテキストを用いた認識単語辞書の自動構築
- 講義音声認識に基づくノートテイクシステム(福祉と音声処理,一般)
- 中間累積距離と音節間類似度を用いた単音節音声認識
- ユーザの発話傾向分析に基づく車載機器操作のための音声入力手法の検討
- 長時間スペクトル変動情報と調波構造特徴量を併用した発話区間検出法(音声認識技術)
- 自動車内音声認識のためのスペクトル サブトラクションとエコーキャンセラの同時適応法
- 講義関連コーパスを利用した音声認識システムの自動適応(音声,聴覚)
- 音声合成のための自動アクセントラベリング(セッション5 : 音声認識+音声合成)
- 音声合成のための自動アクセントラベリング(セッション5 : 音声認識+音声合成)
- N-gramモデルを用いた音声合成のための読みおよびアクセントの同時推定(音声言語,情報処理技術のフロンティア)
- 確率モデルを用いた読み及びアクセント推定(言語解析, 対話)
- 読み上げ韻律との差分を使った強調韻律の学習
- 音声認識ビジネスの現状と将来展望(音声認識のビジネス動向)
- 雑音・残響下音声認識におけるHMM分離・合成法の改良(音響と音声処理,音声強調,ロバスト音声認識)
- 雑音・残響下音声認識におけるHMM分離・合成法の改良(音響と音声処理,音声強調,ロバスト音声認識)
- ハンズフリー音声認識におけるHMM分離法の改良
- 残響下音声認識におけるHMM分離法の改良
- 調波構造と音源方向を利用した音声強調手法の検討
- フレーム単位でのモデル選択による突発性雑音下での音声認識
- 車内音声認識におけるマルチスタイル学習法の効果について
- HMM 合成と遅延和アレーの統合による混合音声の認識
- HMM合成法を用いた混合音声の認識
- IBM電話音声自動応答システム(音声処理技術のデモの紹介)
- 日本語ディクテーションシステムの現状と今後の課題
- 日本語ディクテーションシステムの現状と今後の課題
- 日本語ディクテーションシステムの現状と今後の課題
- 音声認識・理解のための統計的言語処理
- 音声ワープロ最新事情
- オンライン文字認識における後処理 : 住所・姓名の文字補完機能
- 単語を認識単位とした日本語大語彙連続音声認識
- 単語を認識単位とした日本語ディクテーションシステム
- 人の発声単位を考慮した日本語言語モデルの検討 : 日本語における単語とは
- 大学講義のノートテイク支援のための音声認識用言語モデルの適応(言語モデル)
- 単語を認識単位とした日本語ディクテーションシステム
- N-gramを用いた日本語テキストの単語単位への分割
- クラスに基づく言語モデルのための単語クラスタリング
- 離散単語発生による日本語ディクテーションシステムについて
- 自動獲得した未知語の読み・文脈情報による仮名漢字変換
- 日本語Dictation Systemのための統計的言語モデルに関する一考察
- 述語項の類似度に基づく情報推薦を行う音声対話システム
- 部分的アノテーションから学習可能な係り受け解析器
- 部分的アノテーションから学習可能な係り受け解析器
- テキストと音声を用いた単語と読みの自動獲得
- テキストと音声を用いた単語と読みの自動獲得(単語辞書・発音モデル)
- 点予測による自動単語分割
- 確率的タグ付与コーパスからの言語モデル構築
- 3種類の辞書による自動単語分割の精度向上
- 音声対話システムにおける 簡略表現認識のための自動語彙拡張
- 述語項の類似度に基づく情報抽出・推薦を行う音声対話システム
- 点予測による形態素解析
- 素性頻度ファイルと部分的アノテーションコーパスからの単語分割器の学習
- 自然言語処理における分野適応(知識の転移)
- 方言対訳コーパスを用いた日本語方言音声認識システム (音声・第14回音声言語シンポジウム)
- 自然言語処理における分野適応
- IwaCamを用いたメディア処理による遠隔コミュニケーションの支援 : 同時調理を題材とした映像と音声の役割に関する考察(調理支援,データ工学と食メディア)
- レシピテキストからのフローグラフコーパス作成(データ工学と食メディア)