音声認識のための言語処理 : 何が足りないか?(言語モデル)
スポンサーリンク
概要
- 論文の詳細を見る
言語モデルとしてよく用いられる単語n-gramモデルは、適切に単語に分割された対象分野のコーパスが大量に利用可能な状況では実用上十分な性能を実現できる。しかし、対象分野の言語資源としては、単語境界情報のない生コーパスだけが利用可能であったり、基準に一貫性のない単語(表記)の一覧が与えらえるのみであるという状況が現実的にはほとんどである。本稿では、一般的な分野の単語分割済みコーパスとそこに出現する単語の発音辞書があり、ある程度の量の対象分野の生コーパスが利用可能であるとの前提の下、音声認識のための言語モデルを効率よく構築することを目的として、現在利用可能な言語処理技術について述べるとともに、望まれる言語処理技術について考察する。
- 一般社団法人情報処理学会の論文
- 2008-07-11
著者
関連論文
- 現場発想による自然言語処理ブレークスルーの探求(平成21年度論文賞の受賞論文紹介)
- 擬似確率的単語分割コーパスによる言語モデルの改良
- 部分的かつ曖昧なラベル付き構造データからのマルコフ条件付確率場の学習(情報抽出・ラベル付与)
- 最大エントロピー法による単語境界確率の推定
- 文字クラスモデルによる日本語単語分割
- 文字クラスモデルに基づく日本語単語分割
- 講義音声認識に基づくノートテイクシステム(福祉と音声処理,一般)
- 点予測と系列予測の2段階化による品詞推定の精度向上
- 点予測と系列予測の2段階化による品詞推定の精度向上
- 音声認識のための言語処理 : 何が足りないか?(言語モデル)
- 現場発想による自然言語処理ブレークスルーの探求
- 文脈を考慮した確率的モデルによる話し言葉の整形
- 重み付き有限状態トランスデューサーと対数線形モデルを用いた話し言葉の整形
- 日本語単語分割の分野適応のための部分的アノテーションを用いた条件付き確率場の学習
- 点予測による形態素解析
- ベイズ推論を用いた連続音声からの言語モデル学習
- ウイグル語の形態素に基づく言語モデルと音声認識システム
- 3種類の辞書による自動単語分割の精度向上
- 音声とテキストを用いた認識単語辞書の自動構築
- 講義音声認識に基づくノートテイクシステム(福祉と音声処理,一般)
- 大学講義のノートテイク支援のための音声認識用言語モデルの適応(言語モデル)
- 自動獲得した未知語の読み・文脈情報による仮名漢字変換
- 述語項の類似度に基づく情報推薦を行う音声対話システム
- 部分的アノテーションから学習可能な係り受け解析器
- 部分的アノテーションから学習可能な係り受け解析器
- テキストと音声を用いた単語と読みの自動獲得
- テキストと音声を用いた単語と読みの自動獲得(単語辞書・発音モデル)
- 点予測による自動単語分割
- 確率的タグ付与コーパスからの言語モデル構築
- 3種類の辞書による自動単語分割の精度向上
- 音声対話システムにおける 簡略表現認識のための自動語彙拡張
- 述語項の類似度に基づく情報抽出・推薦を行う音声対話システム
- 点予測による形態素解析
- 素性頻度ファイルと部分的アノテーションコーパスからの単語分割器の学習
- 自然言語処理における分野適応(知識の転移)
- 方言対訳コーパスを用いた日本語方言音声認識システム (音声・第14回音声言語シンポジウム)
- 自然言語処理における分野適応
- IwaCamを用いたメディア処理による遠隔コミュニケーションの支援 : 同時調理を題材とした映像と音声の役割に関する考察(調理支援,データ工学と食メディア)
- 方言対訳コーパスを用いた日本語方言音声認識システム(言語モデル・音声対話)
- レシピテキストからのフローグラフコーパス作成(データ工学と食メディア)