識別学習に基づく音声認識単語辞書の最適化の評価(言語モデル・辞書,第13回音声言語シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
日本語やウイグル語のような膠着言語では、単語の単位の定義が自明でない。音声認識の単位として形態素が一般的に用いられるが、多くの形態素が短いため、制約として弱く、誤認識の原因になる。我々は、識別学習に基づいて、音声認識誤りの削減に直結するような単語のエントリを選択する方法を提案している。本手法では、各単語エントリに対して、素性の集合とそれらの重みからなる評価関数、及び、形態素単位のモデルと単語単位のモデルの誤り率の差による誤分類尺度を定義した上で、パーセプトロン学習によって素性の重みを学習する。その上で、評価関数の値の高い単語もしくはサブワードのエントリを辞書に追加する。本手法をウイグル語の大語彙連続音声認識システムに適用し、(1)有効な素性、(2)サブワードエントリの効果、に関して評価を行った。さらに、従来の頻度や相互情報量に基づく手法と比較した上で、それらとの組み合わせも検討した。
- 2011-12-12
著者
-
河原 達也
京都大学
-
河原 達也
京都大学学術情報メディアセンター
-
河原 達也
京都大学工学部
-
河原 達也
京都大学情報学研究科
-
河原 達也
Academic Center for Computing and Media Studies, Kyoto University, Japan.
-
河原 達也
京大・情報学
-
河原 達也
京都大学大学院情報学研究科
-
アブリミテ ミジテ
京都大学情報学研究科
-
ハムヅラ アスカ
新彊大学信息学院
-
河原 達也
京都大学 学術情報メディアセンター
関連論文
- ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理技術の総合開発(総合報告)
- ロボットのための音声認識
- 会議録作成支援のための国会審議の音声認識システム (画像符号化・映像メディア処理レター特集)
- 音声理解を指向したベイズリスク最小化枠組みに基づく音声認識(音声,聴覚)
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- オンライン変分ベイズ学習に基づくモデル比較を用いた音声区間検出(認識)
- 会議録作成支援のための国会審議の音声認識システム(音声,聴覚)
- 11.人にやさしい音声インタフェース(第2部:情報の高信頼蓄積・検索技術等の開発,学と産の連携による基盤ソフトウェアの先進的開発)
- 音声翻訳単位の推定における句読点情報の効果(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 音声対話技術コンソーシアム(ISTC)の活動成果報告(SIG-SLP内組織の活動報告)
- 音声ドキュメント検索評価のためのテストコレクションの試作(第8回音声言語シンポジウム)
- 音声ドキュメント検索評価のためのテストコレクションの試作(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 講義音声認識に基づくノートテイクシステム(福祉と音声処理,一般)
- 話し言葉における引用節・挿入節の自動認定および係り受け解析への応用
- 音声翻訳単位の推定における句読点情報の効果(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 音声翻訳単位の推定における句読点情報の効果(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 点予測と系列予測の2段階化による品詞推定の精度向上
- 点予測と系列予測の2段階化による品詞推定の精度向上
- ウエーブレットの最適化と雑音プロファイルを用いた雑音抑圧による頑健な音声認識
- SuperHマイコンへの搭載を目的とした連続音声認識ソフトウェアJuliusの計算量削減
- 頑健な音声認識のためのウエーブレットパラメータの最適化に基づく残響抑圧
- 「ユビキタスアプリケーションを支えるツールキット」(全4回) : 第3回 Julius を用いた音声認識インタフェースの作成
- Spoken Term Detection のためのテストコレクション構築とベースライン評価
- Webからの情報抽出を用いた音声対話システム
- 国会音声認識システムの音響・言語モデルの半自動更新
- NTCIR-9 SpokenDoc: 音声検索語検出と音声ドキュメント検索の評価枠組の設計
- 音声中の検索語検出のためのテストコレクション構築 : 中間報告
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 頑健な音声認識のためのウエーブレットパラメータの最適化に基づく残響抑圧
- 文化と言語の維持保存に貢献するためのデジタル博物館の試みトランスクリプションデータを流用する字幕映像生成システムの提案
- 点予測による形態素解析
- 文化と言語の維持保存に貢献するためのデジタル博物館の試みトランスクリプションデータを流用する字幕映像生成システムの提案
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- 会議音声認識におけるBICに基づく高速な話者正規化と話者適応
- ベイズ推論を用いた連続音声からの言語モデル学習
- スライド情報を用いた言語モデル適応による講義音声認識
- 音声会話コンテンツにおける聴衆の反応に基づいたホットスポットの抽出
- ウイグル語の形態素に基づく言語モデルと音声認識システム
- 頑健なパラメタ推定のためのAggregated EM法の提案と評価(特徴量・音響モデル,第9回音声言語シンポジウム)
- 頑健なパラメタ推定のためのAggregated EM法の提案と評価(特徴量・音響モデル,第9回音声言語シンポジウム)
- Spoken Term Detection のためのテストコレクション構築とベースライン評価
- SIG-SLP/SIG-NL合同セッションここまでできるぞ音声/言語処理技術 : 音声編
- ここまでできるぞ音声/言語処理技術 : 音声編
- 音声会話コンテンツにおける聴衆の反応に基づいたホットスポットの抽出
- 2群対判別法における対の組合せの選択手順
- 文化と言語の維持保存に貢献するためのデジタル博物館の試み : トランスクリプションデータを流用する字幕映像生成システムの提案
- 講義音声認識に基づくノートテイクシステム(福祉と音声処理,一般)
- 音声ドキュメント検索評価のためのテストコレクションの試作(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 連続音声認識コンソーシアムの活動報告及び最終版ソフトウエアの概要(第5回音声言語シンポジウム : プロジェクト紹介(2))
- 連続音声認識コンソーシアムの活動報告及び最終版ソフトウエアの概要(第5回音声言語シンポジウム : プロジェクト紹介(2))
- 局所的な係り受けの情報を用いた話し言葉の節・文境界の推定
- 日本語ディクテーション基本ソフトウェア(99年度版)
- 日本語ディクテーション基本ソフトウェア : 98年度版
- 日本語ディクテーション基本ソフトウェア(97年度版)
- 統計的言語モデル変換を用いた音響モデルの準教師つき学習
- 会議録作成支援のための国会審議の音声認識システム(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 会議録作成支援のための国会審議の音声認識システム(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 会議録作成支援のための国会審議の音声認識システム(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 音声対話に基づく知的情報検索システム
- 音声中の検索語検出のためのテストコレクション構築 -中間報告-
- 音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング(大語彙音声認識)(第6回音声言語シンポジウム)
- 大語彙日本語連続音声認識研究基盤の整備 : 学習・評価テキストコーパスの作成
- 音声認識器の尤度を用いた残響抑圧パラメータの教師なし最適化(認識)
- 2ZN-1 ポスター会話中の音リアクションイベントに基づくホットスポットの抽出(情報爆発時代における対話インタラクション,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- Automatic Speech Recognition and Understanding Workshop(ASRU99)
- 音声操作プロジェクタ(音声処理技術のデモの紹介)
- ESCA IDS'99(Interactive Dialogue in Multi-Modal Systems)ワークショップ報告
- 生涯ディジタルパートナー : 連想型個人情報管理システム
- パネル討論対象とした音声認識のためのトリガー言語モデルの適応
- 日本語対話処理研究に必要なもの
- 話題同定に基づく言語モデル切替えによる対話音声認識
- 述語項の類似度に基づく情報抽出・推薦を行う音声対話システム
- 音声会話コンテンツにおける聴衆の反応に基づく音響イベントとホットスポットの検出
- 2000-SLP-32-6 音声認識技術の今後の10年について : 予測調査
- 素性頻度ファイルと部分的アノテーションコーパスからの単語分割器の学習
- ウエーブレットパケット分解による残響に頑健な音声認識
- 2000-SLP-32-14 ICASSP2000に見る世界の研究動向
- ポスター会話におけるパラ言語・非言語情報を用いた話者交替及び次話者の予測 (一般セッションと「法と社会のインタフェース」関する特別セッション)
- 講演音声の印象評定と韻律的特徴との関係
- 話題の追跡 国会審議の会議録作成支援のための音声認識システム
- 議会の会議録作成のための音声認識-衆議院のシステムの概要-
- 識別学習に基づく音声認識単語辞書の最適化の評価(言語モデル・辞書,第13回音声言語シンポジウム)
- 識別学習に基づく音声認識単語辞書の最適化の評価(言語モデル・辞書,第13回音声言語シンポジウム)
- 会議音声認識におけるBICに基づく高速な話者正規化と話者適応(音声,聴覚)
- 予稿の話し言葉変換に基づく言語モデルによる講演音声認識(言語モデル・辞書,第13回音声言語シンポジウム)
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 点予測による述語項構造解析
- 点予測による述語項構造解析
- 音声ドキュメント処理ワーキンググループ活動報告
- 4. 音声認識技術を用いた講演・講義への字幕付与(教育におけるICTと映像情報の活用)
- 音声ドキュメント処理ワーキンググループ活動報告
- 2012年度論文賞の受賞論文紹介:コンテンツの解析からインタラクションの解析へ
- ポスター会話における聴衆のマルチモーダルな振る舞いに基づく興味・理解度の推定
- 音声情報処理技術を用いた外国語学習支援(音声,聴覚)
- スマートポスターボード : ポスター会話のマルチモーダルなセンシングと認識(オーガナイズドセッション:マルチモーダル情報によるコミュニケーション環境理解,認識,理解,対話,一般)
- ロボットのための音声認識
- 音声言語情報処理研究会の20年-歴代主査による研究レビュー-