WEB上の類似記事を利用した音声文書の認識性能の改善(Session-2 情報検索, 第7回音声言語シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
本稿では, 音声文書をインデキシング目的で音声認識する際に, WEB上の類似ニュース記事を利用し, それを汎用的な言語モデルの話題適応化に用いることにより言語モデルや認識辞書を構築し, 未知語に強固な音声認識を行う手法を提案する.また, タイプの異なる3種類の言語モデルを用い, その出力結果を多数決により組み合わせることで, 最終的な音声認識性能の改善を図っている.音声認識システムでは, 1) 新聞記事75ヶ月分より作成した語彙サイズ2万単語のモデル・辞書のみ, 2) そのモデルと類似記事群から学習したモデルを融合させた言語モデル・辞書を用いた場合, 3) 固有名詞をクラスとして学習した固有名詞クラス言語モデルを用いた場合, の3種類の言語モデルを使用する.それら3種類のそれぞれの認識結果から, 多数決法により最終的な認識結果を導き出す.提案手法により, 言語モデル・単語辞書に新聞から学習したモデルのみを用いた場合に比べ, 単語正解率が47.0%から47.8%へ, 単語正解精度は37.7%から39.5%へ, その中でも特に名詞の正解率は44.7%から, 46.4%へ.固有名詞の正解率は, 43.9%から56.1%へと大幅な精度の向上がみられた.
- 社団法人電子情報通信学会の論文
- 2005-12-14
著者
-
西崎 博光
山梨大学大学院医学工学総合研究部
-
関口 芳廣
山梨大学大学院医学工学総合研究部
-
伊藤 友裕
山梨大学大学院医学工学総合教育部
-
西崎 博光
山梨大学大学院医学工学総合教育部
-
関口 芳廣
山梨大学大学院医学工学総合教育部
関連論文
- 4Q-7 音声ドキュメント検索用テストコレクションにおける音節インデックスの効果(音声対話・音声要約,学生セッション,人工知能と認知科学)
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 音声対話システムにおけるタッチ情報を利用した現場指示詞の処理
- 使いやすいユーザインタフェースを備えた患者情報管理システム「聞き耳メアリー」 (システム開発論文特集)
- 使いやすいユーザインタフェースを備えた患者情報管理システム「聞き耳メアリー」(マルチモーダルシステム,システム開発論文)
- 複数音声認識システムを用いた音声中の検索語検出の検討 (音声)
- 検索対象と類似性の高いWebページを利用した音声ドキュメント検索の検討
- 音声ドキュメント検索評価のためのテストコレクションの試作(第8回音声言語シンポジウム)
- 音声ドキュメント検索評価のためのテストコレクションの試作(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- WEB上の類似記事を利用した音声文書の認識性能の改善(Session-2 情報検索, 第7回音声言語シンポジウム)
- Spoken Term Detection のためのテストコレクション構築とベースライン評価
- G_011 分散型対話管理による複数話者対話システムの構築(G分野:音声・音楽)
- G-012 複数話者対話システムのための分散型対話管理(G分野:音声・音楽)
- 教員の話し方改善支援システムの開発に向けた講義音声の特徴分析(学習・教育支援のための技術開発)
- NTCIR-9 SpokenDoc: 音声検索語検出と音声ドキュメント検索の評価枠組の設計
- 音声中の検索語検出のためのテストコレクション構築 : 中間報告
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- 日本語講義音声コンテンツコーパスの作成と分析
- 日本語講義音声コンテンツコーパスの構築と講義音声認識手法の検討
- 講義コンテンツの収集・分析および講義音声の認識手法に関する検討
- 対話ロボットのための話題外発話の聞き流し機構の構築
- Spoken Term Detection のためのテストコレクション構築とベースライン評価
- 複数音声認識システムを用いた音声中の検索語検出の検討(音声検索・要約,第11回音声言語シンポジウム)
- 複数音声認識システムを用いた音声中の検索語検出の検討
- 音声ドキュメント検索における Web ページを用いたドキュメント拡張の効果
- 音声ドキュメント検索における Web ページを用いたドキュメント拡張の効果
- 4Q-1 対話音声を対象とした母音の音響的特徴による話者分類(音声対話・音声要約,学生セッション,人工知能と認知科学)
- 講義音声認識のためのLSAを利用した語彙推定手法の検討
- E-024 話し言葉音声中のフィラー検出精度と音声認識率の関連性(自然言語・音声・音楽,一般論文)
- 3U-8 複数人と対話型ゲームができるシステム(音声言語情報処理,学生セッション,人工知能と認知科学)
- 3U-2 音響的特徴を利用した自動話者分類(音声言語情報処理,学生セッション,人工知能と認知科学)
- 講義音声認識のためのWEB文書を用いた言語モデルの適応化と語彙選択
- 音声対話機能を備えた音色識別学習支援システム(音声言語,情報処理技術のフロンティア)
- WEB上の類似記事を利用した音声文書の認識性能の改善(Session-2 情報検索, 第7回音声言語シンポジウム)
- WEB上の類似記事を利用した音声文書の認識性能の改善(Session-2 情報検索, 第7回音声言語シンポジウム)
- 音声ドキュメント検索評価のためのテストコレクションの試作(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- ニュース文の話題セグメンテーション
- ニュース文を対象とした話題の認識
- ニュース文を対象とした話題毎のセグメンテーション
- 音声中の検索語検出のためのテストコレクション構築 -中間報告-
- NTCIR-9 SpokenDoc--音声検索語検出と音声ドキュメント検索の評価枠組の設計 (音声)
- NTCIR-9 SpokenDoc--音声検索語検出と音声ドキュメント検索の評価枠組の設計 (言語理解とコミュニケーション)
- E-013 音声ドキュメント検索における分割したドキュメントを用いるWeb収集の効果(E分野:自然言語・音声・音楽,一般論文)
- 3U-5 タスクに無関係な発話を聞き流すための言語モデル構築法(音声認識・理解,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 3U-1 講義音声認識精度改善のためのチョーク音除去(音声認識・理解,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 1U-3 近傍雑音の除去による遠方発話の強調(音声分析・強調,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- RE-004 話題依存言語モデル構築のためのLSAと単語発音情報を用いた語彙推定(自然言語・音声・音楽,査読付き論文)
- RE-003 Webによるドキュメント拡張を利用した音声ドキュメント検索(自然言語・音声・音楽,査読付き論文)
- 音声ドキュメント検索における Web ページを用いたドキュメント拡張の効果
- 音声対話装置に対するユーザの否定発話の抽出と処理方法(音声言語)
- ビデオ装置を例とした家電品の音声対話機能について(マルチモーダル)(「インタラクション:理論,技術,応用,評価」)
- F-12 サンプリング周波数に依存しない話者方向識別(音声・音声言語情報処理,F.音声・音楽)
- E-3 要約文生成のための集合名詞の要素の抽出(要約・情報検索,E.自然言語・文書)
- 格構造を利用した対話中の否定対象の推定
- 対話文中の否定表現の分析とその理解方法
- テレビ制御用音声対話システム
- 対話文に現われる否定表現の分類とその理解
- 不特定話者連続音声認識のための規則による音素識別
- 音源インパルス応答モデルによる音声分析と合成に関する検討
- G-002 音声文書インデキシングのためのWEB文書を利用した自動誤り訂正(G.音声・音楽)
- E-029 国会会議録要約文生成のための文間の類似度計算(E.自然言語・文書・ゲーム)
- WEB文書を利用した音声認識誤りの訂正方法の検討(ポスターセッション)(第5回音声言語シンポジウム)
- WEB文書を利用した音声認識誤りの訂正方法の検討(第5回音声言語シンポジウム : ポスターセッション)
- WEB文書を利用した音声認識誤りの訂正方法の検討(第5回音声言語シンポジウム : ポスターセッション)
- WEB 文書を利用した音声認識誤りの訂正方法の検討
- ピッチ周期の不規則変動の特性と個人性の識別の試み
- 韻律情報を利用した連続音声中の隣接句間の修飾関係有無の判定
- 講義・講演音声自動評価のための音響・言語的分析
- 機械学習を用いた複数の大語彙連続音声認識モデルの出力の混合(音声,聴覚)
- 感性情報による小型モータの評価システム
- スケッチ画制御用音声対話システムにおける文脈情報の利用
- 音声認識のための連想辞書作成の一手法
- 音声対話システムにおける代名詞処理の試み
- 利用環境を考慮した音声対話システムの構築
- 意味属性を利用した音声認識のための連想情報について
- 話し言葉中の助詞の推定
- スケッチ画制御用音声対話システムの作成
- 音声ドキュメント内容検索のためのWEBを用いたドキュメント拡張
- 音声入力によるWeb検索のためのキーワード認識・抽出法の改善(認識・理解・対話)
- 音声入力によるWeb検索のためのキーワード認識・抽出法の改善(認識・理解・対話)
- 講演音声における認識結果の高信頼度部分の抽出とそれを用いた教師なし話者適応(第5回音声言語シンポジウム : 話者適応・識別)
- 講演音声における認識結果の高信頼度部分の抽出とそれを用いた教師なし話者適応(第5回音声言語シンポジウム : 話者適応・識別)
- 音声入力によるWeb検索のためのキーワード認識・抽出法の検討
- 「理系のための人生設計ガイド」, 講談社ブルーバックス, 坪田一男著(私のすすめるこの一冊,コーヒーブレーク)
- NTCIR-9総括と今後の展望
- NTCIR-9総括と今後の展望
- 聞き耳インタフェースを備えたメモ支援システム(一般セッション,福祉と音声処理,一般)
- 聞き耳インタフェースを備えたメモ支援システム(一般セッション,福祉と音声処理,一般)
- クラウド時代の新しい音声研究パラダイム
- ソーシャルメディア「Twitter」を利用した音声データ収集の試み (言語理解とコミュニケーション)
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- ソーシャルメディア「Twitter」を利用した音声データ収集の試み(第3回集合知シンポジウム)
- 講義で利用できる音声と画像を融合した電子ノート作成支援システムの開発
- ソーシャルメディア「Twitter」を利用した音声データ収集の試み
- 講義で利用できる音声と画像を融合した電子ノート作成支援システムの開発
- 聞き耳メモリー : 音声認識結果を取捨選択して利用する電子メモ作成支援アプリケーション(ヒューマンコンピュータインタラクション,システム開発論文)