初等中等教育における授業音声認識のための言語モデルの検討(一般セッション,福祉と音声処理,一般)
スポンサーリンク
概要
- 論文の詳細を見る
初等中等教育における授業音声の音声認識の研究を行う.これまでの講義の音声認識は主に大学などの高等教育における学習支援を対象として行われており,初等中等教育を対象としたものはほとんど行われていなかった.初等中等教育でも初期段階,すなわち小学校授業の学習・教育支援は社会的意義が大きく重要である.小学校授業での発話は,児童向けの発話であるため,言いまわしおよび使用される語彙において大学の講義などの成人向けの発話と大きく異なる.このため本研究では,小学校授業の音声認識用の言語モデルの検討を行った.13件の授業音声の分析を行ったところ,よびかけに関する発話が27.7%と多く存在することを確認した.大人向けのテキストコーパス(日本語話し言葉コーパスおよび新聞記事1年分)で単語3-gram言語モデルを学習しても,カバーできない単語3-gramがテストデータのおよそ半数,3000種類存在することがわかり,補正パープレキシティも340程度と大きいことがわかった.小学生向けのWEBサイトから(約1.2M単語)を用いて言語モデルを学習したところ,大人向けテキストでカバーできなかった3-gramの3000種類のうち,1000種類をカバーできることがわかった.さらに,CSJと併用して言語モデルを学習することで,大人向け新聞記事1年分で学習した言語モデルとほぼ同程度のテストセットパープレキシティを得ることができた.子ども向けWEBサイトから小学校授業の言語モデルを学習する重要性を確認した.
- 2011-09-29
著者
関連論文
- 音声理解を指向したベイズリスク最小化枠組みに基づく音声認識(音声,聴覚)
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(第8回音声言語シンポジウム)
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 音声理解を指向した音声認識のための単語重要度の自動推定(学生セッション II)
- 音声ドキュメント検索評価のためのテストコレクションの試作(第8回音声言語シンポジウム)
- 音声ドキュメント検索評価のためのテストコレクションの試作(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 外国語学習・教育支援を目的とした学習者発話動画の自動字幕付与システムの検討(音声・言語・音響教育,一般)
- 統計的前編集のための対訳コーパスからの学習データの自動生成
- 日本語講演音声ドキュメント検索における索引付けの検討
- NTCIR-9 SpokenDoc: 音声検索語検出と音声ドキュメント検索の評価枠組の設計
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 日本語講演音声ドキュメント検索における索引付けの検討
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- 最適フロアリング係数を用いた反復スペクトルサブトラクションによるミュージカルノイズの低減(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 最適フロアリング係数を用いた反復スペクトルサブトラクションによるミュージカルノイズの低減(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 最適フロアリング係数を用いた反復スペクトルサブトラクションによるミュージカルノイズの低減(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 広域文書類似度と局所文書類似度を用いた講演音声ドキュメント検索
- 広域文書類似度と局所文書類似度を用いた講演音声ドキュメント検索
- 5U-4 会議の情報保障における吹き出し型字幕の有用性の調査(音声インタフェース・システム,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 多言語音声の同時認識枠組みの提案
- 音声ドキュメント検索評価のためのテストコレクションの試作(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 統計的前編集のための対訳コーパスからの学習データの自動生成 (音声)
- 統計的前編集のための対訳コーパスからの学習データの自動生成 (言語理解とコミュニケーション)
- 音声中の検索語検出のためのテストコレクション構築 -中間報告-
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出
- 音声による大規模知識ベース検索のための単語重要度を考慮したベイズリスク最小化デコーディング
- 音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング(大語彙音声認識)(第6回音声言語シンポジウム)
- E-002 高フロアリング係数を用いた反復スペクトルサブトラクションによるミュージカルノイズの低減の検討(E分野:自然言語・音声・音楽,一般論文)
- 4W-5 複数の機械翻訳器による学習データの自動生成とそれに基づく統計的前編集(機械翻訳,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 5U-3 音響防犯システムのためのSVMを用いた叫び声の検出と音声認識(音声インタフェース・システム,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 3U-3 多言語音声の同時認識のための統計的翻訳モデル(音声認識・理解,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 機械翻訳のための統計的手法に基づく前編集
- 機械翻訳のための統計的手法に基づく前編集
- 談話標識の統計的選択に基づいたCSJの講演からの重要文抽出(言語モデル・要約)(第5回音声言語シンポジウム)
- 会議の情報保障を目的とした吹き出し型字幕提示方式の検討(システム)
- 音声理解を指向した音声認識のための単語重要度の自動推定(学生セッション II)
- 国際会議・ニュースのアーカイブのための統計的機械翻訳を利用した音声認識の検討
- D-14-8 ベイズリスク最小化音声認識に基づく大学情報検索システムの構築(D-14.音声,一般セッション)
- 音声入力型大学情報検索システムに対するベイズリスク最小化音声認識の適用
- 音声入力型大学情報検索システムに対するベイズリスク最小化音声認識の適用
- 不便な旅もよいのでは(ちょっとしたエッセイ,コーヒーブレーク)
- 講演の書き起こしに対する統計的手法を用いた文体の整形
- ドキュメント翻訳のための統計的手法に基づく原言語文の自動変換
- 音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング(大語彙音声認識)(第6回音声言語シンポジウム)
- 音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング(大語彙音声認識)(第6回音声言語シンポジウム)
- 講演音声認識のための教師なし言語モデル適応と発話速度に適応したデコーディング(音声,聴覚)
- 初等中等教育における授業音声認識のための言語モデルの検討(一般セッション,福祉と音声処理,一般)
- 初等中等教育における授業音声認識のための言語モデルの検討(一般セッション,福祉と音声処理,一般)
- クラウド時代の新しい音声研究パラダイム
- 機械翻訳の品質向上のための対訳コーパスからの統計的前編集システムの自動構築
- 広域文書類似度と局所文書類似度を用いた講演音声ドキュメント検索
- 多言語音声の同時認識システムにおける翻訳モデルとスコア計算の高速化
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 音声入力型情報検索におけるベイズリスク最小化音声認識のための単語重要度の自動推定
- 雑音下音声受音におけるWeighted反復スペクトル減算法を用いたミュージカルノイズの低減(音声,聴覚,学生論文)
- K-051 英文読解能力測定モデルへの熟語難易度の導入(教育工学(3),K分野:教育工学・福祉工学・マルチメディア応用)
- K-052 英語学習支援のための聴解コーパスの有効性の検証(教育工学(3),K分野:教育工学・福祉工学・マルチメディア応用)
- 音声入力による音声ドキュメント検索における単語重要度を考慮したベイズリスク最小化音声認識
- K-053 英文読解速度テストに用いたテキストの難易度を考慮したテスト有効性の検証(教育工学(3),K分野:教育工学・福祉工学・マルチメディア応用)
- オープンソース音声認識エンジンJuliusへのベイズリスク最小化機能の実装と評価(音声,聴覚,システム開発論文)
- 講演音声ドキュメント検索のための擬似適合性フィードバック
- 雑音下音声受音における Weighted 反復スペクトル減算法を用いたミュージカルノイズの低減
- 雑音環境下における叫び声検出のための特徴量次元数の削減(学生ポスターセッション,時系列パターン認識,一般)