議会の会議録作成のための音声認識-衆議院のシステムの概要-
スポンサーリンク
概要
- 論文の詳細を見る
衆議院で 2011 年度より運用されている音声認識を用いた会議録作成システムについて述べる。このシステムでは、原則すべての本会議・委員会の審議において、発言者のマイクから収録される音声を音声認識システムで書き起こし、会議録の原稿作成支援を行う。議会審議のような話し言葉音声に対して高い認識性能を実現するために、審議音声と会議録を "そのまま" 効果的に活用する枠組みを考案・実装した。これは、発言の忠実な書き起こしと編集された会議録テキストとの間の統計的な言語モデル変換に基づいている。この枠組みにより、忠実な書き起こしを作成することなく、音響モデルと言語モデルの学習を可能にし、長期的なモデルの半自動更新も可能にしている。運用後も含めて、 12 年分の会議録テキストと約 1000 時間の審議音声で音響・言語モデルを構築することにより、約 90% の文字正解率を実現した。本稿では、音声認識結果を編集するソフトウェア (エディタ) やシステムの運用に関しても述べる。
- 2012-10-19
著者
-
河原 達也
京都大学
-
河原 達也
京都大学工学部
-
河原 達也
Academic Center for Computing and Media Studies, Kyoto University, Japan.
-
河原 達也
京大・情報学
-
河原 達也
京都大学大学院情報学研究科
-
河原 達也
京都大学 学術情報メディアセンター
関連論文
- ロボットのための音声認識
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 音質の感性的評価のモデルの検討
- 11.人にやさしい音声インタフェース(第2部:情報の高信頼蓄積・検索技術等の開発,学と産の連携による基盤ソフトウェアの先進的開発)
- 音声対話技術コンソーシアム(ISTC)の活動成果報告(SIG-SLP内組織の活動報告)
- 2群対判別法による不特定話者日本語単音節中の子音の識別
- 音声ドキュメント検索評価のためのテストコレクションの試作(第8回音声言語シンポジウム)
- 音声ドキュメント検索評価のためのテストコレクションの試作(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 会話音声中の単語スポッティングのための音語モデルの検討
- スロットベースのベクトル空間モデルの組合せによる音声書籍検索
- 「ユビキタスアプリケーションを支えるツールキット」(全4回) : 第3回 Julius を用いた音声認識インタフェースの作成
- Spoken Term Detection のためのテストコレクション構築とベースライン評価
- NTCIR-9 SpokenDoc: 音声検索語検出と音声ドキュメント検索の評価枠組の設計
- 音声中の検索語検出のためのテストコレクション構築 : 中間報告
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- Spoken Term Detection のためのテストコレクション構築とベースライン評価
- SIG-SLP/SIG-NL合同セッションここまでできるぞ音声/言語処理技術 : 音声編
- ここまでできるぞ音声/言語処理技術 : 音声編
- 2群対判別法における対の組合せの選択手順
- 音声ドキュメント検索評価のためのテストコレクションの試作(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 調音位置・調音方式の識別に基づく発音学習支援システム
- 日本語ディクテーション基本ソフトウェア(99年度版)
- 日本語ディクテーション基本ソフトウェア : 98年度版
- 日本語ディクテーション基本ソフトウェア(97年度版)
- 単語対制約をヒューリスティックとするA^*探索に基づく会話音声認識
- パネル討論音声の話者と話題に関する自動インデキシングの検討
- 音声対話に基づく知的情報検索システム
- F0パターンに基づく講義音声の文単位へのセグメンテーション
- 音声中の検索語検出のためのテストコレクション構築 -中間報告-
- 大語彙日本語連続音声認識研究基盤の整備 : 学習・評価テキストコーパスの作成
- Automatic Speech Recognition and Understanding Workshop(ASRU99)
- 音声操作プロジェクタ(音声処理技術のデモの紹介)
- ESCA IDS'99(Interactive Dialogue in Multi-Modal Systems)ワークショップ報告
- Murray Hillにて思うこと
- 生涯ディジタルパートナー : 連想型個人情報管理システム
- キーフレーズの検出と検証の組合せによる柔軟な音声理解
- キーフレーズの検出と検証の組合せによる柔軟な音声理解
- 概念階層構造を持つネットワークを用いた漸進的音声言語理解
- 会話音声認識における探索へのネットワークによる意味制約の利用
- 会話スタイル依存の言語モデルを用いたキーフレーズの検出・検証
- 会話スタイル依存の言語モデルを用いたキーフレーズの検出・検証
- 会話スタイル依存の言語モデルを用いたキーフレーズの検出・検証
- 発話検証用モデルを用いた音声操作プロジェクタ
- 最大事後確率推定によるN-gram言語モデルのタスク適応
- MAP推定によるN-gram言語モデル
- MAP推定を用いたN-gram言語モデルのタスク適応
- ヒューリスティックな言語モデルを用いた会話音声中の単語スポッティング
- 意味主導型パーサによる自由発話の解析
- 述語項の類似度に基づく情報推薦を行う音声対話システム
- ウエーブレットに基づくウイナーフィルタを用いた雑音及び残響に頑健な音声認識
- 構文主義A^*探索による音声認識における未知語の処理
- パネル討論対象とした音声認識のためのトリガー言語モデルの適応
- 日本語対話処理研究に必要なもの
- 話題同定に基づく言語モデル切替えによる対話音声認識
- A^*探索に基づいたフレーズスポッティングによる頑健な音声理解
- フレーズスポッティングに基づく頑健な音声理解
- 自由発話認識・理解のためのフレーズスポッティング
- マルチテンプレートを用いた対判別組合せ法による男女話者音素認識
- ポスター発表における質問者と質問の種類の推定のためのマルチモーダルな聞き手行動分析
- 単語の共起情報を用いたニュース朗読音声の話題同定機構
- キーワードスポッティングに基づくニュース音声の話題同定
- 声質の感性的評価の処理モデル
- 顔画像特徴, 歩行画像特徴および音声特徴の統合による個人識別
- 述語項の類似度に基づく情報抽出・推薦を行う音声対話システム
- 音声会話コンテンツにおける聴衆の反応に基づく音響イベントとホットスポットの検出
- 音声理解のための統計的フレーズ言語モデルの自動構築
- 点予測による形態素解析
- 情報コンシェルジェ : Mind Probingに基づくマルチモーダルインタラクションシステム(「コミュニケーションと気づき」及び一般)
- 2000-SLP-32-6 音声認識技術の今後の10年について : 予測調査
- 素性頻度ファイルと部分的アノテーションコーパスからの単語分割器の学習
- ウエーブレットパケット分解による残響に頑健な音声認識
- 2000-SLP-32-14 ICASSP2000に見る世界の研究動向
- ポスター会話におけるパラ言語・非言語情報を用いた話者交替及び次話者の予測 (一般セッションと「法と社会のインタフェース」関する特別セッション)
- 講演音声の印象評定と韻律的特徴との関係
- 話題の追跡 国会審議の会議録作成支援のための音声認識システム
- 招待講演 スマートポスターボード : ポスター会話のマルチモーダルなセンシングと認識 (音声)
- 議会の会議録作成のための音声認識-衆議院のシステムの概要-
- 声質に関する印象評価および心理的類似性と音響的類似性について
- 識別学習に基づく音声認識単語辞書の最適化の評価(言語モデル・辞書,第13回音声言語シンポジウム)
- 識別学習に基づく音声認識単語辞書の最適化の評価(言語モデル・辞書,第13回音声言語シンポジウム)
- 会議音声認識におけるBICに基づく高速な話者正規化と話者適応(音声,聴覚)
- 予稿の話し言葉変換に基づく言語モデルによる講演音声認識(言語モデル・辞書,第13回音声言語シンポジウム)
- 予稿の話し言葉変換に基づく言語モデルによる講演音声認識(言語モデル・辞書,第13回音声言語シンポジウム)
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 点予測による述語項構造解析
- 点予測による述語項構造解析
- 音声ドキュメント処理ワーキンググループ活動報告
- 4. 音声認識技術を用いた講演・講義への字幕付与(教育におけるICTと映像情報の活用)
- 音声ドキュメント処理ワーキンググループ活動報告
- 2012年度論文賞の受賞論文紹介:コンテンツの解析からインタラクションの解析へ
- ポスター会話における聴衆のマルチモーダルな振る舞いに基づく興味・理解度の推定
- 音声情報処理技術を用いた外国語学習支援(音声,聴覚)
- スマートポスターボード : ポスター会話のマルチモーダルなセンシングと認識(オーガナイズドセッション:マルチモーダル情報によるコミュニケーション環境理解,認識,理解,対話,一般)
- ロボットのための音声認識
- 音声言語情報処理研究会の20年-歴代主査による研究レビュー-
- A^*探索に基づく大語彙連続音声認識