素性頻度ファイルと部分的アノテーションコーパスからの単語分割器の学習

概要

論文の詳細を見る
本論文では、素性頻度ファイルと部分的アノテーションコーパスを用いて単語分割器を学習する枠組みについて提案する。一般分野のコーパスから作成した素性頻度ファイルを参照すると、そのコーパスを直接参照しているかのように単語分割器を再学習することが可能である。また、部分的アノテーションコーパスの作成により、低い人的コストで高い分野適応性を実現できる。提案する枠組みを用いて分野適応を行った結果、単語分割の精度が改善されることを確認した。
2012-07-19

著者

河原達也
京都大学
森信介
京都大学学術情報メディアセンター
河原達也
京都大学学術情報メディアセンター
河原達也
京都大学工学部
河原達也
Academic Center for Computing and Media Studies, Kyoto University, Japan.
Graham Neubig
京都大学情報学研究科
河原達也
京大・情報学
笹田鉄郎
京都大学情報学研究科
河原達也
京都大学大学院情報学研究科
Graham Neubig
奈良先端科学技術大学院大学
笹田鉄郎
京都大学学術情報メディアセンター
河原達也
京都大学学術情報メディアセンター

関連論文

擬似確率的単語分割コーパスによる言語モデルの改良
ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理技術の総合開発(総合報告)
ロボットのための音声認識
会議録作成支援のための国会審議の音声認識システム (画像符号化・映像メディア処理レター特集)
音声理解を指向したベイズリスク最小化枠組みに基づく音声認識(音声,聴覚)
SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
オンライン変分ベイズ学習に基づくモデル比較を用いた音声区間検出(認識)
会議録作成支援のための国会審議の音声認識システム(音声,聴覚)
11.人にやさしい音声インタフェース(第2部:情報の高信頼蓄積・検索技術等の開発,学と産の連携による基盤ソフトウェアの先進的開発)
音声翻訳単位の推定における句読点情報の効果(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
音声対話技術コンソーシアム(ISTC)の活動成果報告(SIG-SLP内組織の活動報告)
音声ドキュメント検索評価のためのテストコレクションの試作(第8回音声言語シンポジウム)
音声ドキュメント検索評価のためのテストコレクションの試作(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
講義音声認識に基づくノートテイクシステム(福祉と音声処理,一般)
話し言葉における引用節・挿入節の自動認定および係り受け解析への応用
音声翻訳単位の推定における句読点情報の効果(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
音声翻訳単位の推定における句読点情報の効果(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
点予測と系列予測の2段階化による品詞推定の精度向上
点予測と系列予測の2段階化による品詞推定の精度向上
ウエーブレットの最適化と雑音プロファイルを用いた雑音抑圧による頑健な音声認識
SuperHマイコンへの搭載を目的とした連続音声認識ソフトウェアJuliusの計算量削減
音声認識のための言語処理 : 何が足りないか?(言語モデル)
「ユビキタスアプリケーションを支えるツールキット」(全4回) : 第3回 Julius を用いた音声認識インタフェースの作成
Spoken Term Detection のためのテストコレクション構築とベースライン評価
文脈を考慮した確率的モデルによる話し言葉の整形
重み付き有限状態トランスデューサーと対数線形モデルを用いた話し言葉の整形
NTCIR-9 SpokenDoc: 音声検索語検出と音声ドキュメント検索の評価枠組の設計
音声中の検索語検出のためのテストコレクション構築 : 中間報告
SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
点予測による形態素解析
Spoken Term Detectionのためのテストコレクション構築とベースライン評価
Spoken Term Detectionのためのテストコレクション構築とベースライン評価
ベイズ推論を用いた連続音声からの言語モデル学習
ウイグル語の形態素に基づく言語モデルと音声認識システム
Spoken Term Detection のためのテストコレクション構築とベースライン評価
SIG-SLP/SIG-NL合同セッションここまでできるぞ音声/言語処理技術 : 音声編
ここまでできるぞ音声/言語処理技術 : 音声編
3種類の辞書による自動単語分割の精度向上
2群対判別法における対の組合せの選択手順
音声とテキストを用いた認識単語辞書の自動構築
講義音声認識に基づくノートテイクシステム(福祉と音声処理,一般)
音声ドキュメント検索評価のためのテストコレクションの試作(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
日本語ディクテーション基本ソフトウェア(99年度版)
日本語ディクテーション基本ソフトウェア : 98年度版
日本語ディクテーション基本ソフトウェア(97年度版)
音声対話に基づく知的情報検索システム
音声中の検索語検出のためのテストコレクション構築 -中間報告-
大語彙日本語連続音声認識研究基盤の整備 : 学習・評価テキストコーパスの作成
大学講義のノートテイク支援のための音声認識用言語モデルの適応(言語モデル)
Automatic Speech Recognition and Understanding Workshop(ASRU99)
音声操作プロジェクタ(音声処理技術のデモの紹介)
ESCA IDS'99(Interactive Dialogue in Multi-Modal Systems)ワークショップ報告
生涯ディジタルパートナー : 連想型個人情報管理システム
自動獲得した未知語の読み・文脈情報による仮名漢字変換
述語項の類似度に基づく情報推薦を行う音声対話システム
部分的アノテーションから学習可能な係り受け解析器
部分的アノテーションから学習可能な係り受け解析器
テキストと音声を用いた単語と読みの自動獲得
テキストと音声を用いた単語と読みの自動獲得(単語辞書・発音モデル)
パネル討論対象とした音声認識のためのトリガー言語モデルの適応
日本語対話処理研究に必要なもの
話題同定に基づく言語モデル切替えによる対話音声認識
点予測による自動単語分割
確率的タグ付与コーパスからの言語モデル構築
3種類の辞書による自動単語分割の精度向上
音声対話システムにおける簡略表現認識のための自動語彙拡張
述語項の類似度に基づく情報抽出・推薦を行う音声対話システム
音声会話コンテンツにおける聴衆の反応に基づく音響イベントとホットスポットの検出
点予測による形態素解析
2000-SLP-32-6 音声認識技術の今後の10年について : 予測調査
素性頻度ファイルと部分的アノテーションコーパスからの単語分割器の学習
ウエーブレットパケット分解による残響に頑健な音声認識
2000-SLP-32-14 ICASSP2000に見る世界の研究動向
ポスター会話におけるパラ言語・非言語情報を用いた話者交替及び次話者の予測 (一般セッションと「法と社会のインタフェース」関する特別セッション)
講演音声の印象評定と韻律的特徴との関係
話題の追跡国会審議の会議録作成支援のための音声認識システム
議会の会議録作成のための音声認識-衆議院のシステムの概要-
識別学習に基づく音声認識単語辞書の最適化の評価(言語モデル・辞書,第13回音声言語シンポジウム)
識別学習に基づく音声認識単語辞書の最適化の評価(言語モデル・辞書,第13回音声言語シンポジウム)
自然言語処理における分野適応(知識の転移)
会議音声認識におけるBICに基づく高速な話者正規化と話者適応(音声,聴覚)
予稿の話し言葉変換に基づく言語モデルによる講演音声認識(言語モデル・辞書,第13回音声言語シンポジウム)
音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
点予測による述語項構造解析
点予測による述語項構造解析
方言対訳コーパスを用いた日本語方言音声認識システム (音声・第14回音声言語シンポジウム)
音声ドキュメント処理ワーキンググループ活動報告
自然言語処理における分野適応
4. 音声認識技術を用いた講演・講義への字幕付与(教育におけるICTと映像情報の活用)
音声ドキュメント処理ワーキンググループ活動報告
2012年度論文賞の受賞論文紹介:コンテンツの解析からインタラクションの解析へ
ポスター会話における聴衆のマルチモーダルな振る舞いに基づく興味・理解度の推定
IwaCamを用いたメディア処理による遠隔コミュニケーションの支援 : 同時調理を題材とした映像と音声の役割に関する考察(調理支援,データ工学と食メディア)
音声情報処理技術を用いた外国語学習支援(音声,聴覚)
スマートポスターボード : ポスター会話のマルチモーダルなセンシングと認識(オーガナイズドセッション:マルチモーダル情報によるコミュニケーション環境理解,認識,理解,対話,一般)
ロボットのための音声認識
音声言語情報処理研究会の20年-歴代主査による研究レビュー-
レシピテキストからのフローグラフコーパス作成(データ工学と食メディア)

素性頻度ファイルと部分的アノテーションコーパスからの単語分割器の学習

スポンサーリンク

概要

著者

関連論文

スポンサーリンク