点予測と系列予測の2段階化による品詞推定の精度向上

概要

論文の詳細を見る
本論文では、点予測による形態素解析の推定結果に対して、品詞連接の傾向を用いた系列予測による品詞のリランキング手法を提案する。点予測とは、分類器の素性として対象とその周辺の文字列情報のみを用いる手法であり、この手法により高い分野適応性を実現している。しかし、点予測では品詞推定に有用な品詞連接の傾向を利用することができない。品詞連接の傾向は分野依存性が低いと考えられ、異なる分野で学習した品詞連接の傾向を利用できると考えられる。この品詞連接の傾向を用い、点予測の品詞推定結果に対してリランキングすることにより解析精度の向上を実現する。
2011-01-21

著者

森信介
京都大学学術情報メディアセンター
河原達也
京都大学学術情報メディアセンター
河原達也
京都大学情報学研究科
中田陽介
京都大学情報学研究科
Neubig Graham
京都大学情報学研究科
森信介
京都大学情報学研究科
Neubig Graham
Kyoto University School Of Informatics
河原達也
京都大学大学院情報学研究科

関連論文

擬似確率的単語分割コーパスによる言語モデルの改良
ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理技術の総合開発(総合報告)
会議録作成支援のための国会審議の音声認識システム (画像符号化・映像メディア処理レター特集)
音声理解を指向したベイズリスク最小化枠組みに基づく音声認識(音声,聴覚)
SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
オンライン変分ベイズ学習に基づくモデル比較を用いた音声区間検出(認識)
会議録作成支援のための国会審議の音声認識システム(音声,聴覚)
11.人にやさしい音声インタフェース(第2部:情報の高信頼蓄積・検索技術等の開発,学と産の連携による基盤ソフトウェアの先進的開発)
音声翻訳単位の推定における句読点情報の効果(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
音声対話技術コンソーシアム(ISTC)の活動成果報告(SIG-SLP内組織の活動報告)
講義音声認識に基づくノートテイクシステム(福祉と音声処理,一般)
話し言葉における引用節・挿入節の自動認定および係り受け解析への応用
音声翻訳単位の推定における句読点情報の効果(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
音声翻訳単位の推定における句読点情報の効果(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
点予測と系列予測の2段階化による品詞推定の精度向上
点予測と系列予測の2段階化による品詞推定の精度向上
ウエーブレットの最適化と雑音プロファイルを用いた雑音抑圧による頑健な音声認識
SuperHマイコンへの搭載を目的とした連続音声認識ソフトウェアJuliusの計算量削減
頑健な音声認識のためのウエーブレットパラメータの最適化に基づく残響抑圧
音声認識のための言語処理 : 何が足りないか?(言語モデル)
「ユビキタスアプリケーションを支えるツールキット」(全4回) : 第3回 Julius を用いた音声認識インタフェースの作成
Webからの情報抽出を用いた音声対話システム
文脈を考慮した確率的モデルによる話し言葉の整形
重み付き有限状態トランスデューサーと対数線形モデルを用いた話し言葉の整形
国会音声認識システムの音響・言語モデルの半自動更新
NTCIR-9 SpokenDoc: 音声検索語検出と音声ドキュメント検索の評価枠組の設計
SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
頑健な音声認識のためのウエーブレットパラメータの最適化に基づく残響抑圧
文化と言語の維持保存に貢献するためのデジタル博物館の試みトランスクリプションデータを流用する字幕映像生成システムの提案
点予測による形態素解析
文化と言語の維持保存に貢献するためのデジタル博物館の試みトランスクリプションデータを流用する字幕映像生成システムの提案
Spoken Term Detectionのためのテストコレクション構築とベースライン評価
Spoken Term Detectionのためのテストコレクション構築とベースライン評価
会議音声認識におけるBICに基づく高速な話者正規化と話者適応
ベイズ推論を用いた連続音声からの言語モデル学習
スライド情報を用いた言語モデル適応による講義音声認識
音声会話コンテンツにおける聴衆の反応に基づいたホットスポットの抽出
ウイグル語の形態素に基づく言語モデルと音声認識システム
頑健なパラメタ推定のためのAggregated EM法の提案と評価(特徴量・音響モデル,第9回音声言語シンポジウム)
頑健なパラメタ推定のためのAggregated EM法の提案と評価(特徴量・音響モデル,第9回音声言語シンポジウム)
音声会話コンテンツにおける聴衆の反応に基づいたホットスポットの抽出
3種類の辞書による自動単語分割の精度向上
文化と言語の維持保存に貢献するためのデジタル博物館の試み : トランスクリプションデータを流用する字幕映像生成システムの提案
音声とテキストを用いた認識単語辞書の自動構築
講義音声認識に基づくノートテイクシステム(福祉と音声処理,一般)
連続音声認識コンソーシアムの活動報告及び最終版ソフトウエアの概要(第5回音声言語シンポジウム : プロジェクト紹介(2))
連続音声認識コンソーシアムの活動報告及び最終版ソフトウエアの概要(第5回音声言語シンポジウム : プロジェクト紹介(2))
局所的な係り受けの情報を用いた話し言葉の節・文境界の推定
統計的言語モデル変換を用いた音響モデルの準教師つき学習
会議録作成支援のための国会審議の音声認識システム(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
会議録作成支援のための国会審議の音声認識システム(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
会議録作成支援のための国会審議の音声認識システム(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング(大語彙音声認識)(第6回音声言語シンポジウム)
音声認識器の尤度を用いた残響抑圧パラメータの教師なし最適化(認識)
2ZN-1 ポスター会話中の音リアクションイベントに基づくホットスポットの抽出(情報爆発時代における対話インタラクション,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
4.対話を通じてユーザの意図・興味を探り情報検索・提示する情報コンシェルジェ(パートI:情報爆発時代における新しい基盤技術,情報爆発時代におけるわくわくするITの創出を目指して)
音声対話システムにおける物体指示のための信念ネットワークを用いた曖昧性の解消
言語モデルと発音辞書の統計的話し言葉変換に基づく国会音声認識(音声認識・識別,第9回音声言語シンポジウム)
言語モデルと発音辞書の統計的話し言葉変換に基づく国会音声認識(音声認識・識別,第9回音声言語シンポジウム)
言語モデルと発音辞書の統計的話し言葉変換に基づく国会音声認識(音声認識・識別,第9回音声言語シンポジウム)
大学講義のノートテイク支援のための音声認識用言語モデルの適応(言語モデル)
統計的機械翻訳の枠組みに基づく言語モデルの話し言葉スタイルへの変換(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
統計的機械翻訳の枠組みに基づく言語モデルの話し言葉スタイルへの変換(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
統計的機械翻訳の枠組みに基づく言語モデルの話し言葉スタイルへの変換(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
Web からの情報抽出を用いた音声対話システム
Webからの情報抽出を用いた対話システムの評価
自動獲得した未知語の読み・文脈情報による仮名漢字変換
頑健なパラメタ推定のためのAggregated EM法の提案と評価(特徴量・音響モデル,第9回音声言語シンポジウム)
統計的言語モデル変換を用いた音響モデルの準教師付き学習(音声,聴覚)
効率的なクロスバリデーションに基づく混合ガウス分布の最適化法とその拡張(音響モデル)
効率的なクロスバリデーション尤度評価に基づく混合ガウス分布の最適化(音響・音韻モデル)
述語項の類似度に基づく情報推薦を行う音声対話システム
ウエーブレットに基づくウイナーフィルタを用いた雑音及び残響に頑健な音声認識
識別学習に基づく音声認識単語辞書の最適化
講演に対する読点の複数アノテーションに基づく自動挿入
部分的アノテーションから学習可能な係り受け解析器
部分的アノテーションから学習可能な係り受け解析器
テキストと音声を用いた単語と読みの自動獲得
テキストと音声を用いた単語と読みの自動獲得(単語辞書・発音モデル)
Web時代の音声・言語技術
点予測による自動単語分割
確率的タグ付与コーパスからの言語モデル構築
3種類の辞書による自動単語分割の精度向上
信頼度基準デコーディングを用いた高効率な単語グラフ生成法
連続音声認識ソフトウェアJulius(研究のツールボックス(2))
音声対話システムにおける簡略表現認識のための自動語彙拡張
述語項の類似度に基づく情報抽出・推薦を行う音声対話システム
音声会話コンテンツにおける聴衆の反応に基づく音響イベントとホットスポットの検出
BICに基づく統計的話者モデル選択による教師なし話者インデキシング(音声,聴覚)
BICに基づく話者モデル選択の教師なし話者インデキシングにおける評価(福祉と音声処理及び一般)(音声)
BICに基づく話者モデル選択の教師なし話者インデキシングにおける評価(福祉と音声処理及び一般)
音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング(大語彙音声認識)(第6回音声言語シンポジウム)
点予測による形態素解析
素性頻度ファイルと部分的アノテーションコーパスからの単語分割器の学習
自然言語処理における分野適応(知識の転移)
方言対訳コーパスを用いた日本語方言音声認識システム (音声・第14回音声言語シンポジウム)
自然言語処理における分野適応
IwaCamを用いたメディア処理による遠隔コミュニケーションの支援 : 同時調理を題材とした映像と音声の役割に関する考察(調理支援,データ工学と食メディア)
レシピテキストからのフローグラフコーパス作成(データ工学と食メディア)

点予測と系列予測の2段階化による品詞推定の精度向上

スポンサーリンク

概要

著者

関連論文

スポンサーリンク