言語モデルの違いによるHMMを用いたテキストセグメンテーションの性能比較
スポンサーリンク
概要
- 論文の詳細を見る
HMMによるテキストセグメンテーションの問題について,HMMの状態が表す言語モデルを変化させることによる性能の変化を示す.一般にHMMでテキストをモデリングする場合,各状態は単語ユニグラムを言語モデルとして段落を表現する.これに対して本論文では,複数の単語をとりまとめて1つの出力記号とする手法を複数提案し,その性能の変化を考察する.評価実験の結果,1文を出力記号単位とし,単語がその文章に含まれるか否かを確率として持つナイーブな言語モデルが高い性能であることが明らかとなった.また提案手法は,本論文における設定よりも利用できる情報が多くなる教師あり学習の枠組みによるアルゴリズムの性能にはおよばないが,従来法である単語ユニグラムモデルを利用するHMMの性能を上回ることが確認された.
- 2013-03-12
著者
-
但馬 康宏
東京農工大学大学院工学府
-
但馬 康宏
電気通信大学電気通信学研究科電子情報学専攻
-
但馬 康宏
岡山県立大学情報システム工学科
-
但馬 康宏
岡山県立大学情報工学部情報システム工学科
-
但馬 康宏
岡山県立大学
関連論文
- 強化学習によるゲームの評価関数の獲得
- 系列パターンを利用した決定木による自然言語における選択ルール獲得(学習・系列解析・構文解析)
- SVMを用いたリズム感のモデル化とドラムパターンの自動生成(音楽生成)
- 枝分かれ同時確率モデルを用いた「AのB」の意味分類(語彙・意味)
- すご@ぷろ : 双六をモチーフとしたビジュアルプログラミング言語
- 特許明細書における多項請求項の自動構造化に関する研究(解析,分析)
- 構造解析を利用した機械学習による演奏表情の解析と付与(表情付け・分析)
- 枝分かれ同時確率モデルを用いた対象-属性-属性値関係の抽出(翻訳・要約・抽出)
- 枝分かれ同時確率モデルを用いた対象-属性-属性値関係の抽出 (情報学基礎・自然言語処理)
- HMMとテキスト分類器による対話の段落分割
- 発話を出力単位とするHMMによる対話に対する話題分割
- 発話を出力単位とするHMMによる対話に対する話題分割(対話)
- Web資源からの決定木学習によるWebページに対するキーワード付与
- 決定木学習による代名詞「自分」の照応解析(解析・言語資源)
- 5U-4 決定木学習を用いた人名情報抽出のための規則生成(情報抽出,学生セッション,人工知能と認知科学)
- 決定木を用いた中国語の疑問文の訳語選択ルールの生成(翻訳・多言語化)
- 線形言語のある部分言語族に対する質問を用いた確率的近似学習
- 先読みを教師とした兄弟局面の比較に基づく評価関数の学習(学習2 並列探索)
- 評価関数の強化学習における学習高速化手法(学習2 並列探索)
- 並列局面探索における待ち行列の負荷分散(学習2 並列探索)
- UCTアルゴリズムにおける確率的な試行回数削減方法
- 5X-4 隠れマルコフモデルを用いた変奏の伴う楽曲の自動生成(音楽情報科学(4)表情付け・認知,学生セッション,人工知能と認知科学)
- モンテカルロシミュレーションを用いた強化学習法の提案
- 枝分かれ同時確率モデルを用いた対象-属性-属性値関係の抽出(翻訳・要約・抽出)
- 枝分かれ同時確率モデルを用いた「AのB」の意味分類(語彙・意味)
- 決定木を用いた敬語の選択ルールの獲得
- 構造解析を利用した機械学習による演奏表情の解析と付与(表情付け・分析)
- IP Telephonyにおけるクライアント依存性を排除した多者間通話サービス(グループウェア)
- 強化学習による評価関数の獲得における報酬設定について
- 音高と音価の隠れマルコフモデルを用いた自動副旋律生成
- HMM とテキスト分類器による対話の段落分割
- Heptamond問題の全解数推定
- 勝率に近似させた評価関数の性能について
- 質問と正の反例による正則言語の多項式時間学習 (計算機科学の基礎理論 : 21世紀の計算パラダイムを目指して)
- 質問と初期情報による文法推論に関する一考察
- 構造反例付き等価性質問を用いた単純決定性言語の多項式時間MAT学習
- 単純決定性言語の質問による多項式時間学習について
- 単純決定性言語のある部分族に対する多項式時間MAT学習
- 構造反例付き等価性質問を用いた単純決定性言語の多項式時間MAT学習
- 引き分けの証明向きのGHI問題対処法とその3x4将棋への応用(知識処理)
- 制限のあるサンプル分布における文脈自由文法の学習可能性
- 単語の偏りを表すネットワークを用いたウェブページに対するキーワード付け(語と慣用句)
- ニューラルネットワークを用いた多人数対話での対話の繋がり抽出(翻訳,対話)
- 隠れマルコフモデルを用いた副旋律推定
- 質問と反例による単純決定性言語の多項式時間学習を可能とさせる十分条件
- 単純決定性言語の学習におけるサンプル分布のある制限と学習可能性
- 線形言語のある部分言語族に対する多項式時間PAC学習可能性
- 線形言語のある部分言語族に対する質問と特徴的なサンプルによる多項式時間学習アルゴリズム (計算機科学基礎理論の新展開)
- 単純決定性言語に対する質問による学習に関する研究(機械学習)(人工知能分野における博士論文)
- 深さに応じたバイアスによるモンテカルロ木探索の効率化
- 分割位置を教師値としたテキストの段落分割
- 文章の識別モデルを状態とするHMMによるテキストの段落分割
- 連続型HMMを用いたテキストセグメンテーション(基礎技術,自然言語処理)
- 連続型HMMを用いたテキストセグメンテーション(基礎技術,自然言語処理)
- D-5-11 Webニュースに対するコメントの感情推定(D-5.言語理解とコミュニケーション,一般セッション)
- 言語モデルの違いによるHMMを用いたテキストセグメンテーションの性能比較
- コンピュータ大貧民における高速な相手モデル作成と精度向上
- コンピュータ大貧民における高速な相手モデル作成と精度向上
- マイクロブログのインフォーマルな書き込みに対する自動分類