テキスト圧縮を用いた言語に依存しないテキストアート抽出法
スポンサーリンク
概要
- 論文の詳細を見る
我々はテキストデータ中のテキストアートを抽出する方法を提案してきた.その手法は,対象とするテキストで使用される自然言語に依存せず,テキストアートを抽出できる.それを実現するために,その手法は機械学習によって得られる決定木を用いる.本研究では,その機械学習に用いる属性として,テキストのデータ圧縮率に注目する.そして,2 つのデータ圧縮アルゴリズム Run Length Encoding と LZ77,従来から我々が用いてきた属性とを組み合わせて,テキストアートの抽出実験を行った.その結果,機械学習に Run Length Encoding を用いた抽出法は,テキストアートを削らずに抽出したい場合に有効であることを確認した.
- 一般社団法人情報処理学会の論文
- 2009-09-18
著者
関連論文
- 1P-2 大規模JSONファイルのデータ構造を保存した分割法(XMLと応用,学生セッション,データベースとメディア)
- 3S-4 巨大JSONデータの分割と参照方法(XMLと応用,学生セッション,データベースとメディア)
- 写真のジオコーディング支援に用いる遺伝的探索における近傍交叉の効果
- 写真のジオコーディング支援に用いる遺伝的探索における近傍交叉の効果
- 2P-3 テキストアートの言語に依存しない抽出法(Webマイニング,学生セッション,データベースとメディア)
- 風景写真の撮影地探索システムの開発(セッション1)
- 写真のジオコーディング支援に用いる遺伝的探索における近傍交叉の効果
- 撮影地探索システムにおける地理的位置を優先した探索手法
- 撮影地探索システムにおける地理的位置を優先した探索手法
- テキスト圧縮を用いた言語に依存しないテキストアート抽出法
- 3Q-5 テキストアートの言語に依存しない抽出法に用いる機械学習法の比較(情報抽出,学生セッション,データベースとメディア,情報処理学会創立50周年記念)
- 写真のジオコーディング支援に用いる遺伝的探索における近傍交叉の効果
- 撮影地探索システムにおける地理的位置を優先した探索手法
- 撮影地探索システムにおける地理的位置を優先した探索手法
- F-026 写真ジオコーディング支援のための二種類の緩和問題を用いる遺伝的探索(複雑系及び一般,F分野:人工知能・ゲーム)