文字列相関パタンの分類精度最大化問題について
スポンサーリンク
概要
- 論文の詳細を見る
与えられた大量の文書の集積から, 分類精度を最大にする文字列パタンを見つける問題を考察する. 二つの文字列の近接した出現を要求する二語相関パタンを導入し, 分類精度を最大化する最適パタンをO(n^2) 時間および領域O(kn) 領域で計算するアルゴリズムを与える. また, 相関パターンの語数を制限しない場合, 分類精度の最大化問題が多項式時間での任意の近似が困難であることを示す.
- 社団法人電子情報通信学会の論文
- 1997-10-31
著者
-
有村 博紀
九州大学大学院システム情報科学研究科
-
下薗 真一
九州工業大学 情報工学部
-
有村 博紀
北海道大学大学院情報科学研究科コンピュータサイエンス専攻
-
渡木 厚
九州大学大学院システム情報科学研究科情報理学専攻
-
下薗 真一
九州工業大学知能情報工学科
-
下薗 真一
九州工業大学
関連論文
- 九州大学における一般情報処理教育支援システムについて
- 数値データからの意外な回帰結合ルールの発見
- BONSAI Garden:学習アルゴリズムによるアミノ酸配列からの並列知識獲得システム
- 滑走窓や忘却の概念を用いたオンライン型半構造データマイニングアルゴリズム
- 滑走窓や忘却の概念を用いたオンライン型半構造データマイニングアルゴリズム
- 半構造データマイニングのための部分構造パターンの効率的探索
- 断片パターンマッチングの計算量的困難性と近似アルゴリズムについて
- 極小多重汎化によるパタン和推論アルゴリズムの実験的評価
- 極小多重汎化による正則パタン推論アルゴリズムの実験的評価
- 文字列パターン照合のための損失のあるデータ圧縮
- BONSAI : 決定木とインデックス化による文字列からの機械発見システム
- Complexity of Finding Alphabet Indexing(Fundamental Studies on Computational Complexity)
- 表面実相ロボットの実相シーケンスの決定に対する巡回セールスマン問題のアルゴリズムの適用
- WWWからの情報抽出 : Webラッパーの自動構築(WWW上の情報の知的アクセスのためのテキスト処理)
- テキストマイニングにおける最適パターン発見
- テキストマイニングにおける最適パターン発見(データ・テキストマイニング)
- HTMLからのテキストの自動切り出しアルゴリズムと実装
- 楽譜検索のための幾何点列の近似パタン照合(文字列アルゴリズム)
- 1Y-8 重み付き分類規則による保健データからのデータマイニング(情報システムの分析・設計・評価,一般講演,コンピュータと人間社会)
- 分散記憶型並列計算機における大規模接尾辞配列の構築法
- テキストマイニングを用いたウェブデータからのキーワード獲得
- 分散記憶型並列計算機における大規模接尾辞配列の構築法
- HTMLからのテキストの自動切り出しアルゴリズムと実装
- テキストデータからの高速データマイニング : 探索的文書ブラウジングとウェブデータへの応用(発見科学)
- 1.「知識創出学」とは?(北の国から明日のICTに架ける橋,知の創出を支える次世代IT基盤技術-北海道大学グローバルCOEプログラムと北海道内情報通信系研究グループの活動-)
- 2.情報系異分野共同研究プロジェクト(北の国から明日のICTに架ける橋,知の創出を支える次世代IT基盤技術-北海道大学グローバルCOEプログラムと北海道内情報通信系研究グループの活動-)
- 生物配列の局所マルチプルアラインメントの計算困難性
- 大規模幾何データからの高速な極大部分グラフ発見 (特集 「ウェブマイニング」および一般)
- Efficient Discovery of Maximal Two-Dimensional Patterns with Don't-Cares(extended abstract) (テーマ:特集「ウェブデータの知的処理」および一般)
- ALT'96報告
- 半構造データマイニングにおけるパターン発見技法
- 大規模木構造データからの頻出部分構造パターン発見アルゴリズム(文字列アルゴリズム)
- 半構造データからの効率よい無順序木パターン発見手法(インターネット環境でのデータ工学とディペンダビィリティ及び一般)
- 半構造データからの効率よい無順序木パターン発見手法(インターネット環境でのデータ工学とディペンダビィリティ及び一般)
- 半構造データからの効率よい無順序木パターン発見手法
- 大規模木構造データからの高速な部分構造発見(「21世紀の知識情報科学に向けて」,及び一般)
- データストリーム処理のための効率良いXPath問合せ機構(セッション4A : 時空間データ・ストリーム)
- データストリーム処理のための効率良いXPath問合せ機構(時空間データ・ストリーム)(「夏のデータベースワークショップ(DBWS2003)」一般)
- K語近接相関パタンの高速発見アルゴリズム
- 最適パタン発見に基づくテキストデータマイニング : 大規模テキスト索引における高速な実装方式
- On Approximation Algorithms for Local Multiple Alignment (合同研究会"AIシンポジウム'99"(第10回))
- 文字列相関パタンの分類精度最大化問題について
- 省スペースな線形時間文法圧縮アルゴリズム
- DS-1-9 二次元点集合近似照合によるグラフの格子状配置アルゴリズム(DS-1. COMP-NHC学生シンポジウム,シンポジウムセッション)
- Minimum Multiset Covering 問題の近似アルゴリズムについて
- 平面巡回セールスマン問題の高速な近似アルゴリズム
- 無矛盾最小OBDD問題の近似困難性について
- データマイニング : ウェブデータからの知識発見を目指して
- 巨大テキストデータからの高速パタン発見
- 一階論理式の学習と帰納論理プログラミング (計算学習理論の進展と応用可能性)
- TK-7-1 知の創出を支える次世代IT基盤拠点(TK-7.情報・電気・電子グローバルCOEの活動と今後の計画,大会委員会企画)
- TK-7-1 知の創出を支える次世代IT基盤拠点(TK-7.情報・電気・電子グローバルCOEの活動と今後の計画,大会委員会企画)
- TK-7-1 知の創出を支える次世代IT基盤拠点(TK-7.情報・電気・電子グローバルCOEの活動と今後の計画,大会委員会企画)
- TK-7-1 知の創出を支える次世代IT基盤拠点(TK-7.情報・電気・電子グローバルCOEの活動と今後の計画,大会委員会企画)
- TK-7-1 知の創出を支える次世代IT基盤拠点(TK-7.情報・電気・電子グローバルCOEの活動と今後の計画,大会委員会企画)
- TK-7-1 知の創出を支える次世代IT基盤拠点(TK-7.情報・電気・電子グローバルCOEの活動と今後の計画,大会委員会企画)
- TK-7-1 知の創出を支える次世代IT基盤拠点(TK-7.情報・電気・電子グローバルCOEの活動と今後の計画,大会委員会企画)
- テキストマイニング基盤技術(「テキストマイニング」)
- 部分語相関ルール発見のための高速アルゴリズム (アルゴリズムと計算の理論)
- 最適パタン発見に基づくテキストデータマイニング
- 大規模テキストデータのための探索的文書ブラウジング
- 1T-10 仮想接尾辞木 : テキストデータマイニングのための接尾辞配列を用いた高速な部分語頻度計算法
- 計算学習理論における学習(機械学習,それが人に及ばざる理由)
- TD-1-7 ウェブデータからの高速テキストマイニング
- Webマイニング(「テキストマイニング」)