シリーズ型HTML文書群の事例ベース変換におけるオフライン処理による検索語の絞り込み
スポンサーリンク
概要
- 論文の詳細を見る
シリーズ型HTML文書群からXML文書への変換手法に,事例ベースの変換を用いた変換手法がある.事例ベース変換では変換事例の意味的情報と構造的情報の2点に着目し,変換事例と変換対象のHTML文書の類似性を調べることで,XML文書を生成する.先行研究では構造的情報に重きを置いており,多くの場合に精度の高い変換を行なえる.しかし,構造的情報の一致がない場合は変換精度の低下が著しい.そこで本研究では意味情報を表す語の重みベクトルに注目する.語の重みベクトルを改良することで先行研究の変換精度を上げることを目的とする.
- 社団法人電子情報通信学会の論文
- 2001-03-12
著者
-
鈴木 慎治
山梨大学コンピュータ・メディア工学科
-
梅原 雅之
山梨大学大学院工学研究科電子情報工学専攻
-
岩沼 宏治
山梨大学コンピュータ・メディア工学科
-
梅原 雅之
山梨大学コンピュータ・メディア工学科
関連論文
- HTML文書の時間的差分の自動検出に関する研究 (テーマ:一般演題及び「webとtext」)
- HTMLからXMLへの事例ベース変換における複合テキストブロックの取扱い : アライメント等の適用
- シリーズ型HTML文書群の事例ベース変換におけるオフライン処理による検索語の絞り込み
- シリーズ型HTML文書群の事例ベース変換におけるオフライン処理による検索語の絞り込み
- 事例に基づくHTML文書からXML文書への半自動変換 : シリーズ型HTML文書における類似性の利用
- ネットワーク対戦型分散協調ゲームにおける情報伝達
- ネットワーク対戦型分散協調ゲームにおける情報伝達
- エージェントの行動学習におけるGAとGPの性能比較
- 不完全情報下における分散協調の事例研究 : マルチエージェント型テニスゲーム
- 不完全情報下における分散協調の事例研究 : マルチエージェント型テニスゲーム
- 事例に基づくシリーズ型HTML文書の意味論理構造の自動認識 : HTMLからXMLへの自動変換を目指して
- シリーズ型HTML文書の事例に基づく文書論理構造の自動認識と抽出 (テーマ:一般演題及び「webとtext」)
- 事例に基づく HTML 文書から XML 文書への変換
- 事例の意味・構造情報の双方を利用したHTMLからXMLへの変換
- 事例の意味・構造情報の双方を利用したHTMLからXMLへの変換