繰り返し構造の検出に基づくWebページの見出しの階層構造の解析
スポンサーリンク
概要
- 論文の詳細を見る
文書中には類似した特徴を持つ見出しが反復的に現れる構造(繰り返し構造)がみられる.繰り返し構造を構成する見出し群は,文書の階層構造上では同一レベルに属すると考えられる.我々は先行研究において,Webページ中の繰り返し構造を検出することにより見出しの階層構造を解析する手法を提案しているが,本稿では繰り返し構造の検出手法を改善することにより,見出しの階層構造の解析精度の向上を試みる.また提案手法の効果を実験的に評価した結果を報告する.
- 一般社団法人情報処理学会の論文
- 2010-02-25
著者
-
小山 照夫
国立情報学研究所
-
松本 章代
東京工業高等専門学校情報工学科
-
伊東 幸宏
静岡大学創造科学技術大学院
-
小西 達裕
静岡大学情報学部
-
高木 朗
言語情報処理研究所
-
三宅 芳雄
中京大学
-
松本 章代
青山学院大学 理工学部
-
高木 朗
産業技術総合研究所 サイバーアシスト研究センター:株式会社 Csk
-
小西 達裕
静岡大学
-
沙 鵬
静岡大学
-
伊東 幸宏
静岡大学
-
沙鵬
静岡大学
-
小出 照夫
国立情報学研究所
関連論文
- 日本語テキストからの複合語用語抽出
- 2-108 東京高専のOBベンチャー企業と教員の連携工学教育 その3 : 在校生への学内インターンシップ体験のOB・教員連携教育(創環プロジェクト)(創学環プロジェクト)((17)産学連携教育(産学間・大学高専間の連携)-II)
- グループコミュニケーションの活性化を目的とするRFIDを用いたスケジュール遂行支援システムの開発(グループコミュニケーション,HCGシンポジウム)
- 複数家電の連携操作が可能な家電音声入力インタフェースの構築(システム)
- 文脈への意味の位置付けを用いた対話システムとその評価(言語,テキストの知能情報処理)
- 繰り返し構造を考慮したWebページの見出しの階層構造の解析(セッション2,学生チャレンジ特集)
- 繰り返し構造を考慮したWebページの見出しの階層構造の解析(テーマ:学生チャレンジ特集)
- 表構造における意味的関係に基づくWWW検索性能の向上(Web検索・Webアーカイブ,データ工学論文)
- メニュー操作を考慮した機種非依存の家電統合インタフェース(音声基盤技術・インタフェース)
- 対話文脈を利用した構文意味解析
- 検索キーワード間の修飾-被修飾関係の詳細な分析に基づくWWW検索性能の向上(自然言語)
- Webサイトの適応型サイトマップの作成とそのオンラインショッピング支援への応用(セッション4:ビジュアライゼーションとユーザエクスペリエンスの向上,学生チャレンジ特集)
- 文脈情報と応答内容を用いた単語生起確率の動的生成手法に関する検討(セッション3 : 理解るインタフェース : 音声対話)
- 抽象的データ構造を含むアルゴリズム表現に基づくプログラム評価支援システムの構築
- ユーザモデルと状況を反映させた車載機への広告情報配信システムの構築 : 興味度推定と配信ルールの自動学習(セッション8:データマネージメント)
- E_009 モジュラリティの高い対話制御開発環境の試作(E分野:自然言語)
- 認識信頼度と対話履歴を用いた音声言語理解手法(音声,聴覚)
- 表構造における意味的関係に基づくWWW検索精度の向上(セッション2)
- RDFaを用いたメタデータオーサリングシステムの構築(セッション1:メタデータと自動分類、知識支援)
- 4P-1 SVG画像複数人同時編集アプリケーションの開発(情報可視化,学生セッション,データベースとメディア)
- 3N-1 ブラウザに依存しないプレーンテキスト上のWebアノテーション機能(メタデータ活用,学生セッション,データベースとメディア)
- 6M-1 オープンソースを用いたC言語記述スタイルの統計分析の試み(ソフトウェア開発,学生セッション,ソフトウェア科学・工学)
- 4L-7 Rubyにおける文字コード変換環境の向上(要求定義とプログラミング言語・設計・実装,学生セッション,ソフトウェア科学・工学)
- D-15-4 数式の意味解析に基づく基礎数学e-ラーニングシステムの開発(D-15. 教育工学,一般セッション)
- 理工系学生を対象とした技術文書作成支援システム
- 理工系学生を対象とした文章作成能力向上のための支援システム
- 言語知識を用いないスパムメールフィルタに関する考察
- D-15-41 論理的思考力の定着をねらいとした基礎数学e-ラーニングシステムに関する一検討(D-15. 教育工学,一般セッション)
- Web文書を活用したn-gramモデルによる手書き自由記述アンケートの自動認識法(翻訳・応用)
- 授業への復習時間,小テスト,順位付けとその効果(1)教員支援マクロの開発と化学1への適用
- 6-324 東京高専における新入生向け体験重視型専門基礎教育 : その4 情報工学分野 : 情報工学体験教材としてのプログラミング入門(口頭発表論文,(8)ものつくり教育-IX)
- 語彙概念構造を利用した複合名詞内の係り関係の解析(システムLSIの設計技術と設計自動化)
- 文法的制約を用いた複合語解析モデルの作成
- 語基の詳細な特徴を考慮した複合語解析モデル
- 多義性解消におけるアライメントスコアの重みの推定について(検索・多義性解消)
- 意味の対応付けと依存関係の解釈を考慮した対話意味表現(対話(2))(第6回音声言語シンポジウム)
- 情報家電の操作のための対話インタフェースの開発(対話(1))(第6回音声言語シンポジウム)
- 依存関係の解釈と概念情報の統合処理(ポスターセッション)(第6回音声言語シンポジウム)
- 文脈情報を利用した構文的曖昧性の解消(ポスターセッション)(第6回音声言語シンポジウム)
- 抽象的データ構造を用いたアルゴリズム表現に基づくプログラム評価システムの実用性評価 (学習の身体性とマルチモーダルインタフェース(音声言語インタフェース含む))
- プログラミング教育における教師支援のためのプログラム評価機構(次世代教育(学習)支援システム論文特集)
- 史料の管理・検索・可視化機能を持つ歴史学研究支援統合環境の構築 (人文科学とコンピュータ)
- ベイジアンフィルタにおける言語知識を用いないトークン抽出方式の提案と評価
- 情報系学長,おおいに語る
- RDFaを用いたメタデータオーサリングシステムの構築(セッション1:メタデータと自動分類、知識支援)
- 対象世界モデルを利用したプログラム理解の枠組
- 対象世界モデルを利用したプログラム理解とその応用
- 対象世界モデル上でのシミュレーションに基づくプログラム理解とコメント生成について
- 対象世界モデル上でのシミュレーションに基づくプログラム理解とコメント生成について
- アセンブラプログラムの理解とコメント文の生成
- 複数家電用音声インタフェースのユーザビリティの向上
- D-15-6 基礎数学学習支援システムのための手書き数式解析法の検討(D-15.教育工学,一般セッション)
- 繰り返し構造の検出に基づく Web ページの見出しの階層構造の解析
- Webサイトの適応型サイトマップの作成とそのオンラインショッピング支援への応用(セッション4:ビジュアライゼーションとユーザエクスペリエンスの向上,学生チャレンジ特集)
- ET2009-129 手書き数式解析に基づく基礎数学学習支援システムの開発(障害者教育・特別支援教育/一般)
- 5Q-7 SVuGyを例にしたXML用入出力指定DSLの開発(情報アクセス技術,学生セッション,データベースとメディア,情報処理学会創立50周年記念)
- 4P-4 Rubyにおける文字コード変換の最適化(プログラミング言語,学生セッション,ソフトウェア科学・工学,情報処理学会創立50周年記念)
- Web文書を活用したn-gramモデルによる手書き自由記述アンケートの自動認識法(翻訳・応用)
- 2X-3 限定されたクラスタ集団のスモールワールド性仮説検証実験の試み(人工知能と社会,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 動詞の挿入による日本語複合語の構造解析
- 専門用語抽出・解析処理を考慮したコーパスの作成
- 専門分野における複合名詞の語構成要素の品詞相当カテゴリーに関する一考察
- 繰り返し構造の検出に基づくWebページの見出しの階層構造の解析
- 繰り返し構造の検出に基づくWebページの見出しの階層構造の解析
- 繰り返し構造の検出に基づくWebページの見出しの階層構造の解析
- 5ZK-1 C言語用のプログラミングスタイル評価システムの構築(プログラミング教育,学生セッション,コンピュータと人間社会,情報処理学会創立50周年記念)
- 5P-2 教育支援を目標とした遠隔ペアプログラミング環境の構築(プログラミング環境・教育,学生セッション,ソフトウェア科学・工学,情報処理学会創立50周年記念)
- 文構造における検索キーワード間の修飾 : 被修飾関係に基づくWWW検索精度の向上(WWW,テキスト情報の要約と掲示に関わる自然言語処理シンポジウム及び一般)
- 見出しの階層関係を利用したWWW検索精度の改善(WWW,テキスト情報の要約と掲示に関わる自然言語処理シンポジウム及び一般)
- ページ内の意味的係り関係に基づくWWWページ検索結果の絞り込みについて(構文,係り受け解析)
- ページ内の意味的係り関係に基づくWWWページ検索結果の絞り込みについて(構文, 係り受け解析)(言語理解とコミュニケーション)
- D-12-143 毛筆お手本自動生成アルゴリズムを活用した手書き続け字認識に関する一考察(D-12.パターン認識・メディア理解,一般講演)
- 理工系学生の論文作成支援を目的とした文書可視化システム (大学における情報教育の新たな展開--教科「情報」との接続性 及び一般)
- D-15-2 かな文字の構造的分類に基づくかな書道文字列お手本自動生成に関する検討(D-15.教育工学,一般講演)
- 代数幾何符号復号における生成点での留数情報を活用した未知シンドロームの推定に関する研究
- 代数幾何符号復号における生成点での留数情報を活用した未知シンドローム推定の一考察
- 語彙の制約を考慮した複合語解析モデルの構築
- 語彙の制約を考慮した複合語解析モデルの構築
- 候補の接続関係を考慮した複合語用語抽出
- 形態素出現パタンに基づく文書集合類似性評価(スパム検出・類似性評価)
- 動詞の語義と意味役割を付与したタグ付コーパスの作成
- 用語クラスタリングに基づく部分研究領域推定と用語分類(語彙・意味)
- 用語クラスタリングに基づく部分研究領域推定と用語分類(語彙・意味)
- 日本語複合語用語の入れ子関係に基づく階層的体系化
- 日本語複合語用語の入れ子関係に基づく階層的体系化(語彙1)
- 日本語専門分野テキストコーパスからの複合語用語の抽出(抽出)
- 文法パターンに基づく用語抽出モデルの構築(言語理解とコミュニケーション一般)
- 語彙概念構造を利用した助詞「に」に関する複合名詞の分析
- 語彙概念構造を利用した助詞「に」に関する複合名詞の分析
- 5-105 宿題のE-mail_Reportに伴う学生の自宅学習状況把握とその活用法((2)専門科目の講義・演習-II)
- D-12-58 永字八法に基づく手書き文字認識用辞書の動的構成法(D-12.パターン認識・メディア理解,一般セッション)
- 複合名詞の語構成要素間の結合関係に関する考察 : 文法的特性に基づく品詞相当カテゴリーの評価
- D-12-26 確率ネットワークを用いた手書き文書認識の後処理方式の検討(D-12.パターン認識・メディア理解A(パターンメディアの認識・理解・生成),一般セッション)
- D-12-25 文章表現の癖抽出に基づく手書き文章認識の後処理方式の検討(D-12.パターン認識・メディア理解A(パターンメディアの認識・理解・生成),一般セッション)
- ベイジアンフィルタにおける言語知識を用いないトークン抽出方式の提案と評価 (特集 社会を活性化するコンピュータセキュリティ技術)
- 学生レポートにおける不適切な使われ方をしている接続詞の検出 (ネットワークコンピューティングとこれからの教育・学習環境/一般)
- Skypeを利用した外国語会話訓練システムの構築
- 高齢者の認知症早期発見に向けたAndroid端末による情報システムの準備実証実験と大規模実証実験に向けた調査
- 日本語用語抽出と風力発電分野における日仏用語抽出の考察(基礎技術,第4回集合知シンポジウム)
- D-12-18 JohnsonSU分布を用いた手書き文字認識用識別関数の改良(D-12.パターン認識・メディア理解A(パターンメディアの認識・理解・生成))