テキストの特徴とHTML構造を利用したWeb文書の読みやすさ評価方法
スポンサーリンク
概要
- 論文の詳細を見る
This paper describes a method of readability assessment for web documents. Readability is the ease in which text can be read and understood. We hypothesize that the readability is determined whether a reader can easily grasp text structures. The impression and the complexity of text are significant factors. We extract the features about impression and complexity from a plain text and additional data such as HTML tags.In order to compare effect of extracting features, we are assessing readability rank by machine learning. We conduct 5-fold cross validation for each domain, and calculate the root mean squared error between the actual rank and the estimated rank. The cross validation experiments confirm that the performance of our method is high measured. It shows effectiveness of extracting features about the impression and the complexity for readability assessment.
著者
関連論文
- 連接符号の信頼度関数・漸近的距離比・見逃し誤り確率について(一般セッション,フレッシュマンセッション,一般)
- Wozencraftのランダムシフト符号とその集合族が有する二元重み分布多項式に関するいくつかの性質(研究速報)
- リードソロモン符号の部分符号に対する誤り訂正能力について
- Bluetooth を用いた展示案内システムのための移動予測による効率的なハンドオフ方式
- 相関分析によるビル空調システムの不具合検知支援方式
- 大規模ビル空調システム診断のためのモデル分割による定性推論方式
- 連続測定データに対する確率的定性推論の高速化
- 確率的定性推論による異常検知・診断リアルタイムシミュレーション
- 確率的定性推論による異常検知・診断リアルタイムシミュレーション
- 確率的定性推論によるビル空調設備故障診断のための定性値定義の決定方法
- ビル空調システム故障診断のための確率付定性モデル自動生成
- 実測データに基づく確率付定性モデルのパラメータ自動調整
- 適応的誤り制御能力を有する多元接続用符号の復号法(研究速報)
- Bluetooth を用いた展示情報提供システムのための先行ダウンロード方式
- リードソロモン符号の部分符号を構成する効率的アルゴリズム(符号理論)
- Reed-Solomon符号の部分符号を構成する効率的アルゴリズム
- マルチトラック磁気記録システムにおける簡略化復号方式
- 原始リード-ソロモン符号の2元重み分布多項式のクラス分けについて(LDPC符号セッション(重み分布),LDPC符号,及び一般)
- Wozencraftのランダムシフト符号とその集合族が有する2元重み分布多項式に関するいくつかの性質(LDPC符号セッション(重み分布),LDPC符号,及び一般)
- 低符号化比率のJustesen符号に対する漸近的距離比の収束点について
- 低符号化比率の Justesen 符号に対する漸近的距離比の収束点について
- 低符号化比率のJustesen符号に対する漸近的距離比の収束点(研究速報)
- 2次元線形符号の二重クラスタ誤り訂正能力について
- サイズ3の単一クラスタ誤りを訂正可能な2次元線形符号に関する一考察
- 大規模建物空調システムのフィールドデータを利用した異常分析
- 音楽配信サービスにおける購買行動意思決定モデル
- E-011 構文解析を用いた日本語論文の読みやすさ判定法(自然言語・音声・音楽,一般論文)
- 積符号の信頼度関数・漸近的距離比・見逃し誤り確率について(情報通信基礎サブソサイエティ合同研究会)
- 積符号の信頼度関数・漸近的距離比・見逃し誤り確率について(情報通信基礎サブソサイエティ合同研究会)
- 積符号の信頼度関数・漸近的距離比・見逃し誤り確率について(情報通信基礎サブソサイエティ合同研究会)
- 多重クラスタ誤り訂正2次元線形符号が有する検査点数の下界
- Some Binary Quantum Codes with Good Burst-Error-Correcting Capabilities
- 一般化リードソロモン符号に基づくWeakly Self-Dual符号について
- 技術受容モデルに基づく動画サイト利用者の意識調査
- 食品販売サイトを対象とした商品情報提供方法の調査
- (d,κ)制限を満足する情報系列に基づく誤り訂正符号の一構成法(研究速報)
- Web テキストのための読みやすさ評価システムの検討
- テキストの特徴とHTML構造を利用したWeb文書の読みやすさ評価方法
- テキストの特徴とHTML構造を利用した Web 文書の読みやすさ評価方法
- 経済市場分析のための経済新聞記事内の特徴抽出手法の検討