日本語ウェブページを主観的か非主観的かに分類する分類器のジャンル領域拡大化能力の改善 : 実用的な分類器へ向けて(コンテンツ技術,Web情報システム)
スポンサーリンク
概要
- 論文の詳細を見る
本論文では,機械学習法を利用して日本語ウェブページのセンチメント分類に取り組む.分類のためのカテゴリーは「主観的」と「非主観的」である.交差検定用データセットは,限られたジャンル群に分布する日本語ウェブページからなる.まず,交差検定用データセットをほぼ確実に分類する分類器を生成できることを示す.その分類器の実用性を評価するために,本論文ではジャンル領域拡大化能力という概念とジャンル領域拡大データセットを導入する.ジャンル領域拡大データセットは,交差検定用データセットを構成するジャンル群を含む,より多様なジャンル群に分布する日本語ウェブページからなるデータセットである.ジャンル領域拡大化能力は,交差検定用データセット上で訓練・生成された分類器がジャンル領域拡大データセットを分類する能力である.本論文では,交差検定用データセット上で訓練・生成された分類器のジャンル領域拡大化能力が,低いことを示す.一方で,分類器のジャンル領域拡大化能力を改善するための方法として,遺伝的アルゴリズムを利用したPOSフィルタリングに基づく素性選択法を提案し,その方法によって分類器のジャンル領域拡大化能力を改善でき,ある程度実用的とみなせる分類器を生成できることを示す.
- 2008-04-01
著者
関連論文
- 要求概念の定義,および要求の態度
- 発話行為論に基づく要求獲得パラダイムの一提案
- 品質評価に基づくソフトウェア生産性評価法の検討
- 接続節における要求表現:並列節と補足節
- 要求概念の定義,および要求の態度
- 接続節における要求表現:連体節と副詞節
- D-009 ウェブページ分類用ジャンル体系の再利用適合性評価(データベース,一般論文)
- WSにおけるユーザ操作を記録・再現するツールORRIX : 技術的現状と課題
- B-021 Happened-Before関係による非分散マルチタスクプログラムに対する排他制御機構デッドロックの定義(B分野:ソフトウェア,一般論文)
- アイデア放出促進ツール「ブレーン・スクイーザ」の提案
- 展開図学習用電子教材「TENKAI」を利用した授業の学力面での教育効果の検証
- D-022 要求抽出のための言語学的基礎論 : 要求概念の定義,および要求の態度(データベース,一般論文)
- あいづちの有無の影響を知るための主観データに基づく会議の質の評価法と評価
- 日本語ウェブページを主観的か非主観的かに分類する分類器のジャンル領域拡大化能力の改善 : 実用的な分類器へ向けて(コンテンツ技術,Web情報システム)
- 日本語ウェブページに出現するムードの収集, および拡充したムード体系の提案
- C12 初等教育向け教材作成支援サーバーの構築と運用(セッションC1情報と教育研究,一般発表概要,第7回情報プロフェッショナルシンポジウム)
- あいづちが発想数に与える影響 : その実験と分析
- 確信度の改善を目的にした要求レビュー法
- 自然言語コーパスにおける概念のマーキングルールの設定
- 自然な発話における助詞「ね」とその後接表現
- 間投詞的応答表現「はい」の発話行為論の枠組を用いた分析
- 要求獲得法におけるオフライン法の提案
- 拡張言語行為論による了解の分析 : あいづち「はい」による了解の程度と過程
- あいづちを統制したコミュニケーションにおける助詞ねの頻度の変化
- ソフトウェア「要求機能実現管理表」による機能欠落低減効果の統計的検証
- ユースケースアプローチの改善
- オブジェクト指向開発手法における「関連の設計」 : 実装言語をC++とした場合
- オブジェクト指向設計のための新記法のCASEツール化構想
- C32 Webサービスを利用した教材製作技術の支援と評価(セッションC3情報教育,一般発表概要,第8回情報プロフェッショナルシンポジウム)
- C21 動画の振り返りによるプレゼン技術向上の提案(セッションC2情報システム・教育,一般発表概要,第9回情報プロフェッショナルシンポジウム)