IT2010-13 混合Polya分布に基づくサブカテゴリを考慮した文書分類手法(フレッシュマンセッション,一般)
スポンサーリンク
概要
- 論文の詳細を見る
本研究では,混合Polya分布を確率的言語モデルとして用いた文書分類方法を提案する.従来,確率的言語モデルを用いた文書分類手法においては,スポーツや政治といった既知のカテゴリに1つの確率分布を与えた混合分布を考え,新規の文書について帰属度を計算し,分類を行っていた.本研究では,カテゴリの中にさらに複数の未知の潜在トピックの存在を仮定し,それらをサブカテゴリと定義する.サブカテゴリに1つのPolya分布を与え,新規の文書においてサブカテゴリへの帰属度を計算し,サブカテゴリへの分類を行い,そのサブカテゴリが属するカテゴリへ最終的に分類される手法と,カテゴリへの帰属度をサブカテゴリの混合Polya分布より計算し,カテゴリへの分類を行う方法の2つの分類方法を提案し,それらの有効性を示す.
- 2010-07-15
著者
-
後藤 正幸
早稲田大学理工学術院
-
石田 崇
早稲田大学メディアネットワークセンター
-
後藤 正幸
武蔵工業大学環境情報学部
-
牛尼 夏海
早稲田大学大学院創造理工学研究科経営システム工学専攻
-
雲居 玄道
早稲田大学理工学術院総合研究所
-
後藤 正幸
早稲田大学理工学術院創造理工学部経営システム工学科
-
後藤 正幸
早稲田大学創造理工学部
-
後藤 正幸
早稲田大学
関連論文
- 高次元ベクトル空間モデルによるテキスト分類問題について : 分類性能と距離構造の漸近解析(理論・技術)
- 知的構造化と特徴分析に基づくアフィリエイトサイト構築支援に関する研究
- 混合Polya分布に基づくサブカテゴリを考慮した文書分類手法 (情報理論)
- 一般化LDPC符号に対する部分符号の構造を利用した効率的な符号化法(フレッシュマンセッション,フレッシュマンセッション,一般)
- 階層的クラスタを用いた適合性フィードバック手法による文書検索
- クラスタに基づく適合性フィードバックによる文書検索
- 単語ごとの修正重みに基づく適合性フィードバックによる文書検索
- 共役勾配法における探索効率向上法に関する一考察
- PLSIを用いた文書分類手法に関する一考察 (人工知能と知識処理)
- IT2010-28 高符号化率までパンクチャ可能なLDPC符号に関する一考察(フレッシュマンセッション,一般)
- IT2010-13 混合Polya分布に基づくサブカテゴリを考慮した文書分類手法(フレッシュマンセッション,一般)
- IT2010-11 アルファベットが未知の木情報源に対する効率的ベイズ符号化アルゴリズム(フレッシュマンセッション,一般)
- 高齢者のパソコン学習の継続性を考える--第3回高齢者パソコン教室の事例から
- 高齢者向けPC教室における学生ボランティアのベネフィット分析に関する研究
- 高齢者向けパソコン教室を通した学習環境のデザイン
- 高齢者向けパソコン教室の設計と運営による実践的教育
- 在庫量・発注量変動により発生するコストを制御する定期発注方式に関する研究
- 在庫量・発注量変動により発生するコストを制御する定期発注方式に関する研究
- N-008 教学支援システムに関する学生アンケートの分析(N分野:教育・人文科学)
- N-021 自然言語表現に基づく学生アンケート分析システム(N.教育・人文科学)
- 高次元ベクトル空間モデルによるテキスト分類問題について : 分類性能と距離構造の漸近解析
- ソーシャルブックマークにおけるユーザのタグ付け傾向を加味したWebページ推薦手法 (人工知能と知識処理)
- Web サーチエンジンを用いた ブランドイメージ測定手法に関する一考察
- 2元系列のメッセージを用いたビット反転復号法の改良 (情報理論)
- 一般化LDPC符号に対する効率的な符号化法 (情報理論)
- 特集にあたって 環境問題と経営情報 (「環境問題と経営情報」特集号)
- 評価関数の重みパラメータを推定する対話型遺伝的アルゴリズム(「コミュニティ上での知識の共有・再利用」及び一般)
- PLSIを用いた文書分類手法に関する一考察(「コミュニティ上での知識の共有・再利用」及び一般)
- メッセージ伝播型復号法に効果的な非正則LDPC符号の構成法と復号順序の決定法(フレッシュマンセッション,フレッシュマンセッション,一般)
- 語頭条件を満たさないWord-valued sourceに対するLZ78符号の符号化性能について
- 語頭条件を満たさない Word-valued source に対するLZ78符号の符号化性能について
- ソーシャルブックマークにおけるユーザのタグ付け傾向を加味したWebページ推薦手法(「コミュニティ上での知識の共有・再利用」及び一般)
- E-1 文間の単語共起類似度を用いた重要文抽出手法(要約・情報検索,E.自然言語・文書)
- 辞書番号を修正したLZW符号
- 参照回数を考慮したLZW法によるデータ圧縮(フレッシュマンセッション)(フレッシュマン,一般)
- D-012 フォークソノミーにおけるタグの意味的関係分析に関する一考察(データベース,一般論文)
- 変傾共役勾配法によるBP学習の安定化と高速化
- 単語単位情報源に対するLZ78符号の圧縮性能(一般,フレッシュマン,招待講演 : フレッシュマンセッション)
- 評価関数の重みパラメータを推定する対話型遺伝的アルゴリズム (人工知能と知識処理)
- A-002 観光地の指定とスケジュールの多様性を考慮した観光スケジュール作成支援(モデル・アルゴリズム・プログラミング,一般論文)
- サイバー・ネパールプロジェクトによるマルチメディア環境教育コンテンツの開発
- 顧客ロイヤルティ構造図に基づく重要要因の定量化手法に関する研究
- 中古車の価格モデルとユーザベネフイット分析に関する一考察
- 宿泊施設の戦略構築を支援するユーザレビュー分析に関する一考察
- テキストデータに基づく顧客ロイヤルティの構造分析手法に関する一考察
- 実施報告 授業支援システムの導入と利用状況について
- 独自eラーニング教材への学生の評価
- 価格プレミアムの評価と要因分析手法に関する一考察
- 孫との関係に着目した高齢者の主観的幸福感に関する研究
- 文書分類モデルの性質に関する一考察
- UMLに基づく物流情報モデルの構造分析手法に関する一考察
- 遠隔講義における双方向コミュニケーションについての課題とその解決に向けて
- 環境英語を学ぶeラーニング教材開発とその評価
- インターネットを用いた大学間連携による遠隔授業の開発と評価
- 次世代ロジスティックスのための物流情報システムに関する一考察 (特集 ロジスティクス・SCMと設備管理)
- 活用事例 ネパールと連携した環境教育コンテンツの構築による実践教育
- 大学の情報系授業における学生アンケートの分析
- 活用事例 オーストラリア熱帯雨林保全プログラムにおける環境教育と情報教育との相乗効果について
- 英語eラーニング教材開発の試み (小特集:サイバーキャンパス)
- 初級プログラミング科目を対象とした学内遠隔教育とその効果 (小特集:サイバーキャンパス)
- 語頭条件を満たさない単語集合をもつWord-Valued Sourceの性質について
- E-13 クラスタ生成に基づく電子メール文書の重要度ランク付け手法(文書分類,E.自然言語・文書)
- ブロック単位で系列を出力する情報源に対するベイズ符号とZiv-Lempel符号のユニバーサル性について
- 線形回帰モデルのベイズ最適な予測法に関する研究
- 線形回帰モデルのベイズ最適な予測法に関する研究
- H-029 回転方向の自己相関関数を用いた商標図形分類法(H分野:画像認識・メディア理解)
- H-028 色情報に対する人間の感性を考慮した類似画像検索(H分野:画像認識・メディア理解)
- 相関に基づいた共クラスタリングによる協調フィルタリング
- 最頻文脈依存 N-gram を考慮した文法生成法に基づくデータ圧縮法
- Word-valued source から出現する系列の単語分割について
- 語頭条件を満たさない Word-Valued Source モデルに関する一考察
- 木構造のモデル族の学習・予測アルゴリズムに関する一考察
- 静止画像の無歪み圧縮に適した領域分割アルゴリズム
- String Matching Algorithmに基づく有歪み圧縮について
- JPEGにおけるハフマン符号化法の修正
- J-067 ブロック単位でマルチ走査を行う静止画像圧縮(J分野:グラフィクス・画像)
- 文脈混合を考慮したPPMアルゴリズム(フレッシュマン, 一般)
- 単一ビットプレーンごとのSPIHTアルゴリズムを用いた静止画像圧縮
- D-029 相互情報量に基づく特徴選択を用いた文書自動分類(D分野:データベース)
- String Macthingに基づく有歪み圧縮に関する研究
- データ圧縮に適した最頻 digram に基づく逐次型文法変換法
- 順序カテゴリカルデータ解析における母数推定に関する研究
- 発注サイクル期間の異なるPush型生産システムとPull型生産システムの発注量・在庫量変動に基づく特性解析
- 階層型ニューラルネットワークの混合モデルによるベイズ最適な予測について
- 有色雑音をもつ線形システムの最適制御則と定期発注システムへの適用
- 階層型ニューラルネットワークの混合モデルによるベイズ最適な予測について
- FK型発注システムによる定期発注システムの統一的考察
- 最適レギュレータに基づく定期発注システムに関する研究
- 共役勾配法を導入したBP学習における安定化に関する研究
- J-066 情報の偏りを考慮した静止画像の可逆予測符号化法(J分野:グラフィクス・画像)
- 一般化LDPC符号に対する効率的な符号化法
- 周波数変換後の信号の重要度を考慮した画像圧縮法(フレッシュマンセッション)(フレッシュマン,一般)
- 最頻N-gramを考慮した文法生成法に基づくデータ圧縮法(一般,フレッシュマン,招待講演 : フレッシュマンセッション)
- 2元系列のメッセージを用いたビット反転復号法の改良
- PLSIに基づく適合性フィードバック手法
- J-065 DCTにおけるAC係数の相関を考慮した画像符号化(J分野:グラフィクス・画像)
- ソーシャルブックマークにおけるユーザのタグ付け傾向を加味した Web ページ推薦手法
- 評価関数の重みパラメータを推定する対話型遺伝的アルゴリズム(人工知能,データマイニング)
- 文脈木重みづけ法を用いた文書分類の誤り確率について
- F-015 二値判別器の組み合わせによるRVM多値文書分類手法に関する一考察(パタン識別,F分野:人工知能・ゲーム)