教師なし文書集合分類における単語選択
スポンサーリンク
概要
- 論文の詳細を見る
本稿は, 文書を内容の類似性に基づき高い精度で分類するために必要な単語の選択基準を提案する.文書の分類は文書内に出現した単語を用いて行われるが, 単語にはノイズが含まれることと, 単語の数が文書数に比較して圧倒的に多いことが, 分類結果の精度と計算量に影響を与えている.この問題を解決するために, 本稿は文書の類似性を測定する単語の選択方法を提案する.提案手法は単語のノイズを考慮した重み付けと文書の分類には因子分析を用いる.提案した重み付けの値によって単語を選択することができる.提案手法を適用した結果, 全ての単語を利用する場合に比較しても遜色のない文書集合の分類が実現できることが明らかになった.
- 一般社団法人情報処理学会の論文
- 2001-11-20
著者
関連論文
- BP-2-1 IP放送の方向性とコンテンツ保護について(BP-2.IP放送実現に向けた問題点,パネル討論,ソサイエティ企画)
- D-12-15 画像検索に用いる略画の検討
- D-11-7 曖昧さ補間を行う画像検索インターフェースの検討
- ATMネットワーク上の大容量データ通信におけるTCP/IPの評価およびその課題
- ATMネットワーク上の動画像通信におけるTCP/IPの評価およびその課題
- 画像検索をサポートするカメラアングルを用いたコンテンツ分類
- 被写体の位置情報を用いたコンテンツ分類(画像符号化・通信・ストリーム技術,及び一般)
- 被写体の位置情報を用いたコンテンツ分類
- J-069 高度画像検索のための直感的インターフェース(J.グラフィクス・画像)
- SVMを用いたモブログテキストからの感情抽出
- 半構造データ統合のための木構造の近似照合と結合手法
- D-12-13 切り取り耐性を考慮した電子透かし方式の実現
- DMDシステムを用いた3次元CGアニメーション制作の評価(CGと教育(3):CG映像と教育, テーマ:CGと教育,およびCG一般)
- A-20-7 MIRACLEにおける背景合成の提案(A-20.スマートインフォメディアシステム,一般講演)
- 多視点映像の視差補償予測 : 平行カメラ映像の規則性適用
- 立体視における適切なテキスト表現と表現手法の拡張に関する研究
- 1.総論 : マルチメディアの現状と展望(放送・通信におけるマルチメディア)
- S2-1 総論マルチメディアとは・その展望
- 静止画像の符号化方法(画像情報圧縮の手ほどき(第9回))
- 高能率符号化の標準化動向(記録と伝送における高能率符号化)
- 1.総論 : テレビ電話・テレコンファレンスの変遷と動向(テレビ電話・テレコンファレンス)
- 8-1 広帯域画像通信(8.画像通信サービス)(テレビジョン年報)
- 4.画像通信ネットワークの将来(次世代画像通信)
- 大容量アーカイブを利用したコンテンツ流通の提案(テーマ:ICカード、企業の情報化とビジネスモデル、教育の情報化、および一般)
- 新映像制作システムDMDとその制作工程(一般)
- 5.パネル討論『ブロードバンドISDN時代の映像技術』(ブロードバンドISDN)
- 被写体の位置情報を用いたコンテンツ分類(画像符号化・通信・ストリーム技術,及び一般)
- 被写体の位置情報を用いたコンテンツ分類(画像符号化・通信・ストリーム技術,及び一般)
- MPEG-21への期待と展望
- 4-1 DAVICの夜明け(4.DAVIC1.3.1規格はこうして完成した)(DAVICの遺したもの)
- Consensual Disclosureを実現する実用的な追跡不能アクセス制御方式(セキュリティ)
- テレビ会議にみる画像音声圧縮/再生技術--CCITTの世界統一化案固まる,本格的ISDN時代を支える (マルチメディア時代を支える画像音声圧縮/再生技術とエレクトロニクス)
- 画像符号化と国際標準化 (画像符号化小特集)
- 12.画像通信システム(テレビジョン年報)
- D-11-76 動画像階層符号化方式による分散型VODシステムに関する研究
- A-7-2 マルチキャストで利用できる電子透かしCoFIPの耐性評価
- マルチメディア符号化と標準化動向 (文書の処理と交換における最新動向技術解説特集) -- (マルチメディア/ハイパ-メディア拡張文書)
- JTC1/SC2における標準化活動状況 (通信と記録のための画像・マルチメディア技術と国際標準化)
- カラ-静止画符号化国際標準化
- カンブリア紀「生命大爆発」と21世紀「情報大爆発」
- カンブリア紀「生命大爆発」と21世紀「情報大爆発」
- グループの構成人数による対話の違いについて(セッション5 : コミュニティおよびコミュニケーション技術)
- グループの構成人数による対話の違いについて(セッション5 : コミュニティおよびコミュニケーション技術)
- 電子透かしに関する国際標準化動向
- 場のアートとネットワークのアート(コラボレーションアートとネットワークエンターテイメント)
- 研究技術開発と国際標準化 : 画像符号化標準化(JPEG/MPEG)活動の経験(国際標準)
- ディジタル放送とコンテンツ流通の展望
- 6-1 MPEG-4のもたらした画期性(6. MPEG-4への期待と不安)(ネットワーク映像サービス : 離陸するMPEG-4)
- ED2000-119 / SDM2000-101 / ICD2000-55 ポストIMT-2000におけるサービス
- JPEG2000のタイル構造を用いた適応型映像配信モデルの試作 : DV動画バージョン(高精細画像の処理・表示および一般)
- JPEG2000のタイル構造を用いた適応型映像配信モデルの試作 : DV動画バージョン
- A-6-1 JPEG2000を用いたQHD映像の符号化パラメータの最適化
- JPEG2000のタイル構造を用いた適応型映像配信モデルの試作 : QHD静止画バージョン(映像メディアおよび一般 インターネット, デジタル放送, マルチメディア, 三次元画像, 視覚と画質評価, ITS等)
- JPEG2000のタイル構造を用いた適応型映像配信モデルの試作 : QHD静止画バージョン
- JPEG2000のタイル構造を用いた適応型映像配信モデルの試作 : QHD静止画バージョン
- 視線一致動画ウィンドウインタフェースの開発
- 2.ブロードバンドISDNの広域展開(ブロードバンドISDN)
- P2-3 ブロードバンドISDNの広域展開
- 1. 飛躍先端技術の歩み : 1-2 MPEG(動画像音声圧縮符号化方式)(900号記念特集)
- 連邦データベースシステムにおけるスキーマ構築の一方式
- キャラクタアニメーションにおけるシナリオ駆動型動作合成
- キャラクタアニメーションにおけるシナリオ駆動型動作合成(画像符号化・通信・ストリーム技術,及び一般)
- キャラクタアニメーションにおけるシナリオ駆動型動作合成(画像符号化・通信・ストリーム技術,及び一般)
- 著作物の権利保護と使いやすさ
- 赤外線を用いた都市型コミュニティ支援システム
- 文殊の知恵システムにおける資料共有手法の試作とその評価
- 統計的潜在的意味空間の抽出
- ユーザの検索行動に基づいたキーワード提示による検索支援
- 潜在的意味空間における文書の概念検索
- 新聞記事を対象とした照応解析による抄録の作成
- 教師なし文書集合分類における単語選択
- 単語のノイズを除去した教師なし文書の分類と検索
- 情報理論的モデルを用いた情報検索
- 統計的モデルを用いた単語クラスタリング
- 情報理論的モデルを用いた情報検索
- 統計的モデルを用いた単語クラスタリング
- D-5-1 検索ログを用いたユーザに適切なキーワード提示による検索支援
- 次世代インターネットによる遠隔教育とコンテンツ保護 : 情報技術が教育をどのように変えるか
- 5.映像符号化の将来(映像高能率符号化技術)
- 1-3 世代交代へ向けて(1.歴代DAVIC会長が語る)(DAVICの遺したもの
- 3.教育用高精細画面の今後 : MPEG標準(話題提供,メディア教育開発センター創立20周年記念シンポジウム 次世代メディアへの提言【機能と品質】)
- 4. 情報システムの将来像 (気の利いた情報システム)
- JPEG・MPEG標準化苦労話(国際規格誕生物語 第1回)
- 5. マルチメディア情報処理技術の今後の方向 (マルチメディア符号化技術の動向)
- 編集にあたって (マルチメディア符号化技術の動向)
- 絵ことば通信システムの基本構想
- 未来のネットワークロボット : 地球規模聖徳太子:文殊の知恵環境
- 1.総論(マルチメディアライフを楽しくするDAVIC)
- パケット伝送システムにおけるQoSフリー方式とマルチラベルスイッチを含むQoS制御方式とのシステムコストを考慮にいれた比較検討
- QHD(Quadruple HD:3840^*2048画素)映像の主観評価実験とQHD映像を用いたアプリケーションの提案
- QHD(Quadruple HD:3840^*2048画素)映像の主観評価実験とQHD映像を用いたアプリケーションの提案
- ユーザーの品質要求を満たすネットワーク設計法
- パケット伝送システムにおけるQoSフリー方式とマルチラベルスイッチを含むQoS制御方式とのシステムコストを考慮に入れた比較検討
- ユーザーの品質要求を満たすネットワーク設計法
- K-100 A Study on Context Effects in Speech for the Advanced Knowledge Videoconference
- A-8-1 MIRACLE : 仮想鏡システムと着物試着への応用
- ここまで来た!インターネットにおける映像技術
- ディジタルコンテンツ流通の課題とコンテンツ個体化技術
- 12-2 コンテンツ制作のための高度映像検索の検討(第12部門 映像検索)
- 6-13 3次元CGアニメーション制作初心者のためのカメラワーク推薦方式(第6部門 3次元画像とCG)