特徴抽出を目的とした文書クラスタからの一貫性阻害要素除去
スポンサーリンク
概要
- 論文の詳細を見る
クラスタリングにより文書集合を意味的に分類し,それぞれの特徴を表す情報(特徴語)を抽出するという目的のため,クラスタリング結果を改善する方法を考案した.本手法では,各クラスタから,いわゆるノイズと呼ばれるような,クラスタを構成する文書集合の意味的一貫性を阻害する要素を除去する.除去する文書を決定するためには,別のアルゴリズムで得たクラスタリング結果を利用する.これにより,従来埋もれていた特徴語の発見が可能になる.本手法の有効性を確認するため,Q&Aサイトのページを集めて文書集合を作成し,そのクラスタリング結果から特徴的な場所を抽出する(たとえば,バーベキューに関する質問のクラスタから「公園」といった場所を抽出する)実験を行った.10個の文書集合を作成し,それぞれに対して提案手法を適用した結果,延べ百数十の場所が新たに得られた.また,本手法は質問に対して意外な関連性のある場所を抽出する傾向があることが分かった.
- 2013-06-28
著者
関連論文
- 人間関係の重なりを持つコミュニティ構造の抽出(ネットワークが創発する知能)
- 共起の文脈としてのブロガー利用の試み(Webインテリジェンス,「Webインテリジェンス」及び一般)
- トラックバックネットワークに基づくSEOコミュニティの分析(事例分析,ネットワーク生態学〜生命現象から社会文化現象の新しいパースペクティブ〜)
- エージェント選択戦略によるマルチエージェントシステムの効率と構造について(分散協調とエージェント)
- ユーザ嗜好に応じた動的なサービス構成のためのリレーションシップメカニズムの設計と評価(高速ネットワークとマルチメディアアプリケーション)
- 1 アプリケーション創発のための適応型ネットワーキングアーキテクチャ : Ja-Net(ユビキタスコンピューティング世界を実現する革新的ネットワーク技術)
- SB-4-3 自律分散エージェントによるアプリケーションサービスの一実現方法
- Ja-Netにおけるサービス属性ベースのサービス合成方法
- サービスの多様性を考慮したセキュリティ実現方式
- 文脈規定に寄与する要素に関する考察(意味・談話)
- ネットワークトポロジの次数情報に着目したサーバ・クライアント負荷分散方式の提案と評価(ソフトウェア論文)
- 文書ストリームにおける語のバーストと共起ネットワークにおけるクラスタ構造の関係について
- 関係を読み解く手段としてのネットワークの構造解析(ネットワークが創発する知能)
- 語の共有に基づく文書ネットワークの構造的特徴について(事例分析,ネットワーク生態学〜生命現象から社会文化現象の新しいパースペクティブ〜)
- Web空間における人間関係を用いた情報探索の一手法
- 実世界指向Webマイニングによる同姓同名人物の分離(情報融合)
- 実世界指向Webマイニングの提案とその同姓同名人物分離問題への適用
- 人名を用いたWeb空間のコミュニティの解析
- Webディレクトリ拡張の自動化手法
- Query Networkによる情報発見・収集支援(情報融合)
- Web上の「活動の場」に着目した人物の特徴付け(セッション3 : ソーシャルネットワーク)
- Query Networkの構造と時間発展を利用した情報発見・収集支援
- 広域ユビキタスネットワークおけるトラヒックモデルを考慮したリソース予約方式の特性評価(リソース管理・制御,一般,トラヒック,NW評価,性能,リソース管理・制御,トラヒックエンジニアリング,NW信頼性・レジリエンシ,一般)
- WWWトラフィック解析による情報生産者と情報消費者の数量的特徴付け
- WWWのユーザ操作履歴によるHTML文書の相関関係の解析
- インターネット情報探索に適した複合語検出
- Ingrid NewsCast : 自律型ニュース配信システム
- インターネット情報探索に適したキーワード抽出
- 広域分散検索と高再現率検索の結合について (時空間データベースおよび一般)
- サーバ分散型キーワード検索システムIngridの実現
- B-20-4 疎な広域ユビキタスデータに対する空間補完の改善方式(B-20.ユビキタス・センサネットワーク,一般セッション)
- B-20-15 疎な広域ユビキタスデータに対する空間補完の適用性評価(B-20.ユビキタス・センサネットワーク,一般セッション)
- 広域ユビキタスネットワークにおけるリソース予約方式(モバイル,アドホック,ユビキタス,無線,セキュリティ,マルチアクセス,アクセスネットワーク・User Network Interface,Homeネットワーク,一般)
- センサデータ活用アプリケーション開発実験環境の実現(ユビキタス・センサネットワークを支える理論,および一般)
- AND検索のための高効率インデックスの提案(フォトニックネットワークシステム,光ルーチング,一般)
- AND検索のための高効率インデックスの提案(フォトニックネットワークシステム,光ルーチング,一般)
- 文脈規定に寄与する要素に関する考察(意味・談話)
- 共起の文脈としてのブロガー利用の試み(Webインテリジェンス,「Webインテリジェンス」及び一般)
- Web上の「活動の場」に着目した人物の特徴付け(セッション3 : ソーシャルネットワーク)
- ユビキタスデータのためのインデキシング技術UBI-treeの改良(検索と索引技術,モバイルデータベースとGIS及び一般)
- ユーザ嗜好に適応したサービス生成のためのサービスモジュールのパッチワーク手法(モバイル/ワイヤレスネットワーク)(インターネットアーキテクチャ技術論文)
- LM-2 機能モジュールの再帰的切り貼りによるサービス進化手法(M. ネットワーク・モバイルコンピューティング)
- 適応型通信サービスにおけるコンテクスト把握機構CHANSE(マルチメディアコミュニケーションシステム)
- サービス創発のための適応型ネットワークアーキテクチャ
- 適応型ネットワーキングサービス環境:DANSE (特集論文1 適応型ネットワーキングサービス)
- 適応型通信サービスにおけるコンテクスト情報提供方式
- 2S-2 適応型通信サービスのためのコンテクストハンドリング機構の提案
- 2S-1 適応型ネットワーキングサービス環境DANSE実験システム
- 適応型ネットワーキングサービス環境DANSE(ネットワークソフトウェア)
- 4R-3 コンテクストに応じたサービスコーディネーションの実現方法
- コンテクスト適応型サービスのためのネットワークリソース検索方式
- 十分なサービス環境が利用できない場合のネットワークによる代替案生成法
- ユーザの要求とコンテクストに応じてサービス環境を構成するパッケージング方式の提案
- ユーザの要求とコンテクストに応じてサービス環境を構成するパッケージング方式の提案
- ネットワーク利用におけるユーザ支援 : 気が利くネットワークの提案
- B-20-32 面的データ収集に基づくユビキタスサービスの移動型NOxセンサを用いた実証(B-20.ユビキタス・センサネットワーク,一般セッション)
- 大規模分散システムにおけるオブジェクトの関係に基づいた名前情報管理
- F-050 特定ジャンルのブログに対する共起とユーザ別特徴語抽出を用いた話題抽出(F分野:人工知能・ゲーム,一般論文)
- 5C-1 UBI-tree : ユビキタスデータのためのインデキシング技術(データベース技術一般,一般セッション,データベースとメディア,情報処理学会創立50周年記念)
- ネットワーク利用におけるユーザ支援 : 気が利くネットワークの提案
- 人名を用いたWeb空間のコミュニティの解析 (特集:「ネットワークが創発する知能」および一般)
- 情報利用支援のためのWebサーバによる自律的な相互関係の形成(ソフトウェアエージェントとその応用論文)
- 検索履歴可視化の一手法(情報可視化)
- Web上のキーパーソンの発見と関係の可視化(テキストマイニングの応用(1))
- 文字列出現頻度比較による情報源間の類似性判定
- 文字列出現頻度比較による情報源間の類似性判定
- Minority gameにおけるエージェントの社会的行動に関する一考察
- Minority gameにおけるエージェントの社会的行動に関する一考察
- コンピュータネットワーク上での確率的経路制御方式の評価
- Minority gameにおける個々のエージェントの挙動に関する一考察
- 参照共起分析のWebディレクトリへの適用
- 2000-FI-59-3 / 2000-DD-24-3 ハイパーリンクとアンカーテキストを利用した情報検索とランキングの一手法
- 2000-FI-59-3 / 2000-DD-24-3 ハイパーリンクとアンカーテキストを利用した情報検索とランキングの一手法
- サーチエンジンの検索結果のマルチレベル・グルーピングの評価(特集●インターネット)
- サーチエンジンへの問い合わせの解析
- Unicodeを用いたN-gram索引の一実現方式とその評価
- サーチエンジンへの問い合わせの解析
- Unicodeを用いたN-gram索引の一実現方式とその評価
- 次世代情報検索インフラストラクチャIngrid (特集 インタ-ネット上の情報検索技術)
- 特集「ネットワークが創発する知能」の編集にあたって
- B-19-43 共有した時間と出来事に基づく人間関係における重要度の推定(B-19. ユビキタス・センサネットワーク,一般セッション)
- B-19-30 人間関係におけるつながり度の定量化に向けた一検討(B-19.ユビキタス・センサネットワーク,一般セッション)
- キーワードテキストに対するイベント自動判定法の提案(「コンテキストを意識した知識の利用」及び一般)
- ユビキタスデータ共有機構uTupleSpaceの提案とフィールド実験への適用評価(ユビキタスネットワーク,ユビキタス・センサネットワークを支えるシステム開発論文)
- BMI応用サービスの実現に向けたエージェントベース分散処理基盤の提案と評価
- BMI応用サービスの実現に向けたエージェントベース分散処理基盤の提案と評価
- 個人属性が対人認知構造に及ぼす影響について : Webアンケートによる大規模調査の解析結果から(コミュニケーション支援及びヒューマンコミュニケーション一般)
- 個人属性が対人認知構造に及ぼす影響について : Webアンケートによる大規模調査の解析結果から(コミュニケーション支援及びヒューマンコミュニケーション一般)
- 人間関係におけるつながり感の定量化に向けた一検討(ポスター講演,ポスターセッション,フレッシュマン・セッション,ユビキタス・センサネットワーク,ユビキタス・システム,アドホックネットワーク)
- 特徴抽出を目的とした文書クラスタからの一貫性阻害要素除去
- 対人関係におけるつながり感予測式の検証
- キーワードテキストに対するイベント自動判定法の提案
- センサネットワーク向けDBMSにおける汎用的な最新状態検索機能の提案と実装(センサーDB,データ工学と情報マネジメント論文)
- 対人感情を変化させるイベントに着目した対人感情推定モデルの構築(無線分散ネットワーク,一般)
- 構造方程式モデリングによる対人認知構造モデルの構築(無線分散ネットワーク,一般)
- Webからの行動プロセス抽出手法の提案(「コンテキストを意識した知識の利用」及び一般)
- 状況に依存した行動パターン抽出手法の検討(文書分類・行動パターン抽出,ビッグデータを対象とした管理・情報検索・知識獲得及び一般)
- 個人属性が対人認知構造に及ぼす影響について Web アンケートによる大規模調査の解析結果から
- 個人属性が対人認知構造に及ぼす影響について Web アンケートによる大規模調査の解析結果から
- 構造方程式モデリングによる対人認知構造モデルの構築