実世界指向Webマイニングによる同姓同名人物の分離(<特集>情報融合)
スポンサーリンク
概要
- 論文の詳細を見る
巨大なデータベースであるWebから知識を抽出する一手法として実世界指向Webマイニングを提案する.従来のマイニングでは主に統計的な処理によりデータの特徴が抽出されていた.これに対し, 実世界指向マイニングでは, 実世界を意識したデータの解釈, 具体的には, 実世界のエンティティがデータの中にどのように現れ, 相互にどういう関係を形成しているかを調べる.この考え方をWebにおける人物の識別に適用し, 同姓同名人物の分離を行った.これは, 与えられた人名が出現するWebページを同一人物ごとにグループ分けするタスクで, 本手法を用いた場合, 平均9割以上の高い率で正しく処理できることを確認した.
- 社団法人情報処理学会の論文
- 2005-06-15
著者
-
佐藤 進也
NTT未来ねっと研究所
-
風間 一洋
NTT未来ねっと研究所
-
村上 健一郎
法政大学ビジネススクールイノベーション・マネジメント研究科
-
福田 健介
NTT未来ねっと研究所
-
福田 健介
国立情報学研究所
-
福田 健介
Ntt
-
村上 健一郎
法政大学ビジネススクール
-
村上 健一郎
Ntt ソフトウェア研究所
-
村上 健一郎
Ntt基礎研究所
-
風間 一洋
NTTソフトウェア研究所
-
風間 一洋
日本電信電話株式会社ntt未来ねっと研究所
-
風間 一洋
日本電信電話(株)ntt未来ねっと研究所
関連論文
- 1.国内ブロードバンドトラヒックの動向(IP網トラヒック計測)
- 動的リスク指標としてのマーケットモード(経済物理学とその周辺,統計数理研究所研究会共同研究集会,経済物理学2009-ミクロとマクロの架け橋-,京都大学基礎物理学研究所2009年度前期研究会,研究会報告)
- ランダム行列理論を用いたインターネット・トラフィックの解析(経済物理学とその周辺,統計数理研究所研究会共同研究集会,経済物理学2009-ミクロとマクロの架け橋-,京都大学基礎物理学研究所2009年度前期研究会,研究会報告)
- 人間関係の重なりを持つコミュニティ構造の抽出(ネットワークが創発する知能)
- 共起の文脈としてのブロガー利用の試み(Webインテリジェンス,「Webインテリジェンス」及び一般)
- 広域ネットワークにおけるEndo-to-End遅延の解析
- リアルタイム圧縮によるパケットキャプチャの高速化(ネットワーク)
- トラックバックネットワークに基づくSEOコミュニティの分析(事例分析,ネットワーク生態学〜生命現象から社会文化現象の新しいパースペクティブ〜)
- 社会ネットワーク上の個人情報伝搬特性に関する一考察(ユビキタスNW,一般,ホームネットワーク,ユビキタスネットワーク,コンテキストアウェア,eコマース及び一般)
- 大規模マルチエージェントシステムのための確率的落札戦略の提案と評価(モデル/理論,ソフトウェアエージェントとその応用論文)
- エージェント選択戦略によるマルチエージェントシステムの効率と構造について(分散協調とエージェント)
- ソーシャルネットワーキングサービスを前提としたプライバシー侵害検出(センサーネットワーク,ネットワークアーキテクチャ(ユビキタスNW,スケールフリーNW,RoN,アクティブNW)高速Ethernet,グリッドNW,センサNW,一般)
- 文脈規定に寄与する要素に関する考察(意味・談話)
- ネットワークトポロジの次数情報に着目したサーバ・クライアント負荷分散方式の提案と評価(ソフトウェア論文)
- 文書ストリームにおける語のバーストと共起ネットワークにおけるクラスタ構造の関係について
- 関係を読み解く手段としてのネットワークの構造解析(ネットワークが創発する知能)
- 語の共有に基づく文書ネットワークの構造的特徴について(事例分析,ネットワーク生態学〜生命現象から社会文化現象の新しいパースペクティブ〜)
- Web空間における人間関係を用いた情報探索の一手法
- 実世界指向Webマイニングによる同姓同名人物の分離(情報融合)
- 実世界指向Webマイニングの提案とその同姓同名人物分離問題への適用
- 人名を用いたWeb空間のコミュニティの解析
- Webディレクトリ拡張の自動化手法
- Query Networkによる情報発見・収集支援(情報融合)
- Web上の「活動の場」に着目した人物の特徴付け(セッション3 : ソーシャルネットワーク)
- Query Networkの構造と時間発展を利用した情報発見・収集支援
- フリースケールネットワーク方式(ネットワークシステム)
- フリースケールネットワーク方式
- LL-007 イベントに基づくBGPトラフィックの解析(L. インターネット)
- WWWトラフィック解析による情報生産者と情報消費者の数量的特徴付け
- WWWのユーザ操作履歴によるHTML文書の相関関係の解析
- インターネット情報探索に適した複合語検出
- Ingrid NewsCast : 自律型ニュース配信システム
- インターネット情報探索に適したキーワード抽出
- 広域分散検索と高再現率検索の結合について (時空間データベースおよび一般)
- サーバ分散型キーワード検索システムIngridの実現
- OC-48c MAPOSネットワークシステムの実現
- 並列分散型高速通信スイッチCOREswitch
- 並列分散型高速通信スイッチCOREswitch
- 超高速データ通信用プロトコルMAPOSの概要 : Multiple Access Protocol over SONET/SDH
- Frame Switching 方式による HDLC フレーマ LSI の実現 : CORE framer
- Frame Switch エミュレータの実現 : CORE-Switch
- 文脈規定に寄与する要素に関する考察(意味・談話)
- 共起の文脈としてのブロガー利用の試み(Webインテリジェンス,「Webインテリジェンス」及び一般)
- Web上の「活動の場」に着目した人物の特徴付け(セッション3 : ソーシャルネットワーク)
- リスク回避のためのセンサーネットワークによる人間行動抽出(リスク日避とデータ知能学, セマンティックWebとソフトウェア工学, 一般)
- F-050 特定ジャンルのブログに対する共起とユーザ別特徴語抽出を用いた話題抽出(F分野:人工知能・ゲーム,一般論文)
- インターネットトラフィックにおける相転移現象(テーマ:インターネットトラヒックの計測、分析、及び一般)
- コンピュータシミュレーションによるCSMA/CDアクセス方式ネットワークトラヒックの統計物理学的解析
- ネットワークプロトコルと相転移現象
- 28pYD-3 インターネットトラフィックにみられる1/fゆらぎの生成要因
- インターネットの時間的・空間的ダイナミクス(ネットワークが創発する知能)
- ウェブ構造はどこまでスケールフリー/スモールワールドか? : ウェブ構造のモデル化に向けて
- ネットワークトラフィックの自己相似性とその生成モデル
- 仮想ネットワークアーキテクチャによるネットワークワイドな保護機構(資源管理と保護)
- 記号処理カーネルSILENTのハードウェア構成
- 広域IP網自動診断システム:ENCORE
- マルチエージェントを用いた自律組織間診断システム : ENCORE (新しいシステムソフトウェア)
- 人名を用いたWeb空間のコミュニティの解析 (特集:「ネットワークが創発する知能」および一般)
- 情報利用支援のためのWebサーバによる自律的な相互関係の形成(ソフトウェアエージェントとその応用論文)
- 検索履歴可視化の一手法(情報可視化)
- Web上のキーパーソンの発見と関係の可視化(テキストマイニングの応用(1))
- 文字列出現頻度比較による情報源間の類似性判定
- 文字列出現頻度比較による情報源間の類似性判定
- Minority gameにおけるエージェントの社会的行動に関する一考察
- Minority gameにおけるエージェントの社会的行動に関する一考察
- コンピュータネットワーク上での確率的経路制御方式の評価
- Minority gameにおける個々のエージェントの挙動に関する一考察
- 参照共起分析のWebディレクトリへの適用
- 2000-FI-59-3 / 2000-DD-24-3 ハイパーリンクとアンカーテキストを利用した情報検索とランキングの一手法
- 2000-FI-59-3 / 2000-DD-24-3 ハイパーリンクとアンカーテキストを利用した情報検索とランキングの一手法
- サーチエンジンの検索結果のマルチレベル・グルーピングの評価(特集●インターネット)
- サーチエンジンへの問い合わせの解析
- Unicodeを用いたN-gram索引の一実現方式とその評価
- サーチエンジンへの問い合わせの解析
- Unicodeを用いたN-gram索引の一実現方式とその評価
- ブロードバンドの需要と消費者行動の理論,そして供給速度から分析する 韓国でADSLが突出して普及した理由
- 第1章 xDSL,CATV,FTTH,移動体通信,ギガビットイーサネットからSONET/SDH,DWDMまで 高速ネットワーク技術の基礎 (特集 アクセス系からバックボーン系,ローカルネット系まで ブロードバンド時代の高速ネットワーク技術)
- TCPにおける再送タイムアウトに関する一考察
- 長距離超高速インターネット(4) : ボトルネック
- 長距離超高速インターネット(3) : 特性解析
- 第1章 インターネットの基本となるプロトコルを理解する TCP/IPの基礎と現状 (特集 ネットワークの基礎から音声通話への応用まで TCP/IPの現在とVoIP技術の全貌)
- ブロードバンドからポスト・ブロードバンドを生き抜くベンチャーのためのバイブル (特集 ブロードバンド人の心得)
- Frame Switching 方式による通信インタフェースの実現と評価 : SONET-LAN
- 超高速データ通信方式 Frame Switching の概要 : Frame-over-SONET/SDH (version 1)
- 次世代情報検索インフラストラクチャIngrid (特集 インタ-ネット上の情報検索技術)
- 特集「ネットワークが創発する知能」の編集にあたって
- Webサーチエンジン技術の高度化 (「Webシステムにおける情報獲得支援技術」)
- NueLindaモデルと自己記述による実装
- キーワードテキストに対するイベント自動判定法の提案(「コンテキストを意識した知識の利用」及び一般)
- フォロー類似度によるTwitter高次数ユーザの関係分析(第3回集合知シンポジウム)
- VSY-1-KL 膵腫瘍に対する縮小手術(VSY-1 ビデオシンポジウム(1)膵の縮小手術-その適応と問題点-,第112回日本外科学会定期学術集会)
- 創発された系への意図的介入の可能性に関する考察
- "ネットワーク"の科学(複雑系と集合知)
- 特徴抽出を目的とした文書クラスタからの一貫性阻害要素除去
- キーワードテキストに対するイベント自動判定法の提案
- 震災時におけるTwitterのリツイート分析(「Webインテリジェンス」及び一般)
- F-021 Mentionツイートからのバースト期間の抽出(Web情報処理,F分野:人工知能・ゲーム)
- Webからの行動プロセス抽出手法の提案(「コンテキストを意識した知識の利用」及び一般)
- 状況に依存した行動パターン抽出手法の検討(文書分類・行動パターン抽出,ビッグデータを対象とした管理・情報検索・知識獲得及び一般)
- 震災時における Twitter のリツイート分析