オブジェクト識別におけるクラスタ数決定方式(情報検索,<特集>データ工学論文)
スポンサーリンク
概要
- 論文の詳細を見る
人名のあいまい性解消に代表されるオブジェクト識別は,通常対象の名前を含むデータをクラスタリングすることで解決される.多くのクラスタリングアルゴリズムはあらかじめユーザがクラスタ数をパラメータとして指定する必要がある.しかし,オブジェクト識別においては,名前によって対応するオブジェクト数が大きく異なるため,適切なクラスタ数を決定することが困難である.例として,文献データベースにおいては,各省略名に対応するオブジェクト数(フルネーム数)がべき乗分布し,非常にひずんだ分散の大きな分布をしていることを示す.クラスタ数を精度良く予測するため,我々はクラスタ数が既知の問題を訓練集合として用いる教師付き学習のアプローチを採用する.ひずんだ分布をする目的変数を扱うため,我々は2段階の学習方式及び説明変数の高次の組合せを用いる方式を提案する.評価実験により,提案手法が既存のヒューリスティックな方式に比べてクラスタ数を精度良く決定できることを示す.
- 社団法人電子情報通信学会の論文
- 2008-03-01
著者
-
小山 聡
京都大学大学院情報学研究科社会情報学専攻
-
田中 克己
京都大学大学院情報学研究科社会情報学専攻
-
田中 克己
情報通信研究機構
-
田中 克己
京都大学大学院
-
田中 克己
独立行政法人情報通信研究機構情報通信部門メディアインタラクショングループ
-
小山 聡
北海道大学大学院情報科学研究科複合情報学専攻
関連論文
- 人物情報辞典の自動生成のための時系列情報自動収集(ウェブ属性抽出,夏のデータベースワークショップDBWS 2006)
- 人物情報辞典の自動生成のための時系列情報自動収集(ウェブ属性抽出)
- ページ中の感覚情報を利用したウェブ検索支援(セッション4)
- 単語の印象を考慮した言い換え処理に基づくクエリ展開(一般セッション(1),データ工学とメディア理解との融合)
- 印象に基づく動画検索(セッション4,あったかいインタラクション)
- 通信コンテンツと放送コンテンツの融合
- 文字アニメーションの自動合成の試み(セッション5: インタフェース一般(2), 高齢者/子どものためのインタフェースおよび一般)
- ウェブ化ビデオ : クロスメディア情報統合のためのテレビ番組のメディア変換方式(テーマセッション: 映像インデクシング, データ工学とメディア理解との融合)
- D-4-10 ウェブ化ビデオ : 映像とメタデータのウェブ化の概念の提案(D-4. データ工学)
- ウェブ化ビデオ : 映像とメタデータのウェブ化(セッション2 : 映像・コンテンツの生成)
- 重要なblogger発見を目的としたblogスレッド解析手法
- Blogスレッドの解析に基づく重要なbloggerの発見 : Blogスレッド形成におけるTrackbackの影響に関する考察(blog, 夏のデータベースワークショップDBWS2005)
- Blogスレッドの解析に基づく重要なbloggerの発見 : Blogスレッド形成におけるTrackbackの影響に関する考察(Webログ, 夏のデータベースワークショップ2005)
- BlogSafari : 動物メタファを用いたBlogブラウジング(インタフェース)(夏のデータベースワークショップDBWS2004)
- D-049 2種類の共起情報を用いた語彙的言い換えに基づくWeb検索(D分野:データベース)
- 記事の印象を伝達するニュース番組生成システムwEEの設計と評価(コンテンツ技術,データ工学論文)
- LD_004 Fair News Reader : バランス感覚のある記事推薦方式の提案(D分野:データベース)
- LD_003 記事の印象を伝えるニュースリーダーwEEの開発と評価(D分野:データベース)
- 印象と興味に基づくユーザ選好のモデル化手法の提案とニュースサイトへの応用(Webインテリジェンスとインタラクション)
- D-005 テキスト印象マイニングに基づく質問応答システムの提案(D分野:データベース)
- LD-001 印象と興味に基づくユーザ選好のモデル化とニュースポータルサイトへの応用(D分野:データベース)
- テキスト印象抽出とWeb検索への応用(DE: コンテンツ技術, データ工学とメディア理解との融合)
- 情報爆発時代における情報管理・融合・活用基盤(情報爆発時代に向けた新しいIT基盤技術の研究)
- P2Pネットワークにおけるコンテンツ共有の文脈情報を用いた発見的検索手法の提案(P2P, 夏のデータベースワークショップDBWS2005)
- P2Pネットワークにおけるコンテンツ共有の文脈情報を用いた発見的検索手法の提案(P2P, 夏のデータベースワークショップ2005)
- 恣意的に名前付けされたオブジェクトの識別手法
- 携帯端末を用いた機器マニュアル情報の検索および自動呈示
- 対話文自動生成によるWebコンテンツの受動的視聴(セッション3A : Web1)(夏のデータベースワークショップ : DBWS2004)
- ブックマークとアノテーション共有によるグループ支援型Webブラウジング(セッション2C : コンテンツ処理)
- ブックマークとアノテーション共有によるグループ支援型Webブラウジング(コンテンツ処理)(「夏のデータベースワークショップ(DBWS2003)」一般)
- 知財化可能性の視覚化 : 登録商標データの評価基準間の相関分析に基づく知財化可能性の視覚化(夏のデータベースワークショップ2007(データ工学,一般))
- 知財化可能性の視覚化 : 登録商標データの評価基準間の相関分析に基づく知財化可能性の視覚化(情報可視化,夏のデータベースワークショップ2007(データ工学,一般))
- 3.アンビエント・ナレッジ : 実空間に融合されるディジタルコンテンツとその利用技術(シンビオティック・システムの実現に向けて-人,社会,環境,情報システムの協調系-)
- レビュアーの生活圏の特定に基づくCGM評判情報評価(夏のデータベースワークショップ2007(データ工学,一般))
- レビュアーの生活圏の特定に基づくCGM評判情報評価(SNS・blog,夏のデータベースワークショップ2007(データ工学,一般))
- アニメーションメディア変換システムInteractive e-Honにおける親子エージェント情報提示モデル(Webインテリジェンスとインタラクション)
- 関連画像集合内における典型度と特殊度を用いた画像の信憑性分析(ウェブ情報とデータベースに関して(ポスター講演))
- 1.SlothLib/EaRDB : マイサーチエンジン開発環境支援(パートII:情報分野研究者のためのオンリーワン共有イノベーションプラットフォーム,情報爆発時代におけるわくわくするITの創出を目指して)
- Rerank-by-example:編集操作の意図伝播によるウェブ検索結果のリランキング
- 4ZK-4 Web検索結果のキーワードマップにおける滑らかな重み付け操作による再ランキング(情報爆発時代におけるテキストデータ処理,学生セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 3ZK-5 ソーシャルブックマーク情報を用いたWeb検索結果の再ランキング手法とその評価(情報爆発時代におけるWeb技術およびWeb情報抽出,学生セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 6J-6 並列検索のための編集操作に基づく同期的再ランキング(情報爆発時代における情報検索・推薦技術およびWebコミュニティ分析,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 補完情報の自律型検索機能を有するWebブラウザ(夏のデータベースワークショップ2007(データ工学,一般))
- Rerank-By-Example : 編集操作の意図伝搬に基づく検索結果の網羅的閲覧(夏のデータベースワークショップ2007(データ工学,一般))
- 実世界のモノによるデジタルコンテンツ・ブックマーキングの提案(夏のデータベースワークショップ2007(データ工学,一般))
- 補完情報の自律型検索機能を有するWebブラウザ(Web技術,夏のデータベースワークショップ2007(データ工学,一般))
- Rerank-By-Example : 編集操作の意図伝搬に基づく検索結果の網羅的閲覧(ランキング,夏のデータベースワークショップ2007(データ工学,一般))
- 実世界のモノによるデジタルコンテンツ・ブックマーキングの提案(実世界データ,夏のデータベースワークショップ2007(データ工学,一般))
- Editable Web Browser : 編集操作の伝播によるウェブ閲覧支援(セッション3:インタラクションデザイン:理論と実践(3))
- イベント画像と実空間3Dモデルに基づくインタラクティブ環境デザインシステム(セッション8A : マルチメディア)(夏のデータベースワークショップ : DBWS2004)
- グループ支援型Web探索におけるナビゲーションのための既閲覧ページ群の同期化提示(インタフェース)(夏のデータベースワークショップDBWS2004)
- グループ支援型Web探索におけるナビゲーションのための既閲覧ページ群の同期化提示(セッション2A : インタフェース)(夏のデータベースワークショップ : DBWS2004)
- ページの動的再構成を行うWeb注釈付けシステムの提案
- 半構造データの差異発見・比較のためのスキーマ生成機構
- マルチメディア・コンテンツの複合化に関する意図表現と調整機構に基づくコンテンツパーソナライゼーション
- ActiveWeb : アクティブルールのXML表現に基づくWebコンテンツの個別化とアクセス管理
- Webリンクの巡行に基づく動的なリンク活性化とアクセス管理
- Web集約質問処理のための検索エンジンの関係データベースインタフェース
- Web集約質問処理のための検索エンジンの関係データベースインタフェース(夏のデータベースワークショップ2007(データ工学,一般))
- Web集約質問処理のための検索エンジンの関係データベースインタフェース(問合せ処理,夏のデータベースワークショップ2007(データ工学,一般))
- Webページのアスペクトに基づくクラスタリングとその応用
- ユーザ間の対話からのユーザプロファイル抽出と動的情報探索
- Web標識 : 巡航履歴を反映したWeb情報空間の周辺案内
- Webからの将来情報の発見・分析にむけて(セッション8b:文書管理)
- サーチエンジンのクエリログを利用した同位語・話題語の発見と可視化(履歴応用,夏のデータベースワークショップDBWS 2006)
- サーチエンジンのクエリログを利用した同位語・話題語の発見と可視化(履歴応用)
- Web情報の信憑性 (特集 情報の信頼性)
- 単語の印象を考慮した言い換え処理に基づくクエリ展開(一般セッション(1),データ工学とメディア理解との融合)
- ストリームデータの統合・フィルタリング関数とその応用
- Webページの周辺空間を同時閲覧可能な3次元型ブラウザ(ウェブ属性抽出,夏のデータベースワークショップDBWS 2006)
- 複数Webサイトからの共通属性抽出による共通サイトマップの生成(ウェブ属性抽出,夏のデータベースワークショップDBWS 2006)
- 複数Webサイトからの共通属性抽出による共通サイトマップの生成(ウェブ属性抽出)
- Webページに対する典型的なクエリの発見(夏のデータベースワークショップ2007(データ工学,一般))
- Webページに対する典型的なクエリの発見(マイニング,夏のデータベースワークショップ2007(データ工学,一般))
- Americas School on Agents and Multiagent Systems 参加報告
- コンテキストを用いたメールの情報補完(インターネット応用,夏のデータベースワークショップDBWS 2006)
- 主題語からの話題語自動抽出とこれに基づくWeb情報検索(情報抽出,夏のデータベースワークショップDBWS 2006)
- サーチエンジンのメタデータを用いたサーチ結果の信用度判断支援(ウェブDB利用,夏のデータベースワークショップDBWS 2006)
- コンテキストを用いたメールの情報補完(インターネット応用)
- 主題語からの話題語自動抽出とこれに基づくWeb情報検索(情報抽出)
- サーチエンジンのメタデータを用いたサーチ結果の信用度判断支援(ウェブDB利用)
- サーチエンジンのメタデータを用いたサーチ結果の信用度判断支援
- 関係の類似性に基づくWebからのオブジェクト名検索
- 語の共起を用いたWebからの類似関係検索(ウェブ情報とデータベースに関して(ポスター講演))
- 検索隠し味を用いた専門検索エンジンの構築
- 語の同位関連と性質の継承関連を用いた概念階層のWebからの抽出(夏のデータベースワークショップ2007(データ工学,一般))
- 語の同位関連と性質の継承関連を用いた概念階層のWebからの抽出(情報抽出および推薦,夏のデータベースワークショップ2007(データ工学,一般))
- アイデンティティを推定する(WebアイデンティティとAI)
- オブジェクト識別におけるクラスタ数決定方式(情報検索,データ工学論文)
- 属性値が時間変化するWebオブジェクトの識別・検索手法の提案(夏のデータベースワークショップ2007(データ工学,一般))
- 属性値が時間変化するWebオブジェクトの識別・検索手法の提案(Web技術,夏のデータベースワークショップ2007(データ工学,一般))
- ユーザ間の対話からのユーザプロファイル抽出と動的情報探索
- ネット上の情報を分析する技術
- 文書群を問合せとした兄弟カテゴリー文書の検索(情報検索,データ工学論文)
- Web検索エンジンのインデックスを用いた同位語とそのコンテキストの発見
- サーチエンジンのインデックスを利用した同位語検索と同位語コンテキストの発見(ウェブDB利用,夏のデータベースワークショップDBWS 2006)
- WEBコミュニティ発見のためのHITSアルゴリズムの分析と改善
- Web検索結果とその周辺情報の近似的内包表現とその視覚化(Web 1)(夏のデータベースワークショップDBWS2004)
- Web検索結果とその周辺情報の近似的内包表現とその視覚化(セッション3A : Web1)(夏のデータベースワークショップ : DBWS2004)
- 異なる例からの素性の組合せを用いたペアワイズ分類器の学習