競合学習を用いた情報理論的クラスタリング(人工知能,データマイニング)
スポンサーリンク
概要
- 論文の詳細を見る
情報理論的クラスタリング(ITC:information-theoretic clustering)は,特徴分布の類似性によりクラスタをまとめる方法である.近年,クラスタリング基準が明確化され,この基準の最適化によるITCアルゴリズムが提案された.このアルゴリズムは,k-means法においてデータが属するクラスタラベルを更新するときに評価関数としてKL(Kullback Leibler)ダイバージェンスを用いる.本論文では,この考え方に基づき,新しいアルゴリズムを提案する.提案手法は,ゼロ頻度問題を回避するため,KLダイバージェンスの代わりにその近似であるskewダイバージェンスを用い,学習アルゴリズムとしては,k-means法に対する優位性が確認されている競合学習を用いる.いくつかの実験により,提案手法はテキストデータを対象とした多クラス問題において最大マージンクラスタリングなどの既存アルゴリズムに比べて優れていることを示した.
- 2012-08-01
著者
-
藤村 考
日本電信電話株式会社NTTサイバーソリューション研究所
-
田邊 勝義
日本電信電話株式会社サイバーソリューション研究所
-
江田 毅晴
NTTサイバースペース研究所
-
内山 俊郎
日本電信電話株式会社NTTサイバーソリューション研究所
-
藤村 滋
NTTサイバーソリューション研究所
-
内山 俊郎
日本電信電話株式会社サイバーソリューション研究所
-
田邊 勝義
NTTサイバーソリューション研究所
-
田邊 勝義
日本電信電話株式会社nttサイバーソリユーション研究所
-
江田 毅晴
Ntt サイバーソリューション研
-
田邊 勝義
Ntt サイバーソリューション研
-
江田 毅晴
エヌ・ティ・ティ・コミュニケーションズ株式会社
-
田邊 勝義
名桜大学
-
藤村 考
日本電信電話株式会社nttサービスエボリューション研究所|現在 大妻女子大学社会情報学部
-
藤村 考
日本電信電話株式会社NTTサービスエボリューション研究所|現在,大妻女子大学社会情報学部
-
田邊 勝義
名桜大学国際学群
-
藤村 考
大妻女子大学社会情報学部:日本電信電話株式会社NTTサイバーソリューション研究所
-
藤村 考
日本電信電話株式会社 サイバーソリューション研究所
-
内山 俊郎
日本電信電話株式会社 サイバーソリューション研究所
関連論文
- リスト手話提示によるろう者への緊急通報の伝達(福祉工学)
- コメント・トラックバック分析に基づくブログ記事の影響度判定(Webマイニング,情報爆発論文)
- Folksonomyのタグを用いた自動分類体系構築へ向けて(夏のデータベースワークショップ2007(データ工学,一般))
- Folksonomyのタグを用いた自動分類体系構築へ向けて(クラスタリング・カテゴライズ,夏のデータベースワークショップ2007(データ工学,一般))
- 階層的オートタギングによるQ&Aコミュニティの知識整理
- 仮想マルチスペクトルカメラ表現を用いたスペクトルに基づく画像生成法 (画像符号化・映像メディア処理レター特集)
- 音楽嗜好の拡大を促すアーティスト推薦(ライフインテリジェンス,デジタルドキュメント,一般2,知識の共有・伝承・知的活用に関するシステム・技術,一般)
- 血管の接続性を考慮したパノラマ眼底画像の作成 (ビジュアルコンピューティング論文特集号)
- 仮想マルチスペクトルカメラ表現を用いたスペクトルに基づく画像生成法(画像認識,コンピュータビジョン)
- 写真共有サイトにおけるジオタグ情報を利用したトラベルルート推薦 (ライフインテリジェンスとオフィス情報システム)
- BLOGRAGNER TGに装備されたブログマイニング技術と可視化技術(「Webインテリジェンス」及び一般)
- D-4-2 大規模タグクラウドを地形図として可視化するTopigraphy(D-4. データ工学,一般セッション)
- QAコミュニティの成長パターンに基づく回答者への質問推薦
- ブログ記事の反響特性分析 (特集 いまだかつてない検索サービス実現に向けたWebコンピューティング技術)
- QAサイトにおける質問応答グラフの成長パターン分析(セッション7a:Web解析)
- QAサイトにおける質問応答グラフの成長パターン分析
- コンテンツ検索のインタフェース
- 比較評価情報を用いたオブジェクトのランキング手法 (特集 いまだかつてない検索サービス実現に向けたWebコンピューティング技術)
- Blogからの体験情報抽出(Webインテリジェンス,情報洪水時代のネットワークサービス)
- 目的指向型ブログ検索システムBLOGRANGERの提案およびユーザ評価
- 血管特徴を用いた眼底画像合成法(画像認識,コンピュータビジョン)
- グラフ分析を利用した文書集合からの話題構造マイニング(テキストマイニング,データ工学論文)
- グループトピックス 第3回 NTTコア技術シンポジウム「ポータル技術シンポジウム」開催報告
- 新しいポータルサービスの創出を目指して (特集 次世代ポータル技術)
- 手話・日本語二言語提示におけるろう者の緊急情報読取りストラテジー(福祉工学)
- 関係XMLデータベース用開発支援ツールの設計と実装(テーマセッション,データ工学とメディア理解との融合)
- 音楽嗜好の拡大を促すアーティスト推薦
- XMLデータの管理とストリーム処理に関する技術(データ工学論文)
- XML木のための動的範囲ラベル付け手法
- XMLのための動的範囲ラベル付け手法 : その評価およびXRelへの適用について
- 更新に強いXML節点数え上げ手法とその管理
- XML木のための更新に強い節点ラベル付け手法
- マルチファセット型ブログ検索システムBLOGRANGERの開発(オフィスインフォメーションシステム及び一般)
- 大規模テキストからの経験マイニング(テキストマイニング,データ工学論文)
- 競合学習を用いたエントロピー最小基準クラスタリング法(一般,First Person Visionのための認識・理解)
- コメント・トラックバック分析に基づくブログ記事の影響度判定
- リスト手話提示によるろう者への緊急通報の伝達
- 6R-6 ユーザーの検索意図を抽出する類似画像検索インターフェースの開発(自動生成・合成,学生セッション,人工知能と認知科学)
- 関係XMLデータベース用開発支援ツールの設計と実装(テーマセッション,データ工学とメディア理解との融合)
- QAコミュニティにおける複数情報源を用いた効果的な質問推薦
- 更新に強いXML節点数え上げ手法とその管理
- ウェブ検索に基づくテキストセグメンテーション(データマイニング)
- Topigraphy Project (特集 「見る・見せる」技術の最先端)
- ブログに記述された不満表現からの潜在ニーズの発見 (ライフインテリジェンスとオフィス情報システム)
- 固有楕円ポテンシャルを利用したラベル付きグラフ可視化の座標計算
- 固有楕円ポテンシャルを利用したラベル付きグラフ可視化の座標計算
- 固有楕円ポテンシャルを利用したラベル付きグラフ可視化の座標計算
- ブログマイニングによるマーケットシェア推定 : ブログと既存統計指標の関係の分析(オフィスインフォメーションシステム,グループウェア及び一般)
- ブログマイニングによるマーケットシェア推定 : ブログと既存統計指標の関係の分析(オフィスインフォメーションシステム,グループウェア及び一般)
- レビュー記事群を用いた消費行動要因のマイニング
- POSデータの仮想地形図による可視化(不均質なライフログからのデータマイニング及び一般)
- 競合学習を用いたエントロピー最小基準クラスタリング法(一般,First Person Visionのための認識・理解)
- 競合学習を用いたエントロピー最小基準クラスタリング法(一般,First Person Visionのための認識・理解)
- 時刻情報を考慮したロケーションベースドサービス(LBS)によるコンテンツ表示インタフェースについて(システム開発,ライフログ活用技術,オフィス情報システム,情報通信マネジメント,一般)
- ブログに記述された不満表現からの潜在ニーズの発見
- 写真共有サイトにおけるジオタグ情報を利用したトラベルルート推薦(不均質なライフログからのデータマイニング及び一般)
- 20-5 シームレスな眼底画像合成手法の一検討
- D-9-7 時系列を考慮したロケーションベースドシステムの提案(D-9. オフィスインフォメーションシステム,一般セッション)
- コラボレーション技術を活用したイラストデザインの作成について(手法検討,ライフログ活用技術,オフィス情報システム,ライフインテリジェンス)
- ソーシャルメディアのマイニングと可視化 (第17回社会情報システム学シンポジウム ソーシャルメディア)
- 複数観点提示による書籍検索インタフェースを用いた書籍探索行動の分析 (第17回社会情報システム学シンポジウム ソーシャルメディア) -- (一般セッション講演 ソーシャルメディア)
- 複数特徴量を統合したvisual wordsによる料理画像の分類(画像情報の分類と多重化,ドキュメントオートメーションとオンサイトデータ活用技術,及び一般)
- O-023 ロケーションベースドサービス(LBS)利用のための固有表現抽出を活用したコンテンツ位置情報付与支援方法の提案(情報システム,一般論文)
- 血管の接続性を考慮したパノラマ眼底画像の作成
- Blogのタグ間類似度のスコアリング
- リスト構造の種類に着目した非構造的な羅列型Webページからの情報抽出(オフィスインフォメーションシステム及び一般)
- コミュニティ抽出のためのクエリ共起語のクラスタリングに関する一考察(オフィスインフォメーションシステム及び一般)
- ネット上のコミュニティにおける情報の評判計算アルゴリズムEigenRumor(コミュニティウェア)
- ネット上のコミュニティにおける情報の評判計算アルゴリズムEigenRumor(セッション2 : コミュニティウェア)
- ネット上のコミュニティにおける情報の評判計算アルゴリズムEigenRumor
- マルチメディアサ-ビスのサ-ビスオ-ダ管理機能の設計と実装 (マルチメディアサ-ビスを開発するための共通プラットフォ-ム)
- マルチベンダ環境における共通アプリケ-ション・プログラム・インタフェ-スとその特徴 (MIAの開発)
- RJ-010 タグクラウドにおける感情の合図(J分野:ヒューマンコミュニケーション&インタラクション,査読付き論文)
- 血管の同心円分割を用いた眼底画像における動静脈分離の検討
- 過去画像を基準にした経時眼底画像からの血管径計測点の自動抽出
- 過去画像を基準にした経時眼底画像からの血管径計測点の自動抽出
- 過去画像を基準にした経時眼底画像からの血管径計測点の自動抽出
- マーカレス拡張書籍のための2次元文字ブロック検索手法
- 要因語辞書と出現位置を用いた消費行動要因分析
- 複数観点からのコンテンツ列挙型書籍検索インタフェース
- 曖昧性を考慮した多様なクエリ推薦
- 写真共有サイトにおけるジオタグ情報を利用したトラベルルート推薦
- 勾配ベースの画像特徴量の視認性低下を目的とする遺伝的アルゴリズムを用いた特徴選択
- ブログに記述された不満表現からの潜在ニーズの発見
- 要因語辞書と出現位置を用いた消費行動要因分析(ログ活用・情報検索,グループウェアとネットワーク,ライフログ活用技術,一般)
- インスタント質問文検索システムの提案(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- Web検索ログを用いた特定の話題における関心事分析(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 文書クラスタリングアルゴリズムと基準の比較(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- Web検索ログを用いた特定の話題における関心事分析(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 文書クラスタリングアルゴリズムと基準の比較(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- ソーシャルメディアを用いた個人向け旅行プランの自動生成(デジタルドキュメント,ライフログ活用技術,オフィス情報システム,一般)
- コンテンツ検索のインタフェース
- 招待講演 HTML5を用いたストリーミングデータのグラフ可視化 (人工知能と知識処理)
- 競合学習を用いた情報理論的クラスタリング
- 競合学習を用いた情報理論的クラスタリング(人工知能,データマイニング)
- 階層的オートタギング技術とその応用
- 景観デザイン基準に基づいた造景画像のバランス評価(画像,ライフログ活用技術,オフィスインフォメーションシステム,ライフインテリジェンス,一般)
- 行動範囲と興味の同時推定モデルによる地域情報推薦
- 競合学習を用いた情報理論的クラスタリング
- BLOGRAGNER TGに装備されたブログマイニング技術と可視化技術