大規模テキストからの経験マイニング(テキストマイニング,<特集>データ工学論文)
スポンサーリンク
概要
- 論文の詳細を見る
大規模ブログデータから,人間の経験に関する興味深い知識を発見する経験マイニング手法を提案する.経験とは,状況(時間,空間),行動(動作,対象),主観(評価,感情)とから成る情報であると定義する.一般に,人間の行動や,その行動を起こした結果として人間が抱く感情は,時間的・空間的要因によって規定されるため,状況,行動,主観との間には一定のルールが存在する.このルールの中でも特に,状況(時間,空間)に特有な行動と感情を表現するものを人間の経験に関する興味深い知識として発見する.本論文では,5属性(時間,空間,動作,対象,感情)を大規模ブログデータから抽出し,更に,得られた経験情報の中から,データマイニング分野で提案されているルールの"興味深さ"指標を用いた相関ルール抽出を行うことで,このような知識を発見する手法を述べる.また,感情属性に基づき,経験が動作主にとって成功だったのか,それとも失敗だったのかを導き出す手法も述べる.提案手法を実装したシステムにより約4,800万件のブログから知識発見を試みた結果,状況に特有な行動と感情を表現するルールの発見に至った.
- 2009-03-01
著者
-
藤村 考
日本電信電話株式会社NTTサイバーソリューション研究所
-
奥田 英範
日本電信電話株式会社 NTTサイバーソリューション研究所
-
奥田 英範
日本電信電話株式会社nttサイバーソリューション研究所
-
倉島 健
日本電信電話株式会社NTTサイバーソリューション研究所
-
藤村 考
日本電信電話株式会社nttサービスエボリューション研究所|現在 大妻女子大学社会情報学部
-
藤村 考
大妻女子大学社会情報学部:日本電信電話株式会社NTTサイバーソリューション研究所
-
藤村 考
日本電信電話株式会社 サイバーソリューション研究所
関連論文
- コメント・トラックバック分析に基づくブログ記事の影響度判定(Webマイニング,情報爆発論文)
- 階層的オートタギングによるQ&Aコミュニティの知識整理
- 音楽嗜好の拡大を促すアーティスト推薦(ライフインテリジェンス,デジタルドキュメント,一般2,知識の共有・伝承・知的活用に関するシステム・技術,一般)
- 写真共有サイトにおけるジオタグ情報を利用したトラベルルート推薦 (ライフインテリジェンスとオフィス情報システム)
- BLOGRAGNER TGに装備されたブログマイニング技術と可視化技術(「Webインテリジェンス」及び一般)
- D-4-2 大規模タグクラウドを地形図として可視化するTopigraphy(D-4. データ工学,一般セッション)
- QAコミュニティの成長パターンに基づく回答者への質問推薦
- ブログ記事の反響特性分析 (特集 いまだかつてない検索サービス実現に向けたWebコンピューティング技術)
- QAサイトにおける質問応答グラフの成長パターン分析(セッション7a:Web解析)
- E-012 ブログからの未来に関する表現の抽出(自然言語・音声・音楽,一般論文)
- 読者に影響を与えるブログ記事発見手法(セッション1:web・ブックマーク)
- QAサイトにおける質問応答グラフの成長パターン分析
- 単語出現の意外性に基づく話題性評価方法(評判分析・文脈解析)
- ブログ文書集合を用いた省略語抽出手法の検討(夏のデータベースワークショップ2007(データ工学,一般))
- ブログ文書集合を用いた省略語抽出手法の検討(SNS・blog,夏のデータベースワークショップ2007(データ工学,一般))
- ブログ発信者の特徴を利用した話題抽出手法
- 俯瞰的アプローチに基づく情報場ナビゲーション技術 (特集 次世代ポータル技術)
- blogページ集合に対する話題語句抽出手法(分類, ブログ)
- blogページ集合に対する話題語句抽出手法(分類, ブログ)
- コンテンツ検索のインタフェース
- 比較評価情報を用いたオブジェクトのランキング手法 (特集 いまだかつてない検索サービス実現に向けたWebコンピューティング技術)
- Blogからの体験情報抽出(Webインテリジェンス,情報洪水時代のネットワークサービス)
- 目的指向型ブログ検索システムBLOGRANGERの提案およびユーザ評価
- 血管特徴を用いた眼底画像合成法(画像認識,コンピュータビジョン)
- グラフ分析を利用した文書集合からの話題構造マイニング(テキストマイニング,データ工学論文)
- 音楽嗜好の拡大を促すアーティスト推薦
- マルチファセット型ブログ検索システムBLOGRANGERの開発(オフィスインフォメーションシステム及び一般)
- 大規模テキストからの経験マイニング(テキストマイニング,データ工学論文)
- コメント・トラックバック分析に基づくブログ記事の影響度判定
- 意見分析エンジン-計算言語学と社会学の接点-, 大塚裕子, 乾 孝司, 奥村 学(共著), コロナ社(2007-10), A5判, 定価(本体2,600円+税)
- QAコミュニティにおける複数情報源を用いた効果的な質問推薦
- ウェブ検索に基づくテキストセグメンテーション(データマイニング)
- ブログの視覚化によるナビゲーションシステム(オフィスインフォメーションシステム,ディジタルドキュメント、一般)
- ブログの視覚化によるナビゲーションシステム(オフィスインフォメーションシステム,ディジタルドキュメント、一般)
- 吉川榮和(編著), 仲谷善雄, 下田宏, 丹羽雄二(共著), "ヒューマンインタフェースの心理と生理", コロナ社, (2006-03), A5判, 定価(本体2,500円+税)
- Topigraphy Project (特集 「見る・見せる」技術の最先端)
- ブログに記述された不満表現からの潜在ニーズの発見 (ライフインテリジェンスとオフィス情報システム)
- 固有楕円ポテンシャルを利用したラベル付きグラフ可視化の座標計算
- 固有楕円ポテンシャルを利用したラベル付きグラフ可視化の座標計算
- 固有楕円ポテンシャルを利用したラベル付きグラフ可視化の座標計算
- ブログマイニングによるマーケットシェア推定 : ブログと既存統計指標の関係の分析(オフィスインフォメーションシステム,グループウェア及び一般)
- ブログマイニングによるマーケットシェア推定 : ブログと既存統計指標の関係の分析(オフィスインフォメーションシステム,グループウェア及び一般)
- レビュー記事群を用いた消費行動要因のマイニング
- POSデータの仮想地形図による可視化(不均質なライフログからのデータマイニング及び一般)
- ブログに記述された不満表現からの潜在ニーズの発見
- 写真共有サイトにおけるジオタグ情報を利用したトラベルルート推薦(不均質なライフログからのデータマイニング及び一般)
- ソーシャルメディアのマイニングと可視化 (第17回社会情報システム学シンポジウム ソーシャルメディア)
- 複数観点提示による書籍検索インタフェースを用いた書籍探索行動の分析 (第17回社会情報システム学シンポジウム ソーシャルメディア) -- (一般セッション講演 ソーシャルメディア)
- 2000-CSEC-10-34 権利を階層的に定義可能な権利情報定義言語:XML Ticket
- ISEC2000-56 権利を階層的に定義可能な権利情報定義言語:XML Ticket
- 1S-6 電子チケット流通制御方式
- Blogのタグ間類似度のスコアリング
- リスト構造の種類に着目した非構造的な羅列型Webページからの情報抽出(オフィスインフォメーションシステム及び一般)
- コミュニティ抽出のためのクエリ共起語のクラスタリングに関する一考察(オフィスインフォメーションシステム及び一般)
- ネット上のコミュニティにおける情報の評判計算アルゴリズムEigenRumor(コミュニティウェア)
- ネット上のコミュニティにおける情報の評判計算アルゴリズムEigenRumor(セッション2 : コミュニティウェア)
- ネット上のコミュニティにおける情報の評判計算アルゴリズムEigenRumor
- マルチメディアサ-ビスのサ-ビスオ-ダ管理機能の設計と実装 (マルチメディアサ-ビスを開発するための共通プラットフォ-ム)
- マルチベンダ環境における共通アプリケ-ション・プログラム・インタフェ-スとその特徴 (MIAの開発)
- 局所構造を考慮したブログネットワークの分析(ウェブ情報とデータベースに関して(ポスター講演))
- 人々の経験を活かすための経験マイニング(jDBワークショップ)
- 人々の経験を活かすための経験マイニング(jDBワークショップ)
- トランザクション・スクリプト記述言語STDL
- ユーザによる情報投稿/評価実績を利用した情報信用度評価方式
- 電子権利流通基盤のための汎用的な原本性保証方式(21世紀のコンピュータセキュリティ技術)
- 柔軟な電子商取引を実現する権利流通システム (特集論文2 暗号--応用技術)
- 拡張トランザクションモデルに基づくサービス連携方式
- マーカレス拡張書籍のための2次元文字ブロック検索手法
- 要因語辞書と出現位置を用いた消費行動要因分析
- 複数観点からのコンテンツ列挙型書籍検索インタフェース
- 写真共有サイトにおけるジオタグ情報を利用したトラベルルート推薦
- ソーシャルメディアを用いた個人向け旅行プランの自動生成 (ライフインテリジェンスとオフィス情報システム)
- ブログに記述された不満表現からの潜在ニーズの発見
- ビジネスオブジェクトのサービスオペレーションへの適用
- 要因語辞書と出現位置を用いた消費行動要因分析(ログ活用・情報検索,グループウェアとネットワーク,ライフログ活用技術,一般)
- Web検索ログを用いた特定の話題における関心事分析(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 文書クラスタリングアルゴリズムと基準の比較(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- Web検索ログを用いた特定の話題における関心事分析(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 文書クラスタリングアルゴリズムと基準の比較(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- ソーシャルメディアを用いた個人向け旅行プランの自動生成(デジタルドキュメント,ライフログ活用技術,オフィス情報システム,一般)
- コンテンツ検索のインタフェース
- 招待講演 HTML5を用いたストリーミングデータのグラフ可視化 (人工知能と知識処理)
- データ圧縮によるツイート話題分類
- 競合学習を用いた情報理論的クラスタリング(人工知能,データマイニング)
- 階層的オートタギング技術とその応用
- マーカレス拡張書籍のための2次元文字ブロック検索手法 (特集 インタラクションの基盤技術、デザインおよび応用)
- ソーシャルグラフを利用したユーザ属性の推定によるTwitterからのブランド特徴分析(ライフログと分析,グループウェアとネットワーク,ライフログ活用技術,オフィス情報システム,セキュリティ心理学とトラスト,一般)
- 行動範囲と興味の同時推定モデルによる地域情報推薦
- 競合学習を用いた情報理論的クラスタリング
- HTML5を用いたストリーミングデータのグラフ可視化(「Webインテリジェンス」及び一般)
- BLOGRAGNER TGに装備されたブログマイニング技術と可視化技術
- モニター調査型ログ収集による競合サイト間の比較分析(ログ分析と推定,ライフログ活用技術,オフィスインフォメーションシステム,ライフインテリジェンス,及び一般)
- 音声認識機能を有するWebアプリケーションの実装と評価
- 音声認識機能を有するWebアプリケーションの実装と評価