階層的オートタギング技術とその応用
スポンサーリンク
概要
- 論文の詳細を見る
本論文では,カテゴリ・主題・キーワードという異なる意味抽象度のタグを文書へ自動的に付与する階層的オートタギング技術について論じる.本技術は,タグ未付与のあらかじめカテゴリ分けされた入力文書集合から,各カテゴリの主な話題を表す主題語を自動的に発見し,各入力文書に対して,文書分類によるカテゴリ・主題タグの付与と,単語抽出によるキーワードタグの付与を行う.本論文では, Q&A コミュニティ 「教えて!goo」 と Q&A 検索サービス 「QA.ON/OFF」 への本技術の導入事例を紹介する.そして新たに,文書構造を考慮したキーワードタグ抽出法の提案と,主題語の抽出精度の評価,応用事例の利用者を対象に行った被験者実験によるタギング精度の評価を実施し,各技術要素が従来手法に比べて優れた性能を示したことを報告する.
- 2013-01-23
著者
-
藤村 考
日本電信電話株式会社NTTサイバーソリューション研究所
-
内山 匡
日本電信電話株式会社NTTサイバーソリューション研究所
-
藤村 滋
NTTサイバーソリューション研究所
-
星出 高秀
日本電信電話株式会社 Nttサイバーソリューション研究所
-
藤村 考
日本電信電話株式会社nttサービスエボリューション研究所|現在 大妻女子大学社会情報学部
-
西田 京介
日本電信電話株式会社nttサービスエボリューション研究所
-
藤村 考
日本電信電話株式会社NTTサービスエボリューション研究所|現在,大妻女子大学社会情報学部
-
西田 京介
日本電信電話株式会社NTTサイバーソリューション研究所
-
藤村 考
大妻女子大学社会情報学部:日本電信電話株式会社NTTサイバーソリューション研究所
-
藤村 考
日本電信電話株式会社 サイバーソリューション研究所
-
内山 匡
日本電信電話株式会社 NTT サービスエボリューション研究所
関連論文
- コメント・トラックバック分析に基づくブログ記事の影響度判定(Webマイニング,情報爆発論文)
- 階層的オートタギングによるQ&Aコミュニティの知識整理
- 音楽嗜好の拡大を促すアーティスト推薦(ライフインテリジェンス,デジタルドキュメント,一般2,知識の共有・伝承・知的活用に関するシステム・技術,一般)
- 医療分野に特化した概念ベースによるDPCコーディング (医用画像)
- 写真共有サイトにおけるジオタグ情報を利用したトラベルルート推薦 (ライフインテリジェンスとオフィス情報システム)
- BLOGRAGNER TGに装備されたブログマイニング技術と可視化技術(「Webインテリジェンス」及び一般)
- D-4-2 大規模タグクラウドを地形図として可視化するTopigraphy(D-4. データ工学,一般セッション)
- QAコミュニティの成長パターンに基づく回答者への質問推薦
- ブログ記事の反響特性分析 (特集 いまだかつてない検索サービス実現に向けたWebコンピューティング技術)
- QAサイトにおける質問応答グラフの成長パターン分析(セッション7a:Web解析)
- QAサイトにおける質問応答グラフの成長パターン分析
- コンテンツ検索のインタフェース
- 比較評価情報を用いたオブジェクトのランキング手法 (特集 いまだかつてない検索サービス実現に向けたWebコンピューティング技術)
- マルチスペクトル撮影による光源スペクトルの計測(画像認識,コンピュータビジョン)
- 単語概念ベクトルを用いた文書群からの代表語抽出(テーマ,膨大なデータから学ぶもの)
- ウェブ検索を利用したしきい値選択型テキストセグメンテーション(jDBワークショップ)
- 目的指向型ブログ検索システムBLOGRANGERの提案およびユーザ評価
- グラフ分析を利用した文書集合からの話題構造マイニング(テキストマイニング,データ工学論文)
- αダイバージェンスに基づく単語連想と文書分類への適用(テーマ関連セッション3,コンピュータビジョンとパターン認識のための学習理論)
- 音楽嗜好の拡大を促すアーティスト推薦
- マルチファセット型ブログ検索システムBLOGRANGERの開発(オフィスインフォメーションシステム及び一般)
- 大規模テキストからの経験マイニング(テキストマイニング,データ工学論文)
- 医療分野に特化した概念ベースによるDPCコーディング(一般,First Person Visionのための認識・理解)
- 競合学習を用いたエントロピー最小基準クラスタリング法(一般,First Person Visionのための認識・理解)
- 全単語間共起を考慮した概念ベース生成手法(一般,First Person Visionのための認識・理解)
- コメント・トラックバック分析に基づくブログ記事の影響度判定
- αダイバージェンスに基づく単語連想と文書分類への適用(テーマ関連セッション3)
- 単語概念ベクトルを用いた文書群からの代表語抽出(テーマ,膨大なデータから学ぶもの)
- ウェブ検索を利用したしきい値選択型テキストセグメンテーション(jDBワークショップ)
- QAコミュニティにおける複数情報源を用いた効果的な質問推薦
- Topigraphy Project (特集 「見る・見せる」技術の最先端)
- ブログに記述された不満表現からの潜在ニーズの発見 (ライフインテリジェンスとオフィス情報システム)
- 固有楕円ポテンシャルを利用したラベル付きグラフ可視化の座標計算
- 固有楕円ポテンシャルを利用したラベル付きグラフ可視化の座標計算
- 固有楕円ポテンシャルを利用したラベル付きグラフ可視化の座標計算
- ブログマイニングによるマーケットシェア推定 : ブログと既存統計指標の関係の分析(オフィスインフォメーションシステム,グループウェア及び一般)
- ブログマイニングによるマーケットシェア推定 : ブログと既存統計指標の関係の分析(オフィスインフォメーションシステム,グループウェア及び一般)
- レビュー記事群を用いた消費行動要因のマイニング
- POSデータの仮想地形図による可視化(不均質なライフログからのデータマイニング及び一般)
- 医療分野に特化した概念ベースによるDPCコーディング(一般,First Person Visionのための認識・理解)
- 医療分野に特化した概念ベースによるDPCコーディング(一般,First Person Visionのための認識・理解)
- 競合学習を用いたエントロピー最小基準クラスタリング法(一般,First Person Visionのための認識・理解)
- 競合学習を用いたエントロピー最小基準クラスタリング法(一般,First Person Visionのための認識・理解)
- 時刻情報を考慮したロケーションベースドサービス(LBS)によるコンテンツ表示インタフェースについて(システム開発,ライフログ活用技術,オフィス情報システム,情報通信マネジメント,一般)
- ブログに記述された不満表現からの潜在ニーズの発見
- 全単語間共起を考慮した概念ベース生成手法(一般,First Person Visionのための認識・理解)
- 写真共有サイトにおけるジオタグ情報を利用したトラベルルート推薦(不均質なライフログからのデータマイニング及び一般)
- MyBoom:Wikipediaに基づくWeb閲覧履歴からの興味情報推薦システム(不均質なライフログからのデータマイニング及び一般)
- ソーシャルメディアのマイニングと可視化 (第17回社会情報システム学シンポジウム ソーシャルメディア)
- 複数観点提示による書籍検索インタフェースを用いた書籍探索行動の分析 (第17回社会情報システム学シンポジウム ソーシャルメディア) -- (一般セッション講演 ソーシャルメディア)
- D-4-11 Web文書からの軽量な本文抽出法(D-4. データ工学,一般セッション)
- Wikipediaを用いたWeb閲覧履歴からのキーワードプロファイル抽出とその応用(jDBワークショップ)
- Wikipediaを用いたWeb閲覧履歴からのキーワードプロファイル抽出とその応用(jDBワークショップ)
- 2000-CSEC-10-34 権利を階層的に定義可能な権利情報定義言語:XML Ticket
- ISEC2000-56 権利を階層的に定義可能な権利情報定義言語:XML Ticket
- 1S-6 電子チケット流通制御方式
- ウェブ検索を利用したしきい値選択型テキストセグメンテーション
- 3D-6 絵文字を考慮したテキスト解析の研究(自然言語処理(1),一般セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- Blogのタグ間類似度のスコアリング
- リスト構造の種類に着目した非構造的な羅列型Webページからの情報抽出(オフィスインフォメーションシステム及び一般)
- コミュニティ抽出のためのクエリ共起語のクラスタリングに関する一考察(オフィスインフォメーションシステム及び一般)
- ネット上のコミュニティにおける情報の評判計算アルゴリズムEigenRumor(コミュニティウェア)
- ネット上のコミュニティにおける情報の評判計算アルゴリズムEigenRumor(セッション2 : コミュニティウェア)
- ネット上のコミュニティにおける情報の評判計算アルゴリズムEigenRumor
- マルチメディアサ-ビスのサ-ビスオ-ダ管理機能の設計と実装 (マルチメディアサ-ビスを開発するための共通プラットフォ-ム)
- マルチベンダ環境における共通アプリケ-ション・プログラム・インタフェ-スとその特徴 (MIAの開発)
- 単語・意味属性間共起に基づくコーパス概念ベースの生成方式
- 全単語間共起を考慮した概念ベース生成手法(一般,First Person Visionのための認識・理解)
- 学習データのクラスタリングを用いた文書分類(手法検討,ライフログ活用技術,オフィス情報システム,ライフインテリジェンス)
- 局所構造を考慮したブログネットワークの分析(ウェブ情報とデータベースに関して(ポスター講演))
- トランザクション・スクリプト記述言語STDL
- ユーザによる情報投稿/評価実績を利用した情報信用度評価方式
- マーカレス拡張書籍のための2次元文字ブロック検索手法
- 要因語辞書と出現位置を用いた消費行動要因分析
- 複数観点からのコンテンツ列挙型書籍検索インタフェース
- 医療分野に特化した概念ベースによるDPCコーディング
- 写真共有サイトにおけるジオタグ情報を利用したトラベルルート推薦
- D-9-7 CGM活用型大規模コンテンツ可視化システム『どれみる?マップ』の構築と公開について(D-9. オフィスインフォメーションシステム,一般セッション)
- ブログに記述された不満表現からの潜在ニーズの発見
- 要因語辞書と出現位置を用いた消費行動要因分析(ログ活用・情報検索,グループウェアとネットワーク,ライフログ活用技術,一般)
- Web検索ログを用いた特定の話題における関心事分析(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 文書クラスタリングアルゴリズムと基準の比較(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- Web検索ログを用いた特定の話題における関心事分析(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 文書クラスタリングアルゴリズムと基準の比較(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- ソーシャルメディアを用いた個人向け旅行プランの自動生成(デジタルドキュメント,ライフログ活用技術,オフィス情報システム,一般)
- コンテンツ検索のインタフェース
- 招待講演 HTML5を用いたストリーミングデータのグラフ可視化 (人工知能と知識処理)
- データ圧縮によるツイート話題分類
- 競合学習を用いた情報理論的クラスタリング(人工知能,データマイニング)
- 階層的オートタギング技術とその応用
- マーカレス拡張書籍のための2次元文字ブロック検索手法 (特集 インタラクションの基盤技術、デザインおよび応用)
- ソーシャルグラフを利用したユーザ属性の推定によるTwitterからのブランド特徴分析(ライフログと分析,グループウェアとネットワーク,ライフログ活用技術,オフィス情報システム,セキュリティ心理学とトラスト,一般)
- 行動範囲と興味の同時推定モデルによる地域情報推薦
- 競合学習を用いた情報理論的クラスタリング
- 単語概念ベクトルを用いた文書群からの代表語抽出
- HTML5を用いたストリーミングデータのグラフ可視化(「Webインテリジェンス」及び一般)
- BLOGRAGNER TGに装備されたブログマイニング技術と可視化技術
- 単語概念ベクトルを用いた文書群からの代表語抽出
- マルコフ確率場を用いたソーシャルネットワークからのユーザ属性推定(人工知能,データマイニング,インターネット技術とその応用論文)
- モニター調査型ログ収集による競合サイト間の比較分析(ログ分析と推定,ライフログ活用技術,オフィスインフォメーションシステム,ライフインテリジェンス,及び一般)