大規模データを対象とした文書情報集約データベースと評判分析サービスにおける検証(データ工学,Web情報システム)
スポンサーリンク
概要
- 論文の詳細を見る
Webから得られる様々な情報の中には,会社や製品の評判や競合他社の動向などのように,多数の文書の中の情報の断片(情報要素)を集約して初めて得られるものも数多く存在する.本論文では,このような情報要素の集約タスクへの適用を目的とした文書情報集約データベースの基本アーキテクチャを提案する.本データベースでは,大規模文書データに含まれる各情報要素をタプルとする単一の仮想的なリレーションを生成し,そこへの問合せによって,集約タスクを実施可能とする.特に,事前に抽出した情報と入力キーワードとを用いた情報要素タプルの動的生成手法,及び通常の全文検索エンジンを用いた実現方法を述べる.本データベースを評判情報の集約を行う実サービスに適用し,情報要素リレーションへの簡易な問合せによって,様々な有用な情報集約結果を取得できることを示す.また,情報要素タプルの動的生成によって,ユーザが入力した分析の対象となるキーワードが未知語であったとしても,リアルタイムに情報集約結果を生成できることを示す.更に,本アーキテクチャが他の情報集約タスクにも適用可能な汎用性をもつものであることを述べる.
- 2012-02-01
著者
-
福田 浩章
慶應義塾大学大学院理工学研究科
-
山本 喜一
慶應義塾大学大学院理工学研究科
-
山本 喜一
慶應義塾大学理工学研究科 開放環境科学専攻
-
富田 準二
NTTレゾナント株式会社
-
山本 喜一
慶應義塾インフォメーションテクノロジーセンター
-
松尾 義博
日本電信電話株式会社NTTサイバースペース研究所
-
富田 準二
NTT情報通信研究所
-
山本 喜一
慶應義塾大学
関連論文
- AspectFX:アスペクト指向によるRIA開発での協業を支援するフレームワーク(開発環境,インターネット技術とその応用論文)
- 特徴的部分文字列と共起情報を用いた固有表現の詳細ラベル付与 (言語理解とコミュニケーション)
- 音声認識を用いたマルチメディアコンテンツのインデクシング
- gooを支える検索技術(マルチメディアとWeb検索,Webとデータベースに関する技術報告)
- ソフトウェアの標準化(標準化よもやま話8)
- D-13-2 動的エージェント構成機構を応用した情報検索システム
- 共生・寄生エージェントモデルに基づく交渉プロトコルマネージャ
- エージェントのための対話プランニング
- 共生・寄生エージェント・モデルに基づく移動エージェントの設計と実装
- エージェントの動的拡張のためのエージェント構成機構の提案
- 1B-5 大規模RIAアプリケーション開発を支援するシステム(要求,開発手法,開発環境,一般セッション,ソフトウェア科学・工学)
- MobileStart : アプリケーションのシームレスな実行を支援するシステム(ミドルウェア,シームレスコンピューティングとその応用技術)
- MobileStart : アプリケーションのシームレスな実行を支援するシステム
- Mobicom : 部分的な移動性をもつアプリケーションを実現するためのフレームワーク(オフィスインフォメーションシステム応用,次世代ワークスタイル論文)
- SmartMobile : アプリケーションの部分的なオンデマンドローディングを支援するフレームワーク(ブロードバンドユビキタスネットワーク時代におけるインターネットアーキテクチャ論文)
- XFW:アドレス偽造に対応したオープンスペース用ネットワークアクセスサービスの実装と導入(モバイルコンピューティング,ユビキタス社会を支えるコンピュータセキュリティ技術)
- 情報処理学会創立40周年記念展示会 情報技術のエポック展報告
- ソフトウェアプロセスの新しい時代に向けて : プロセスワーキンググループが目指すもの
- 特徴的部分文字列と共起情報を用いた固有表現の詳細ラベル付与
- 順序保存ダイジェスト法によるWebページ間の部分複製検出
- 文脈的素性を用いた固有表現間の関係性判定
- リッチアノテーション : 固有表現に焦点をあてた知識抽出の試み(情報抽出(テーマセッション2))
- リッチアノテーション : 固有表現に焦点をあてた知識抽出の試み(情報抽出(テーマセッション2))
- 3D-7 地理的距離と有名度を用いた地名の曖昧性解消(自然言語処理,一般セッション,人工知能と認知科学)
- Web2.0時代の名寄せを実現する国有表現グラウンデイング技術 (特集 ポータルサービスを支える自然言語処理技術)
- テキストからの知識抽出による新しいWeb情報アクセスに向けて (特集 ポータルサービスを支える自然言語処理技術)
- D-12-67 「領域抽出不要型文字認識」に基づく景観中単語認識(D-12. パターン認識・メディア理解, 情報・システム2)
- 大語彙連続音声認識を用いた音声・映像コンテンツのインデクシング
- クロス言語情報検索と多言語情報アクセスシステム (特集論文1 高度検索技術)
- 対訳関係のないコーパスからの複合名詞対訳表現の獲得
- 音声認識・言語処理の適用によるコンテンツ内容記述メタデータの生成 (特集 メタデータ応用サービスおよび関連技術の動向)
- 特集「情報の可視化」の編集にあたって ( 情報の可視化)
- Motion Groove : ライブステージ演出ツール
- 自動マクロ生成系における誤りや不要な操作を含む操作履歴からの繰返しパターンの検出
- ファクトベースを用いたヘルプドキュメントの生成(開発支援環境・自動化技術,ソフトウェア工学の理論と実践)
- 多機能ソフトウェアのオンラインチュータリングのための状況依存型作業プランニング
- 免疫的手法を用いた通信網管理用ポリシの選択手法(情報検索)
- 免疫的手法を用いた通信網管理用ポリシの選択手法
- 2.ドキュメンテーション技術の標準化
- 1.ソフトウェア技術の現状とISOの標準化活動の役割
- 分類と階層化に基づく情報提供エージェントの実現
- グラフアルゴリズムアニメーション with AATT
- 引用文献の同定
- テキストエディタにおける能動的ヘルプシステム
- 電子展覧会の演出
- 将棋の序盤戦における知識を利用した着手決定
- オブジェクト指向とシミュレーション (オブジェクト指向プログラミング)
- 3. 標準化の状況 3.2 アイコン (ソフトウェア工学における標準化動向)
- 共生・寄生モデルにおけるモーバイルエージェントに対するデバッガ
- エージェントの戦略的プランニング機構
- 主題グラフ及び関連度情報からの単語重要度付与を用いた情報検索システムの提案
- 主題グラフ及び関連度情報からの単語重要度付与を用いた情報検索システムの提案
- 移動エージェントのための共生・寄生モデル
- 転移学習による抽出型要約の精度向上
- 転移学習による抽出型要約の精度向上
- 寄生モデルによるマルチエージェント協調プロトコルの動的拡張
- 拡張可能なエージェントのための共生・寄生モデル
- 離散型シミュレーション言語の現状と将来の展望(2) : SIMULA, SIMSCRIPTによるモデル化
- 離散型シミュレーション言語の現状と将来の展望(1) : GPSS によるモデル化
- Motion Groove : ライブステージ演出ツール
- 大規模データを対象とした文書情報集約データベースと評判分析サービスにおける検証(データ工学,Web情報システム)
- 多義性を考慮した拡張固有表現のクラス判定手法 (データベース Vol.4 No.4)
- トピック情報を用いたブートストラップ法に基づく語彙獲得
- 語彙と文脈情報を用いた反義の詳細クラス分類
- GPSS処理系の比較
- 9. SIMULA (プログラミング言語の最近の動向)
- Evaluative Text Summarization Model with Sentence Extraction and Ordering