RMC操作に基づくタスクとタスク間関連度を考慮したファイル検索(情報検索,<特集>データ工学と情報マネジメント論文)
スポンサーリンク
概要
- 論文の詳細を見る
近年,ファイルシステム内に格納されているデータ量の急速な増大に伴い,膨大な数のファイルの中から,必要な情報を探し出すことは困難である.これまで,全文検索によるデスクトップ検索は主なアプローチとして用いられてきたが,検索キーワードを含まないファイルが検索できない.そこで我々は全文検索によるファイル検索の結果を改善するために,個々のファイルがもつ情報に加え,関連ファイル群間の相関関係を利用する手法を提案する.ファイル間関係の抽出においては,ユーザの操作を記録したファイルアクセスログを使用している.本研究はまず,同一作業に関連するファイルは頻繁に近い時間に使用される傾向があることから,このようなファイル集合を「タスク」として抽出する.続いてファイル間の改名・移動・コピー(RMC)操作を考慮し,タスク間関連度を数値化する.プロトタイプシステムによる被験者実験により,抽出したタスクとタスク間関連度を取り入れることで,ファイル検索の結果が大きく改善されたことを確認する.
- 2013-05-01
著者
-
渡辺 陽介
東京工業大学学術国際情報センター
-
横田 治夫
東京工業大学
-
横田 治夫
東京工業大学 大学院 情報理工学研究科 計算工学専攻:東京工業大学 学術国際情報センター
-
横田 治夫
東京工業大学大学院 情報理工学研究科計算工学専攻
-
渡辺 陽介
東京工業大学 学術国際情報センター
-
呉 怡
東京工業大学大学院 情報理工学研究科計算工学専攻
-
渡辺 陽介
東京工業大学
関連論文
- 更新処理を考慮したXMLラベルにおける構造情報の抽出手法(構造化文書,XML,情報爆発論文)
- 分散ストリーム処理システムにおける高信頼化方式の提案(ストリーム処理,情報爆発論文)
- 暗号化データ格納ストレージにおける性能とセキュリティの両立(ストレージ 並列分散データベース,データ工学論文)
- Webサーチを活用したTVテロップ認識率向上手法(一般,膨大なデータから学ぶもの)
- Webサーチを活用したTVテロップ認識率向上手法(一般,膨大なデータから学ぶもの)
- 平文を生成しない分散ストレージ上での再暗号化手法の提案(セッション5c:セキュリティ・プライバシー)
- 対象情報源の動的変化を考慮した分散ストリーム処理最適化手法の提案(セッション7b:ストリーム・スカイライン)
- 大規模映像ストリームのための映像情報統合基盤システムの提案
- 講義講演シーン検索におけるレーザポインタ情報の活用法(コンテンツ技術,データ工学論文)
- 1-3. マルチメディアストレージ(1.画像エレクトロニクス,映像情報メディア年報)
- アクセス頻度と容量分散を考慮した版管理用データ配置法の実装と評価(データ工学, ディペンダビリティ, 一般)
- 並列Btree構造における負荷分散処理の並行性制御への影響(高性能システム, 夏のデータベースワークショップDBWS2005)
- 並列Btree構造における負荷分散処理の並行性制御への影響(高性能システム, 夏のデータベースワークショップ2005)
- D-4-11 メタデータによるコンテンツの蓄積, 転送管理の検討(D-4. データ工学, 情報・システム1)
- アベイラビリティの高い分散ストレージ管理ソフトウェアの更新手法(ストレージ技術, データ工学論文)
- 偏り除去手続き並列化の分散ストレージにもたらす効果(システム開発,ストレージ)(データ工学,ディペンダビリティ,一般)
- 負荷分散のためのデータ移動による性能低下を抑制するアクセス回送制御(システム開発,ストレージ)(データ工学,ディペンダビリティ,一般)
- 分散ストレージ上の複製へのアクセス要求配分を取り入れた負荷均衡化手法(ストレージ2)(夏のデータベースワークショップDBWS2004)
- 挿入によって他ラベル変更を起こさない可変長XMLラベルの容量評価(夏のデータベースワークショップ2007(データ工学,一般))
- 挿入によって他ラベル変更を起こさない可変長XMLラベルの容量評価(XML (1),夏のデータベースワークショップ2007(データ工学,一般))
- リサーチマイニング手法におけるクラスタリング閾値設定指針の考察(データマイニング)(夏のデータベースワークショップDBWS2004)
- リサーチマイニング手法におけるクラスタリング閾値設定指針の考察(セッション8B : データマイニング)(夏のデータベースワークショップ : DBWS2004)
- 音声情報を統合したプレゼンテーションコンテンツ検索(情報検索,データ工学論文)
- 分散ストリーム処理システムにおける高信頼化方式の提案
- 自律分散型ストレージシステムにおける性能および可用性改善の試み(インターネット環境でのデータ工学とディペンダビリティ)
- 並列ストレージにおけるサービス性能を保った負荷均衡化の影響(インターネット環境でのデータ工学とディペンダビリティ)
- Fat-BtreeにおけるB-linkを用いた並行性制御手法(並列型,夏のデータベースワークショップDBWS 2006)
- Fat-BtreeにおけるB-linkを用いた並行性制御手法(並列型)
- アクセス履歴とデータライフサイクル情報を組み合わせたストレージ管理機構(ストレージ)
- 分散データ格納環境のための自律的並列偏り除去手法(ストレージ2)(夏のデータベースワークショップDBWS2004)
- 並列ストレージにおけるデータ再配置による長期的負荷均衡化と短期的応答性能の両立
- Fat-Btreeを用いたPostgreSQL分散化におけるページ分割手法の検討(DE-1インデックス,インターネット環境でのデータ工学とディペンダビリティ,及び一般)
- 性能の異なるディスクが混在する環境でのデータ配置及びディスク配列に関する考察(夏のデータベースワークショップ2007(データ工学,一般))
- 並列B-Tree構造Fat-Btreeを用いたPostgreSQLの分散検索の試み(夏のデータベースワークショップ2007(データ工学,一般))
- 性能の異なるディスクが混在する環境でのデータ配置及びディスク配列に関する考察(データ管理,夏のデータベースワークショップ2007(データ工学,一般))
- 並列B-Tree構造Fat-Btreeを用いたPostgreSQLの分散検索の試み(インデックス,夏のデータベースワークショップ2007(データ工学,一般))
- アクセスログに基づくWebページ推薦におけるLCSの利用とその解析(情報融合)
- COBALT : バージョン管理を行う並列分散ストレージシステムにおけるアクセス負荷と記憶空間利用率の同時均衡化手法(ストレージ技術,データ工学論文)
- アクセス履歴とデータライフサイクル情報を組み合わせたストレージ管理機構(ストレージ,夏のデータベースワークショップDBWS 2006)
- WebアクセスログのLCSを用いたWebページの推薦手法(履歴応用,夏のデータベースワークショップDBWS 2006)
- WebアクセスログのLCSを用いたWebページの推薦手法(履歴応用)
- 分散ストレージにおける情報ライフサイクルの効率的管理(ストレージ2)(夏のデータベースワークショップDBWS2004)
- 分散ストレージ上の複製へのアクセス要求配分を取り入れた負荷均衡化手法(セッション7C : ストレージ2)(夏のデータベースワークショップ : DBWS2004)
- 分散データ格納環境のための自律的並列偏り除去手法(セッション7C : ストレージ2)(夏のデータベースワークショップ : DBWS2004)
- 分散ストレージにおける情報ライフサイクルの効率的管理(セッション7C : ストレージ2)(夏のデータベースワークショップ : DBWS2004)
- 仮想ノードを用いた自律ディスクシステム更新の高可用化(インターネット環境でのデータ工学とディペンダビィリティ及び一般)
- 挿入制限のないXML範囲ラベリング用コード(セッション1B : XML基礎技術)
- 挿入制限のないXML範囲ラベリング用コード(XML基礎技術)(「夏のデータベースワークショップ(DBWS2003)」一般)
- 自律分散型ストレージシステムにおける性能および可用性改善の試み(インターネット環境でのデータ工学とディペンダビリティ)
- 並列ストレージにおけるサービス性能を保った負荷均衡化の影響(インターネット環境でのデータ工学とディペンダビリティ)
- アクセス頻度と容量分散を考慮した版管理用データ配置法の実装と評価(データ工学, ディペンダビリティ, 一般)
- 偏り除去手続き並列化の分散ストレージにもたらす効果(システム開発,ストレージ)(データ工学,ディペンダビリティ,一般)
- 負荷分散のためのデータ移動による性能低下を抑制するアクセス回送制御(システム開発,ストレージ)(データ工学,ディペンダビリティ,一般)
- 仮想ノードを用いた自律ディスクシステム更新の高可用化(インターネット環境でのデータ工学とディペンダビィリティ及び一般)
- 半導体ディスクを用いた自律ディスクの階層化(セッション2B : 分散処理とストレージ)
- 半導体ディスクを用いた自律ディスクの階層化(分散処理とストレージ)(「夏のデータベースワークショップ(DBWS2003)」一般)
- C-7-9 放送局に向けた自律ストレージシステムの基本機能検討
- ファイル検索におけるアクセスログから抽出した関連度の利用(夏のデータベースワークショップ2007(データ工学,一般))
- ファイル検索におけるアクセスログから抽出した関連度の利用(情報抽出,夏のデータベースワークショップ2007(データ工学,一般))
- 耐故障バッファリングディスクシステムの性能評価
- 講義・講演シーン検索におけるスライドおよび音声中の検索語出現状況に基づくレーザーポインタ情報のフィルタリング(e-Learning,夏のデータベースワークショップDBWS 2006)
- 講義・講演シーン検索におけるスライドおよび音声中の検索語出現状況に基づくレーザーポインタ情報のフィルタリング
- 時系列データベースとストリーム処理の統合のためのデータモデルの提案(ストリームデータ1, 夏のデータベースワークショップDBWS2005)
- 時系列データベースとストリーム処理の統合のためのデータモデルの提案(ストリームデータ1, 夏のデータベースワークショップ2005)
- ファイルRMC操作を考慮した関連ファイルの発見
- ファイルRMC操作を考慮した関連ファイルの発見
- テロップ情報による語学番組シーン検索手法の評価
- ユーザ作業を反映する仮想ディレクトリ生成のためのアクセス履歴解析手法
- 対象情報源を動的に選択可能なストリーム処理の実装と評価
- ファイルRMC操作を考慮した関連ファイルの発見
- ユーザ作業を反映する仮想ディレクトリ生成のためのアクセス履歴解析手法
- アクセス履歴に基づくファイル間関連度を用いたデスクトップ情報管理ツールの開発(ウェブ情報とデータベースに関して(ポスター講演))
- 3ZP-4 アクセスログ解析を用いて同一作業で使用されたファイル群を発見する手法の提案(情報爆発時代におけるデータマイニング・アルゴリズム,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 3T-5 ストリーム処理における情報源の動的選択機能(センサデータベースとコンテンツ,学生セッション,データベースとメディア)
- データストリーム管理システムHarmonicaの設計と実装
- ストリーム管理システムにおける永続化要求の妥当性評価(ストリーム,夏のデータベースワークショップDBWS 2006)
- 分散環境におけるストリーム処理の高信頼化(ストリーム,夏のデータベースワークショップDBWS 2006)
- ストリーム管理システムにおける永続化要求の妥当性評価(ストリーム)
- 分散環境におけるストリーム処理の高信頼化(ストリーム)
- 実世界情報ストリームの高度利用のための統合環境
- 6ZN-3 語学番組検索システムにおけるシーン区切り検出手法(情報爆発時代におけるマルチメディア処理,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 異種データストリーム統合基盤 : Stream Spinner(ウェブ情報とデータベースに関して(ポスター講演))
- 6ZK-1 分散ストリーム処理管理システムORINOCOの評価(情報爆発時代におけるストリームデータと実世界情報処理,学生セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 分散ストリーム処理環境における持続型問合せ処理方式
- 分散ストリーム処理環境におけるアプリケーション配置最適化手法(夏のデータベースワークショップ2007(データ工学,一般))
- 仮想マシン技術を用いた持続型ストリーム処理環境の評価(夏のデータベースワークショップ2007(データ工学,一般))
- 分散ストリーム処理環境におけるアプリケーション配置最適化手法(ストリーム処理,夏のデータベースワークショップ2007(データ工学,一般))
- 仮想マシン技術を用いた持続型ストリーム処理環境の評価(ストリーム処理,夏のデータベースワークショップ2007(データ工学,一般))
- 6ZN-5 複数講演コンテンツのダイジェスト自動生成のためのシーン重要度算出手法の評価(情報爆発時代におけるマルチメディア処理,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 6ZC-4 機関リポジトリと外部情報源を連携した関連論文探索手法(情報爆発時代におけるWebパーティカル検索,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 5ZN-7 Wikipediaのセクションを考慮したリンク解析による関連項目検索手法の提案(情報爆発時代におけるWebマイニング,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- Fat-Btree, P-tree, SkipGraphを用いた範囲問合せ性能の比較実験
- Fat-Btree, P-tree, SkipGraphを用いた範囲問合せ性能の比較実験
- 関連ファイルの発見におけるファイルRMC操作の考慮
- アクセスログに基づくファイルとWebページの関連性抽出手法
- 機械学習を用いたテロップ表示意図推定による動画メタデータ生成手法(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 機械学習を用いたテロップ表示意図推定による動画メタデータ生成手法(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 低遅延ストリーム処理のための結合演算並列実行方式
- 低遅延ストリーム処理のための結合演算並列実行方式
- RMC操作に基づくタスクとタスク間関連度を考慮したファイル検索(情報検索,データ工学と情報マネジメント論文)