WWWホームページからの共起語自動抽出実験
スポンサーリンク
概要
- 論文の詳細を見る
我々は, キーワードによる情報検索においてシソーラスの利用が有効であるとの仮定に基づいて, シソーラス管理システムを開発している。本システムは, シソーラスデータの登録, 参照, 個人カスタマイジング, 更新機能のほか, キーワード抽出技術を用いて特定の単語と対になって出現する傾向の強い単語(以下, 共起語と呼ぶ)を検索対象文書群から自動抽出し, シソーラスの一部として登録する機能を持つ。情報検索において, これらのシソーラスデータを適宜ユーザに提示することにより, 検索結果の絞り込みや検索の発想を支援できると考えている。本報では, 情報検索における共起語の有効性検証の一環として, 日本のWWWページ45,000件から共起語を自動抽出する実験を行ったので報告する。
- 一般社団法人情報処理学会の論文
- 1997-09-24
著者
-
辻 洋
(株)日立製作所システム開発研究所
-
間瀬 久雄
(株)日立製作所
-
丹羽 芳樹
(株)日立製作所中央研究所
-
辻 洋
(株)日立製作所
-
徳田 圭世
日立西部ソフトウェア(株)
-
森本 由起子
(株)日立製作所
-
徳田 圭世
(株)日立製作所システム開発研究所
-
間瀬 久雄
(株)日立製作所 システム開発研究所
-
森本 由起子
株式会社日立製作所
関連論文
- 27.情報処理の未来地図(情報処理技術の未来地図,50周年記念特集号)
- 3Q-6 観光情報システムにおけるフロート座標方式の評価実験
- プロファイルに特許文書情報を加味した学術論文フィルタリング方式
- 著者・分野・用語の特性を利用した論文フィルタリング方式
- 情報処理の未来地図
- スパイラル型習熟度強化学習支援システムの提案
- 医療用語のコード化手法 : 部分文字列のテキスト近似被覆問題(専門用語)
- 対話的文書検索における文書クラスタリングの役割
- 表形式事例の比較・対照による分析型エキスパートシステム
- 情報検索支援のためのシソーラス管理システムの提案
- 文書化知識の再利用過程の支援システムに関する考察
- 自然言語インタフェースNLI : 状況推移ベースモデリングによるNLI構築システム
- 単語出現頻度に基づくテキスト分類ツールとその応用(第13回日本計算機統計学会大会報告)
- ヘルプデスクシステムにおける類似事例検索機能の開発及び評価
- 単語出現頻度に基づくテキスト分類ツールとその応用
- 分散環境での非対称コミュニケーションを支援する遠隔相談システム (ヒューマンインタフェースとインタラクション)
- 知的マルチモーダルユーザインタフェースを実現するための基本ソフトウェアの構成
- 特許テーマ分類方式の提案とその評価実験
- インターネットの情報流を制御するプロキシーサーバ技術
- ヘルプデスクにおける類似文書検索システムの構成と機能について
- 記事データからの分類知識獲得に関する実験シミュレーション
- 新聞記事自動分類システム構築の検討と評価
- 継承階層を利用したオブジェクト指向データベースのレプリケーション定義方式
- サービス情報の参照履歴からのユーザニーズ抽出方式の提案
- 職制に基づいたワークフロー制御方式について
- テキスト分類支援ツールFLUTEの開発(2) : 障害事例分類への適用
- テキスト分類支援ツールFLUTEの開発(1) : 機能と構成
- 実時間システム上のNLIとそのコマンド生成
- オブジェクト・データベースを用いたシソーラス保守システムの試作
- 対話的文書検索における文書クラスタリングの役割
- 一般語との曖昧性を持つタンパク質名の自動検出(情報抽出・単語分類)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- 一般語との曖昧性を持つタンパク質名の自動検出(情報抽出・単語分類)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- 企業内個人向けサービス : 事例とそれを支える情報技術
- ソフトウェア障害解析支援システム(1) : 障害解析知識のモデル
- エキスパートシステムの試行/開発/利用/保守環境
- 2P-3 タームのrepresentativenessを測るための新指標
- タームのrepresentativenessを測る
- WWWデータアクセスパターンを考慮したキャッシングシステム
- シソーラス管理システムにおけるカスタマイズ機能について
- 医療用語のコード化手法 : 部分文字列のテキスト近似被覆問題(専門用語)
- 連想に基づく情報アクセス技術 : 汎用連想計算エンジンGETAを用いて(最新情報検索技術)
- あいまい検索の技術と応用 (特集 インターネット検索技術と日本語研究)
- TD-1-6 DualNAVIによる連想的テキストアクセス
- 組み合わせ的確率モデルに基づく特徴単語選択方法 : 超幾何分布の応用
- 類似例の存在を否定的な要因として用いる重要バイグラムの収集支援方法
- 書き換え規則と文脈情報を用いた形態素解析後処理
- 書き換え規則と文脈情報を用いた形態素解析後処理
- 統計量とルールを組み合わせて有用な括弧表現を抽出する手法
- WWWホームページからの共起語自動抽出実験
- 括弧表現から統計量を用いて有用情報を抽出する手法
- 辞書と共起情報を用いた新聞記事からの人名獲得
- 動的な共起解析を用いた対話的文書検索支援
- デジタルドキュメントにおける共起データを用いた検索ターム連想支援について
- 思考過程の思考展開図表現に基づく機械設計支援システム
- テキスト自動分類エキスパートシステムの一構成法
- DB 検索用自然語インタフェースにおける解釈結果確認文生成方式の開発とその評価
- 自然語インタフェースにおける操作指示の実行順序の解析
- パラメータ設定による文章要約支援システム
- 複数システムの制御を可能とする自然語インタフェース
- 事例を用いたプログラムチューニング支援システム(5) : 評価
- 事例を用いたプログラムチューニング支援システム(4) : チューニング事例
- メタ知識定義による知識ベースの保守方式とその適用例
- 事例を用いたプログラムチューニング支援システム(3) : 事例ベースの構成法
- 事例を用いたプログラムチューニング支援システム(2) : 類似度計算法
- 事例を用いたプログラムチューニング支援システム(1) : 構想
- 文字認識と形態素解析を用いた類似文書検索の試み
- 自然語インタフェースにおける複数システムの構成に応じた意味解析
- 自然語インタフェースにおける知識表現の統一とネットワーク探索
- 自然語インタフェースにおける操作対象と操作条件の表現
- Case-Based Reasoningによるエキスパートシステムの知識獲得の容易化(2) : 計算機室レイアウト問題への適用
- Case-Based Reasoningによるエキスパートシステムの知識獲得の容易化(1) : 事例利用方式
- ノウハウの知識べ一ス化によるシステム/ソフトウェアの品質管理(QCとAI)
- 論理和を含む概念の学習アルゴリズムとその応用
- 特許出願人に関する傾向の分析とそれを適用した無効化特許検索手法
- 特許文書中のタームの出願人別使用傾向の分析と類似特許文書検索精度への影響評価(情報検索・分類,テーマ : 「デジタルアーカイブの活用(応用)」および一般)
- 特許文書中のタームの出願人別使用傾向の分析と類似特許文書検索精度への影響評価(情報検索・分類,テーマ : 「デジタルアーカイブの活用(応用)」および一般)
- テキスト処理技術の教育分野への応用
- 編集にあたって(文化と情報技術の接点)
- バージョン空間法を応用した類似事例の検索と索引の更新方式
- FACT-Graphを用いた社説の比較分析
- 自然語インタフェースにおける解釈結果確認文生成方式の開発
- エキスパ-トシステム構築標準手順"ESGUIDE" (ビジネス分野におけるAIシステムの構築と実用化) -- (日立AIシステムの紹介)
- 計算機システム構成設計支援エキスパ-トシステム (知識工学の情報処理分野への応用)
- 計算機構成設計支援エキスパートシステムの開発
- 間接負荷制御のための家庭内消費エネルギー実績データの予備調査
- 知識空間理論を用いた学習状況および学習経路の可視化の検討
- 学習ポートフォリオシステムの運用結果の分析と評価
- 家庭向け省エネ診断アドバイスシステムの提案
- 家庭内エネルギー消費に関する動向と課題
- 自然語インタフェースにおける対話型解釈内容変更方式
- エキスパートシステム構築方法論ESGUIDE
- JCAICT 2011実施報告
- 形態素解析ツールによるかな漢字プログラミングの実現
- 自然語インタフェースにおけるインタラクティブ型多義解消方式の開発
- ヒューリスティックスと動的なルール生成を用いた定性推論の効率化方式
- 評価判定の暗黙知の形式知化 : 評価の実例から評価判定ルールの帰納的構成(理論・技術)
- 単語ベクトルを用いた多義語の意味推定 : 共起ベクトルと定義距離ベクトルの比較
- 人物判定におけるKinectの骨格線情報の利用(学生研究発表会)
- 階層別効率値の比較に基づくDEA評価手法の提案 : 大学評価を例として
- 動的な共起解析を用いた対話的文書検索支援