URLの類似性を考慮したWWW空間からの関連語収集手法(「ユニバーサルコミュニケーションを実現するための言語処理技術」シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
関連語の自動収集に関する研究は,自然言語処理システムにおける言語知識辞書の構築,また,情報検索システムにおける検索質問拡張など,様々な分野で有効活用されている.特に近年,インターネット技術の発達に伴い,WWW空間から関連語を自動収集する研究が活発に取り組まれている.本稿では,基底単語を準備し,その基底単語の関連語をWWW空間から効率的に自動収集する手法を提案する.本手法では基底単語を既存のWWW検索システムに入力して得られる検索結果のURL集合と,関連候補語を入力として得られるURL集合との間に類似性があることに着目し,パス毎のURLに重みづけを行うことにより,基底単語のURL集合と類似したURL集合を有する単語を関連語として収集する.
- 社団法人電子情報通信学会の論文
- 2009-01-19
著者
-
北 研二
徳島大学高度情報化基盤センター
-
北 研二
徳島大
-
獅々堀 正幹
徳島大学大学院ソシオテクノサイエンス研究部情報ソリューション部門
-
北 研二
徳島大学
-
中出 訓規
徳島大学大学院先端技術科学教育部システム創生工学専攻
-
獅子堀 正幹
徳島大学工学部
-
獅子堀 正幹[他]
徳島大学工学部
関連論文
- 徳島大学キャンパスネットワークシステムの更新について
- 距離索引VP-treeにおける解絞込みの一改良手法(マルチメディアデータベース,データ工学論文)
- 類似画像検索技術を用いた商品推薦システム--『SUDACHI』の開発とその応用
- WWW画像検索システムを用いた関連語の自動収集手法(検索)
- 講義映像配信システムにおける講義映像と資料の対応
- フィルタバンク特徴量とEarth Mover's Distanceを用いた音楽検索
- 教師あり学習によるベクトル空間情報検索モデルの精度改善
- Earth Mover's Distanceを用いたハミングによる類似音楽検索手法(音楽情報検索,便利で身近な音楽情報処理)
- 符号化音声認識のための合成音声を用いた不特定話者音響モデルの適応法(音声,聴覚)
- 分散音声認識における実時間周波数特性正規化手法(音声言語)
- ハミングによる検索機能を備えた音楽配信システムの開発
- サフィックス・アレイに基づく言語モデルを用いた音声認識に関する研究
- 検索質問と字幕の文字画像特徴量間の距離に基づく字幕検索手法
- G-003 距離尺度にEarth Mover's Distanceを用いたハミングによる類似音楽検索手法(G分野:音声・音楽)
- 多属性項目の履歴情報に基づく電子メイル文書のフィルタリング手法
- 多属性項目の履歴情報に基づく電子メイル文書のフィルタリング手法
- 各個人のプロファイルを用いたメイル文書のフィルタリング手法
- 履歴情報を考慮したメイル文書のフィルタリング手法
- WWW画像検索システムにおける有害画像フィルタリング手法
- D-020 WWW画像検索システムにおける有害画像フィルタリング手法(D分野:データベース)
- D-030 WWW画像検索システムを用いた有害サイトURLデータベースの構築手法(D.データベース)
- 距離索引VP-treeにおける解絞り込みの一改良法(基盤・要素技術)(セマンティックウェブと自然言語処理その他一般)
- 距離索引VP-treeにおける解絞り込みの一改良法
- 分野連想語の出現位置に基づく話題分野の特定手法
- 分野連想語を用いたパッセージ特定手法
- テキストと画像のクロスメディア情報検索に向けた画像キーワード登録システムの開発
- 時間推移を考慮した単語の重要度決定手法
- 質問応答システムにおける質問文内の漢字文字列に対する用語特定手法(「ユニバーサルコミュニケーションを実現するための言語処理技術」シンポジウム)
- URLの類似性を考慮したWWW空間からの関連語収集手法(「ユニバーサルコミュニケーションを実現するための言語処理技術」シンポジウム)
- 質問応答システムにおける質問文内の用語特定(思考と知識検索・獲得,一般)
- Earth Mover's Distance の高速検索ライブラリ fastEMD の開発
- 字幕付き映像データからの字幕領域の検出手法
- WWW検索エンジンを用いた質問文内の用語特定手法
- WWW検索エンジンを用いた質問文内の用語特定手法(QA・Web検索)
- URLの類似性に着目したWWW空間からの関連語自動収集手法
- 順位キューを用いた多次元データの高速近傍検索アルゴリズム
- 出現URLの類似性に着目したWWW空間からの関連語自動収集手法(抽出, 言い換え)
- D-019 WWW画像検索システムにおける検索質問拡張に基づくフィードバック検索(D分野:データベース)
- 長・短期間における音声の話者内変動に関する検討
- ETSI標準分散音声認識フロントエンドにおける入力系の周波数特性正規化手法
- Simple PCAを用いたベクトル空間情報検索モデルの次元削減
- MPEG映像データに対するカットシーンの高速検出手法
- D-040 領域分割画像に基づく言語メタデータの自動生成手法(D.データベース)
- 自由発話音声認識における音響分析の比較
- ECサイトにおける画像の類似性測定 : 『SUDACHI』の開発と商品推薦エンジンへの応用(特別セッション 好みの計量)
- 多次元データの高速近傍検索アルゴリズム(基盤・要素技術)(セマンティックウェブと自然言語処理その他一般)
- 1次元自己組織化マップを用いた高次元データの高速近傍検索
- 1次元自己組織化マップを用いた高次元データの高速近傍検索
- 周波数特性の変動に頑健な実時間分散音声認識手法(耐雑音)(第5回音声言語シンポジウム)
- 周波数特性の変動に頑健な実時間分散音声認識手法(第5回音声言語シンポジウム : 耐雑音)
- 周波数特性の変動に頑健な実時間分散音声認識手法(第5回音声言語シンポジウム : 耐雑音)
- 周波数特性の変動に頑健な実時間分散音声認識手法
- 日本語音声コーパスを用いた ETSI STQ DSR Advanced Front-End の評価
- 画像,音声,テキストに対するマルチデータ処理技術の統合化とその応用
- HTML形式の表構造に対する一索引化手法
- HTML形式の表構造に対する一索引化手法
- WWW空間上に存在する表構造の一索引化手法
- キーワード構成の分析とその応用
- 接続情報を加味した形態素辞書による形態素解析の高速化
- 情報検索のための概念ベクトル生成手法
- PDDPによる概念ベクトルを用いた情報検索システム
- オーディオ指紋検索に適した高速なハミング空間検索
- 日本語文における時間表現の形式化手法
- 画像,音声,テキストに対するマルチデータ処理技術の統合化とその応用
- サポートベクターマシンによる適合性フィードバックを用いた情報検索(情報検索)
- サポートベクターマシンによる適合性フィードバックを用いた情報検索
- 混合ガウス分布モデルを用いた画像検索
- Non-negative Matrix Factorization を用いたベクトル空間情報検索モデルの次元削減手法
- 画像知識データベースを用いたWWW画像検索システムの開発(画像検索・映像データベース)
- 1次元自己組織化マップを用いた高次元データの高速近傍検索
- HTML形式の表構造の内容解析手法とその応用に関する研究
- Non-negative Matrix Factorizationを用いた情報検索モデルの次元圧縮および検索質問拡張
- 大規模顔画像データベースに対する印象語による類似顔画像検索技術に関する研究
- ETSI標準分散音声認識フロントエンドを用いた音声認識実験
- 音素依存線形判別分析の検討
- Simple PCAを用いたベクトル空間情報検索モデルの次元削減
- Simple PCAを用いたベクトル空間情報検索モデルの次元削減
- Non-negative Matrix Factorizationを用いた情報検索
- コンセプト・プロジェクションにおける関連性フィードバックを用いた概念ベクトルの更新手法
- クラスタリングに基づくGMM学習法による話者モデルの構築(話者認識・照合,認識,理解,対話,一般)
- クラスタリングに基づくGMM学習法による話者モデルの構築
- 音声ドキュメント検索におけるクエリ拡張と音節認識の併用の効果(音声処理,時系列パターン認識)
- 音声ドキュメント検索におけるクエリ拡張と音節認識の併用の効果(音声処理,時系列パターン認識)
- 音声ドキュメント検索におけるクエリ拡張と音節認識の併用の効果
- 局所的な形状特徴量とEMDを用いた類似画像検索手法
- E-011 楽曲検索インデックスのコンパクト化(音楽情報科学(2),E分野:自然言語・音声・音楽)
- E-037 シナリオ対話感情コーパスの構築と分析(対話・コミュニケーション,E分野:自然言語・音声・音楽)
- E-012 日中機械翻訳のためのスーパー関数抽出における対訳辞書自動構築(言語資源,E分野:自然言語・音声・音楽)
- E-032 用例間の類似度に基づく若者言葉の感情推定手法(感情・評判,E分野:自然言語・音声・音楽)
- 音声ドキュメント検索における種々の検討および線形補間係数を自動決定する検索質問拡張