情報検索のための複合語マッチング
スポンサーリンク
概要
- 論文の詳細を見る
日本語では複合語が高い頻度で用いられる。より精度の高い検索を行うためには、語が複合しているという情報を活用することが必要である。本稿では、複合語を意識したマッチング法を提案する。さらに、名詞の重要度を基本名詞の連接数により判断する手法と組み合わせ、複合語を意識した文書の重要度付与を行う方法を示す。このシステムを複合語を意識しないシステムと比較したところ、再現率、適合率とも改善されることが確認された。
- 一般社団法人情報処理学会の論文
- 1996-09-12
著者
関連論文
- アーバンセンシング基盤に向けて(センシングネットワーク:目的指向編)
- 2P-8 ソーシャルブックマークにおけるスパムの検出(Webマイニング,学生セッション,データベースとメディア)
- 日本語マニュアルの内容検索システム
- tf・idf法を用いた関連マニュアル群のハイパーテキスト化
- 3S-6 Webからのメタファ抽出方式(情報抽出,学生セッション,人工知能と認知科学)
- E-004 トピッククラスタを利用した協調フィルタリングに基づくWeb情報推薦システム(自然言語・音声・音楽,一般論文)
- tf・idf法を用いた関連マニュアル群のハイパーテキスト化
- 機械学習を用いた Web 表情報の例示検索方式とその評価
- D-5-8 Web表情報の例示検索方式とその評価(D-5. 言語理解とコミュニケーション,一般セッション)
- E-013 数値による新聞記事テキストマイニングシステムの提案(E分野:自然言語・音声・音楽)
- D-046 Web上の表情報を対象とした例示検索 : 表の構造的特徴の利用(D分野:データベース)
- D_049 機械学習を用いたWeb上の表情報の例示検索方式(D分野:データベース)
- E-061 Blogにおけるイベント体験情報の判別と抽出(自然言語・音声・音楽,一般論文)
- D-5-12 Blogからのイベント体験情報の抽出(D-5. 言語理解とコミュニケーション,一般セッション)
- E-038 Blogからのイベント情報の抽出(E分野:自然言語・音声・音楽)
- E-037 blog記事からの不審者情報の抽出と分類(E分野:自然言語・音声・音楽)
- E-020 英語-ウイグル語機械翻訳のための従属節接辞の生成方式(E分野:自然言語・音声・音楽)
- E-017 時間情報を考慮したニュース記事のトピック分類とトピックの関連付け(E分野:自然言語・音声・音楽)
- E_026 英語-ウイグル語機械翻訳システムにおけるウイグル語生成方式(E分野:自然言語)
- E_006 Webページからの評価表現の抽出(E分野:自然言語)
- E-031 Web新聞記事と携帯端末用記事における語句言い換え表現の対応付け(E.自然言語・文書・ゲーム)
- E-012 英語-ウイグル語機械翻訳システムの基本検討 : 日本語とウイグル語の文法構造の比較(E.自然言語・文書・ゲーム)
- E-045 同一事象に対する異新聞社記事間の類似点・相違点の検出(E分野:自然言語・音声・音楽,一般論文)
- E-044 ソーシャルブックマークにおけるコメントの分類方式(E分野:自然言語・音声・音楽,一般論文)
- E-037 Wikipedia出典・脚注情報の媒体分類の自動付与(E分野:自然言語・音声・音楽,一般論文)
- 1S-6 日中英ニュース記事比較のための収集と検索(情報検索・評価分析,学生セッション,人工知能と認知科学)
- D-5-10 Web情報推薦システムにおけるトピック分類クラスタの結合と分割(D-5. 言語理解とコミュニケーション,一般セッション)
- E-018 世界の多言語ニュースの収集と分類(E分野:自然言語・音声・音楽)
- D-031 Bloggerの嗜好を利用した協調フィルタリングと内容類似性によるWeb情報推薦システムのためのクラスタリング手法の検討(D分野:データベース)
- E_007 Bloggerの嗜好を利用した協調フィルタリングと内容類似性によるWeb情報推薦システム(E分野:自然言語)
- E-046 ニュース記事の国別クラスタの作成と多国間対応(E分野:自然言語・音声・音楽,一般論文)
- D-043 ソーシャルブックマークにおける方向性を持った推薦の検討(D分野:データベース,一般論文)
- 日本語マニュアルの内容検索システム
- 文書頻度と節長を利用した図書概要縮約方式
- E-015 多国多言語ニュース記事の検索・比較システム(自然言語・音声・音楽,一般論文)
- E-004 Webからのメタファ表現候補の抽出システム(自然言語・音声・音楽,一般論文)
- D-015 ソーシャルブックマークにおけるスパム検出のための特徴とその評価(データベース,一般論文)
- E-033 ウェブを利用した関連用語収集(E.自然言語・文書・ゲーム)
- E-032 地名辞書を利用した地名特定方式(E.自然言語・文書・ゲーム)
- E-027 新聞記事コーパスの共通文を利用した重要文抽出方式(E.自然言語・文書・ゲーム)
- トピックドリフトを支援する新聞記事ナビゲーションシステム(テキスト分類・トピック解析)
- 写真ニュースにおける決定木を用いた「話題顔」の検出
- 機械学習を用いた「話題顔」の検出
- 写真ニュースにおける顔領域と人名との自動対応づけ
- SMD-6 C4.5を用いた「話題顔」の検出
- SMD-5 写真ニュースにおける顔領域と人名との自動対応づけ
- SMD-6 C4.5を用いた「話題顔」の検出
- SMD-5 写真ニュースにおける顔領域と人名との自動対応づけ
- 新聞記事における写真と言語表現の対応の学習
- 新聞記事における写真と言語表現の対応の学習
- 新聞記事における写真と言語表現の対応の学習
- 複合語マッチングと共起情報を併用する情報検索
- 複合語マッチングによる情報検索
- ソーシャルメディア上の位置情報付きテキストを利用した行動分析
- ソーシャルメディア上の位置情報付きテキストを利用した行動分析
- Twitterを用いた電車遅延の自動通知
- Twitterを用いた電車遅延の自動通知
- 人名と顔画像領域との自動対応づけ
- 情報検索のための複合語マッチング