固有表現を用いたニュース記事分類手法の提案(クラスタリング, 夏のデータベースワークショップ2005)
スポンサーリンク
概要
- 論文の詳細を見る
コンピュータおよびコンピュータネットワークの発展により, アクセス可能な情報の量が増大している.その中でもニュース記事は, 最新ニュースの閲覧やアーカイブの検索等様々な方法にて利用され, 最も利用されているコンテンツの一つである.なかでも, アーカイブの検索等における, ニュース記事の見方として同一のイベントについての推移を一覧したいという要求がある.つまり, 同じイベントについて書かれている記事をグループ化する事が求められている.我々はこの問題に対して, ニュース記事中の固有表現に着目し, 固有表現を用いた分類を行うことで特定のイベントに関連するニュース記事を集めることができるのではないかと考えた.本稿では, ニュース記事中での固有表現の分布の分析および固有表現を用いた分類実験を行い, 固有表現を用いたイベント特化型の分類の可能性について報告する.
- 社団法人電子情報通信学会の論文
- 2005-07-06
著者
-
戸田 浩之
日本電信電話株式会社NTTサイバーソリューション研究所
-
戸田 浩之
日本電信電話株式会社 Nttサイバースペース研究所
-
片岡 良治
日本電信電話株式会社NTTサイバーソリューション研究所
-
北川 博之
筑波大学システム情報工学研究科
-
戸田 浩之
日本電信電話株式会社 Nttサイバーソリューション研究所
-
戸田 浩之
日本電信電話株式会社NTTサイバーソリューション研究所|現在,NTTコミュニケーションズ株式会社
-
片岡 良治
日本電信電話株式会社NTTサイバースペース研究所
-
片岡 良治
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
片岡 良治
日本電信電話株式会社 NTTサイバーソリューション研究所
関連論文
- 対象情報源の動的変化を考慮した分散ストリーム処理最適化手法の提案(セッション7b:ストリーム・スカイライン)
- オントロジを利用した異種河川測量データの統合(ポスターセッション,iDBフォーラム2008(招待講演・ポスター英語ディスカッション))
- モバイル端末を考慮したロケーションアウェア情報検索(ポスターセッション,iDBフォーラム2008(招待講演・ポスター英語ディスカッション))
- ブログ記事を用いた複数話題語間の動作関係抽出手法(データマイニング,データ工学論文)
- 話題語を手がかりとしたブログからのイベントマイニングの検討(抽出)
- 映像配信サービスにおける状況適応型検索システムの提案
- 利用者の状況に適応したメタデータ検索機構の提案
- 目的指向型ブログ検索システムBLOGRANGERの提案およびユーザ評価
- グラフ分析を利用した文書集合からの話題構造マイニング(テキストマイニング,データ工学論文)
- ポータルサービスを支えるナビゲーション技術(オフィスインフォメーションシステム及び一般)
- ソーシャルブックマークユーザのタグ付与行動に基づくスパマー判別手法(ウェブ情報とデータベースに関して(ポスター講演))
- マルチファセット型ブログ検索システムBLOGRANGERの開発(オフィスインフォメーションシステム及び一般)
- 楕円体問合せのための空間変換を用いた類似探索アルゴリズム
- 文書情報統合のためのテキスト表現モデルの提案と主題グラフを用いた実現
- ネット上の会話からの話題即時抽出技術の評価について(Webからの知識発見とネット応用)
- ネット上の会話からの話題即時抽出技術の評価について(Webからの知識発見とネット応用)
- 時系列データベースとストリーム処理の統合のためのデータモデルの提案(ストリームデータ1, 夏のデータベースワークショップDBWS2005)
- 時系列データベースとストリーム処理の統合のためのデータモデルの提案(ストリームデータ1, 夏のデータベースワークショップ2005)
- 適合性分布が異なる情報源を用いたランキング学習
- 概念ベースに基づくWeb検索のクエリタイプ判定手法とその評価
- クリックログ解析による情報要求ベースの検索結果ランキング
- アクセス集中サイトを利用した検索精度の向上 (特集 いまだかつてない検索サービス実現に向けたWebコンピューティング技術)
- レアクエリを対象とした非クリック分析によるクエリ推薦方式の提案
- 評判検索におけるクエリ依存型の評価極性付与(意見・評判情報処理)
- ブログ記事からの意見文検索(意見・評判情報処理)
- 評判検索におけるクエリ依存型の評価極性付与
- 3T-5 ストリーム処理における情報源の動的選択機能(センサデータベースとコンテンツ,学生セッション,データベースとメディア)
- ストリーム管理システムにおける永続化要求の妥当性評価(ストリーム,夏のデータベースワークショップDBWS 2006)
- 分散環境におけるストリーム処理の高信頼化(ストリーム,夏のデータベースワークショップDBWS 2006)
- ストリーム管理システムにおける永続化要求の妥当性評価(ストリーム)
- 分散環境におけるストリーム処理の高信頼化(ストリーム)
- D-006 ラベル指向情報検索における分類ラベル統合方式の検討(D.データベース)
- 構造型P2Pネットワークにおけるキーワードを含むXPathによるXML文書検索(セッション7c:P2P)
- 6ZK-1 分散ストリーム処理管理システムORINOCOの評価(情報爆発時代におけるストリームデータと実世界情報処理,学生セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 分散ストリーム処理環境におけるアプリケーション配置最適化手法(夏のデータベースワークショップ2007(データ工学,一般))
- 仮想マシン技術を用いた持続型ストリーム処理環境の評価(夏のデータベースワークショップ2007(データ工学,一般))
- 分散ストリーム処理環境におけるアプリケーション配置最適化手法(ストリーム処理,夏のデータベースワークショップ2007(データ工学,一般))
- 仮想マシン技術を用いた持続型ストリーム処理環境の評価(ストリーム処理,夏のデータベースワークショップ2007(データ工学,一般))
- D-035 クエリログから抽出した関連語集合を用いたウェブページ検索(D分野:データベース,一般論文)
- 文書情報統合のためのテキスト表現モデルの提案と主題グラフを用いた実現
- 複数のWeb Wrapperによる高精度な情報抽出(セッション4:Web応用)
- 複数のWeb Wrapperによる高精度な情報抽出(セッション4:Web応用)
- 複数の Web Wrapper による高精度な情報抽出
- ブログ記事要約における重要文位置の調査
- 特徴的な固有表現を用いたラベル指向ナビゲーション手法の提案
- E-011 記事群の冗長度を削減するためのRSSニュースリーダ(E分野:自然言語)
- バイナリーデータに対するXMLビューの実現(XMLデータベース, データ工学論文)
- トピックを考慮した大規模文書情報源からのレコード抽出
- データクリーニングを統合した情報抽出システムの提案(情報抽出2,夏のデータベースワークショップDBWS 2006)
- Blogのタグ間類似度のスコアリング
- コミュニティ抽出のためのクエリ共起語のクラスタリングに関する一考察(オフィスインフォメーションシステム及び一般)
- D-10-9 耐障害性を備えた全文検索エンジンの実装(D-10. ディペンダブルコンピューティング,一般セッション)
- 単語・意味属性間共起に基づくコーパス概念ベースの生成方式
- 単語間の階層関係に基づくテキスト分類方式(一般セッション,センシング技術とその応用)
- E-038 文書構造を考慮した近接度スコアを用いた文書検索結果ランキング方式(E分野:自然言語・音声・音楽,一般論文)
- 検索結果のアクセス分析に基づく情報要求ベースのランキング(ウェブ情報とデータベースに関して(ポスター講演))
- 局所構造を考慮したブログネットワークの分析(ウェブ情報とデータベースに関して(ポスター講演))
- 単語間の階層関係に基づくテキスト分類方式(一般セッション,センシング技術とその応用)
- 単語・意味属性間共起に基づく単語間の階層関係の抽出(言語理解とオントロジーシンポジウム)
- XMLベースのコンテンツガイドシステム実現について
- 4Q-6 センサネットに対するXMLビューの提案(ストリーム・空間検索,学生セッション,データベースとメディア,情報処理学会創立50周年記念)
- 多重比率規則抽出のためのデータ分析手法(データマイニング, 夏のデータベースワークショップDBWS2005)
- Hidden Web サイトからの新規トピック文書の抽出
- How-to型質問応答の実現に向けた質問回答文書の特徴分析(言い換え・質問応答)
- How-to型質問応答の実現に向けた質問回答文書の特徴分析(言い換え・質問応答)
- 複数のWeb Wrapperによる高精度な情報抽出
- 求める情報へユーザを導くナビゲーション型の情報検索技術 (特集 次世代ポータル技術)
- D-004 親ページ分類を用いたWEB画像の実用的な検索方法(D.データベース)
- 固有表現を用いたニュース記事分類手法の提案(クラスタリング, 夏のデータベースワークショップDBWS2005)
- 固有表現を用いたニュース記事分類手法の提案(クラスタリング, 夏のデータベースワークショップ2005)
- 特徴的な固有表現を用いたラベル指向ナビゲーション手法の提案(セッション4 : 情報検索)
- 特徴的な固有表現を用いたラベル指向ナビゲーション手法の提案(セッション4 : 情報検索)
- 到着頻度と関連性を考慮した時系列文書の連続的トピック分析(時系列とコンテンツ)(夏のデータベースワークショップDBWS2004)
- 到着頻度と関連性を考慮した時系列文書の連続的トピック分析(セッション4C : 時系列とコンテンツ)(夏のデータベースワークショップ : DBWS2004)
- RDB上のXSLT実体化ビューのインクリメンタルな更新について(XML 1)(夏のデータベースワークショップDBWS2004)
- RDB上のXSLT実体化ビューのインクリメンタルな更新について(セッション3B : XML1)(夏のデータベースワークショップ : DBWS2004)
- 単語・意味属性間共起に基づく概念ベースの拡張方式
- サポートベクターマシンを用いた気圧配置検出手法の提案 : 西高東低冬型を対象として
- インスタント質問文検索システムの提案(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- インスタント質問文検索システムの提案(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 単語の専門性に着目した気象学論文からの専門語抽出(宇宙科学情報解析論文誌 第一号)
- 複数のユーザアカウントを用いたソーシャルブックマークスパムの検出
- 複数のユーザアカウントを用いたソーシャルブックマークスパムの検出
- ストリームデータ処理における異常検知手法の共有化に関する検討
- EPUBCFIを用いた読書情報管理システムの提案
- ウェブ検索サービスにおけるユーザが感じる推薦情報品質とITリテラシーとの関係(サービス品質,クラウド,SDN(Software-Defined Network),コンテンツ配信,一般)
- AISを用いた複合イベント処理の効率化
- 地域特有の話題発見を支援するスマートフォン向けマップ型検索システム : 発見探地図エリアダス(地理情報システム,データ工学と情報マネジメント論文)
- 動的タイムワーピング距離を用いたX線天文データの類似検索(宇宙科学情報解析論文誌 第二号)
- トランザクショナルなストリームデータ処理の実現方式(ストリーム処理とI/O,ビックデータ工学及び一般)
- D-007 偽陽性率に着目したオンライン学習を用いたスパム判別(Web,D分野:データベース)
- ソーシャルメディアにおけるローカルイベントを用いたユーザ位置推定手法
- 暗号化ストリームデータ処理における効率化の検討(データ処理の効率化,ビッグデータとソーシャルコンピューティング,及び一般)
- BP-3-1 ビッグデータ分析のためのデータ工学基盤研究(BP-3.知的環境を実現するビッグデータ解析と通信行動分析,パネルセッション,ソサイエティ企画)
- AISを用いた複合イベント処理の効率化(一般,フレッシュマンセッション及び一般)
- RD-003 知名度の地理的広がりを考慮した実世界スポットの地域局所性推定(D分野:データベース)
- トランザクショナルなストリームデータ処理の実現方式