ウェブ検索に基づくテキストセグメンテーション(データマイニング)
スポンサーリンク
概要
- 論文の詳細を見る
テキストセグメンテーションは与えられたテキストを内容的なまとまりに分割する方法である.テキストセグメンテーションに関しては,これまでに数多くの手法が提案されており,事前に用意したコーパスから統計的情報や言語的情報を求め,それらに基づいて文間の連結性を判定しテキストセグメンテーションを行う方法が主である.しかし,十分な精度を得るためには大規模なコーパスが必要であることや,処理対象のテキストがコーパスによって制約を受ける問題がある.そこで,本論文では事前にコーパスを必要としないアプローチとして,ウェブ検索を用いたテキストセグメンテーション手法を提案する.また,ニュース記事を用いて事前にコーパスを必要としない手法であるHearstの手法との比較実験を行い提案手法の有効性を検証した.実験の結果から,提案手法と従来手法のF値はそれぞれ80.3%と52.4%となり提案手法の有効性を確認した.
- 社団法人電子情報通信学会の論文
- 2008-03-01
著者
-
田邊 勝義
日本電信電話株式会社サイバーソリューション研究所
-
奥田 英範
日本電信電話株式会社 NTTサイバーソリューション研究所
-
阿部 直人
日本電信電話株式会社NTTサイバーソリューション研究所
-
奥田 英範
日本電信電話株式会社nttサイバーソリューション研究所
-
田邊 勝義
NTTサイバーソリューション研究所
-
田邊 勝義
日本電信電話株式会社nttサイバーソリユーション研究所
-
田邊 勝義
Ntt サイバーソリューション研
-
田邊 勝義
日本電信電話株式会社nttサイバーソリューション研究所
関連論文
- リスト手話提示によるろう者への緊急通報の伝達(福祉工学)
- 仮想マルチスペクトルカメラ表現を用いたスペクトルに基づく画像生成法 (画像符号化・映像メディア処理レター特集)
- 血管の接続性を考慮したパノラマ眼底画像の作成 (ビジュアルコンピューティング論文特集号)
- 仮想マルチスペクトルカメラ表現を用いたスペクトルに基づく画像生成法(画像認識,コンピュータビジョン)
- D-4-2 大規模タグクラウドを地形図として可視化するTopigraphy(D-4. データ工学,一般セッション)
- E-012 ブログからの未来に関する表現の抽出(自然言語・音声・音楽,一般論文)
- 読者に影響を与えるブログ記事発見手法(セッション1:web・ブックマーク)
- 単語出現の意外性に基づく話題性評価方法(評判分析・文脈解析)
- ブログ文書集合を用いた省略語抽出手法の検討(夏のデータベースワークショップ2007(データ工学,一般))
- ブログ文書集合を用いた省略語抽出手法の検討(SNS・blog,夏のデータベースワークショップ2007(データ工学,一般))
- ブログ発信者の特徴を利用した話題抽出手法
- 俯瞰的アプローチに基づく情報場ナビゲーション技術 (特集 次世代ポータル技術)
- blogページ集合に対する話題語句抽出手法(分類, ブログ)
- blogページ集合に対する話題語句抽出手法(分類, ブログ)
- ウェブ検索を利用したしきい値選択型テキストセグメンテーション(jDBワークショップ)
- Blogからの体験情報抽出(Webインテリジェンス,情報洪水時代のネットワークサービス)
- 血管特徴を用いた眼底画像合成法(画像認識,コンピュータビジョン)
- グループトピックス 第3回 NTTコア技術シンポジウム「ポータル技術シンポジウム」開催報告
- 新しいポータルサービスの創出を目指して (特集 次世代ポータル技術)
- 手話・日本語二言語提示におけるろう者の緊急情報読取りストラテジー(福祉工学)
- 大規模テキストからの経験マイニング(テキストマイニング,データ工学論文)
- 競合学習を用いたエントロピー最小基準クラスタリング法(一般,First Person Visionのための認識・理解)
- 人流の乱れにロバストな歩行者計数法
- 低天井通路に対応した人流計数方法の検討
- リスト手話提示によるろう者への緊急通報の伝達
- 意見分析エンジン-計算言語学と社会学の接点-, 大塚裕子, 乾 孝司, 奥村 学(共著), コロナ社(2007-10), A5判, 定価(本体2,600円+税)
- 6R-6 ユーザーの検索意図を抽出する類似画像検索インターフェースの開発(自動生成・合成,学生セッション,人工知能と認知科学)
- ウェブ検索を利用したしきい値選択型テキストセグメンテーション(jDBワークショップ)
- ウェブ検索に基づくテキストセグメンテーション(データマイニング)
- ブログの視覚化によるナビゲーションシステム(オフィスインフォメーションシステム,ディジタルドキュメント、一般)
- ブログの視覚化によるナビゲーションシステム(オフィスインフォメーションシステム,ディジタルドキュメント、一般)
- 吉川榮和(編著), 仲谷善雄, 下田宏, 丹羽雄二(共著), "ヒューマンインタフェースの心理と生理", コロナ社, (2006-03), A5判, 定価(本体2,500円+税)
- 競合学習を用いたエントロピー最小基準クラスタリング法(一般,First Person Visionのための認識・理解)
- 競合学習を用いたエントロピー最小基準クラスタリング法(一般,First Person Visionのための認識・理解)
- 時刻情報を考慮したロケーションベースドサービス(LBS)によるコンテンツ表示インタフェースについて(システム開発,ライフログ活用技術,オフィス情報システム,情報通信マネジメント,一般)
- 20-5 シームレスな眼底画像合成手法の一検討
- D-9-7 時系列を考慮したロケーションベースドシステムの提案(D-9. オフィスインフォメーションシステム,一般セッション)
- コラボレーション技術を活用したイラストデザインの作成について(手法検討,ライフログ活用技術,オフィス情報システム,ライフインテリジェンス)
- 複数特徴量を統合したvisual wordsによる料理画像の分類(画像情報の分類と多重化,ドキュメントオートメーションとオンサイトデータ活用技術,及び一般)
- O-023 ロケーションベースドサービス(LBS)利用のための固有表現抽出を活用したコンテンツ位置情報付与支援方法の提案(情報システム,一般論文)
- ウェブ検索を利用したしきい値選択型テキストセグメンテーション
- 血管の接続性を考慮したパノラマ眼底画像の作成
- ボロノイ線図を用いた眼底画像識別法
- 眼底画像における動静脈分離の検討
- 血管特徴を用いた眼底モンタージュの作成
- 多次元心理空間を用いる類似画像検索法
- 類似画像検索に用いる多次元心理空間の最適次元の検討
- 特徴空間での空間分割を用いた類似検索手法の一検討
- 輪郭線の特徴量を用いた形状類似検索の一検討
- 形状類似画像検索における類似評価の一検討
- 部分文字列の配置規則を考慮したナンバープレート領域抽出
- 血管の同心円分割を用いた眼底画像における動静脈分離の検討
- 過去画像を基準にした経時眼底画像からの血管径計測点の自動抽出
- 過去画像を基準にした経時眼底画像からの血管径計測点の自動抽出
- 過去画像を基準にした経時眼底画像からの血管径計測点の自動抽出
- 勾配ベースの画像特徴量の視認性低下を目的とする遺伝的アルゴリズムを用いた特徴選択
- 勾配ベースの画像特徴量の視認性低下を目的とする遺伝的アルゴリズムを用いた特徴選択
- 競合学習を用いた情報理論的クラスタリング
- 競合学習を用いた情報理論的クラスタリング(人工知能,データマイニング)
- 景観デザイン基準に基づいた造景画像のバランス評価(画像,ライフログ活用技術,オフィスインフォメーションシステム,ライフインテリジェンス,一般)