単語概念ベクトルを用いた文書群からの代表語抽出(テーマ,膨大なデータから学ぶもの)
スポンサーリンク
概要
- 論文の詳細を見る
概念ベース法は,単語の特徴をベクトルで表す方法である.文書群は単語集合で構成されているので,単語の概念ベクトル集合を持っていることになる.文書群のベクトル集合の平均は文書群の特徴を表すようになり,検索や分類問題に利用できる。しかし,文書群には多くの単語が含まれているため,その平均だけでは特徴を十分に表し切れていない可能性がある.また,ベクトルで表現された特徴は直観的に理解できないという問題もある.そこで、文書群の代表語によってその特徴を表す方法を提案する.そのため,文書群のベクトル集合を代表するベクトル集合を抽出し,ベクトル集合から代表語を求める方法を示す.
- 社団法人電子情報通信学会の論文
- 2008-06-12
著者
-
奥 雅博
NTTソフトウェア株式会社
-
内山 俊郎
日本電信電話株式会社NTTサイバーソリューション研究所
-
奥 雅博
日本電信電話株式会社NTTサイバーソリューション研究所
-
別所 克人
日本電信電話株式会社NTTサイバーソリューション研究所
-
内山 匡
日本電信電話株式会社NTTサイバーソリューション研究所
-
内山 俊郎
日本電信電話株式会社サイバーソリューション研究所
-
奥 雅博
日本電信電話株式会社 Ntt光ソフトサービス推進プロジェクト
-
奥 雅博
Nttソフトウエア株式会社
-
別所 克人
日本電信電話株式会社サイバーソリューション研究所
-
内山 匡
日本電信電話株式会社サイバーソリューション研究所
-
内山 俊郎
日本電信電話株式会社 サイバーソリューション研究所
関連論文
- コメント・トラックバック分析に基づくブログ記事の影響度判定(Webマイニング,情報爆発論文)
- 映像解析技術に基づく編集機能をもつモバイル映像ブログシステム(コンテンツ技術,Web情報システム)
- 仮想マルチスペクトルカメラ表現を用いたスペクトルに基づく画像生成法 (画像符号化・映像メディア処理レター特集)
- 検索クエリを用いた場所の関連語の取得 (「知能と社会・ネットワーク」および一般)
- 全単語間共起を考慮した概念ベース生成手法 (パターン認識・メディア理解)
- 全単語間共起を考慮した概念ベース生成手法 (画像工学)
- 医療分野に特化した概念ベースによるDPCコーディング (医用画像)
- 音声認識を用いたマルチメディアコンテンツのインデクシング
- 仮想マルチスペクトルカメラ表現を用いたスペクトルに基づく画像生成法(画像認識,コンピュータビジョン)
- 映像シーン連動型掲示板コミュニケーションを用いたコミュニティ協働型メタデータ抽出方法(コンテンツ技術,Web情報システム)
- "気づき"に着目した情報提供システム「HotWindow」の開発(マルチメディア処理)
- blogページ集合に対する話題語句抽出手法(分類, ブログ)
- blogページ集合に対する話題語句抽出手法(分類, ブログ)
- 時系列ニュース記事における最新話題語抽出方法(重要語抽出・検索・文書分類)
- 時系列ニュース記事における最新話題語抽出方法(重要語抽出・検索・文書分類)
- 時系列ニュース記事における最新話題語抽出方法(重要語抽出・検索・文書分類)
- 比較評価情報を用いたオブジェクトのランキング手法 (特集 いまだかつてない検索サービス実現に向けたWebコンピューティング技術)
- 話題構造抽出に基づく会議音声インデクシングシステム(音声,聴覚)
- マルチスペクトル撮影による光源スペクトルの計測(画像認識,コンピュータビジョン)
- 単語概念ベクトルを用いた文書群からの代表語抽出(テーマ,膨大なデータから学ぶもの)
- ウェブ検索を利用したしきい値選択型テキストセグメンテーション(jDBワークショップ)
- Blogからの体験情報抽出(Webインテリジェンス,情報洪水時代のネットワークサービス)
- 目的指向型ブログ検索システムBLOGRANGERの提案およびユーザ評価
- 血管特徴を用いた眼底画像合成法(画像認識,コンピュータビジョン)
- Memory-Retriever : 体験獲得情報を想起させる行動検索手法(情報検索,インタラクション技術の原理と応用)
- グラフ分析を利用した文書集合からの話題構造マイニング(テキストマイニング,データ工学論文)
- ポータルサービスを支えるナビゲーション技術(オフィスインフォメーションシステム及び一般)
- グループトピックス 第3回 NTTコア技術シンポジウム「ポータル技術シンポジウム」開催報告
- 新しいポータルサービスの創出を目指して (特集 次世代ポータル技術)
- 絵文字の語義抽出と役割の曖昧性解消 (「知能と社会・ネットワーク」および一般)
- αダイバージェンスに基づく単語連想と文書分類への適用(テーマ関連セッション3,コンピュータビジョンとパターン認識のための学習理論)
- ベクトル量子化によるマルチスペクトル画像特徴表現と画像検索
- ベクトル量子化によるマルチスペクトル画像特徴と表現と画像検索
- 医療分野に特化した概念ベースによるDPCコーディング(一般,First Person Visionのための認識・理解)
- 競合学習を用いたエントロピー最小基準クラスタリング法(一般,First Person Visionのための認識・理解)
- 全単語間共起を考慮した概念ベース生成手法(一般,First Person Visionのための認識・理解)
- コメント・トラックバック分析に基づくブログ記事の影響度判定
- αダイバージェンスに基づく単語連想と文書分類への適用(テーマ関連セッション3)
- 確信度推定を用いた複数分類器の結合 (「Web情報処理」および一般発表)
- マルチスペクトル撮影による光源環境計測とスペクトルに基づく画像生成(テーマセッション, ユビキタスメディアの将来展望)
- 多原色による分光的画像再現 : 観察者メタメリズムの影響を解消するディスプレイ
- 通信・放送機構 赤坂ナチュラルビジョンリサーチセンター : ナチュラルビジョン(次世代映像表示・伝送システム)の研究開発
- ベクトル量子化によるマルチスペクトル画像検索(画像処理,画像パターン認識)
- TAO-2 ナチュラルビジョン : 次世代映像表示・伝送システム(大型プロジェクト紹介,学術系企画)
- 通信・放送機構 赤坂ナチュラルビジョンリサーチセンターの研究紹介 : ナチュラルビジョンの研究開発プロジェクト
- 投稿型教育支援システム「国体応援ニュース」の開発とその評価
- マルチスペクトル撮影による光源環境計測とスペクトルに基づく画像生成(テーマセッション, ユビキタスメディアの将来展望)
- Web検索を用いたテキストセグメンテーション (特集 いまだかつてない検索サービス実現に向けたWebコンピューティング技術)
- 単語概念ベクトルを用いた文書群からの代表語抽出(テーマ,膨大なデータから学ぶもの)
- ウェブ検索を利用したしきい値選択型テキストセグメンテーション(jDBワークショップ)
- 医療分野に特化した概念ベースによるDPCコーディング(一般,First Person Visionのための認識・理解)
- 医療分野に特化した概念ベースによるDPCコーディング(一般,First Person Visionのための認識・理解)
- NaMiSEN: ウェブ閲覧履歴への個人嗜好情報付加・抽出ツールの開発(オフィスにおけるデジタルドキュメント/コンテンツ管理技術及び一般)
- NaMiSEN: ウェブ閲覧履歴への個人嗜好情報付加・抽出ツールの開発(オフィスにおけるデジタルドキュメント/コンテンツ管理技術及び一般)
- Web ページのヘッドライン生成のための統計的要約
- 競合学習を用いたエントロピー最小基準クラスタリング法(一般,First Person Visionのための認識・理解)
- 競合学習を用いたエントロピー最小基準クラスタリング法(一般,First Person Visionのための認識・理解)
- 全単語間共起を考慮した概念ベース生成手法(一般,First Person Visionのための認識・理解)
- 時系列ニュース記事における最新話題語抽出方法(重要語抽出・検索・文書分類)
- 大語彙連続音声認識を用いた音声・映像コンテンツのインデクシング
- 一様範囲の推定を用いたテクスチャ画像の領域分割
- ウェブ検索を利用したしきい値選択型テキストセグメンテーション
- 血管の接続性を考慮したパノラマ眼底画像の作成
- 3D-6 絵文字を考慮したテキスト解析の研究(自然言語処理(1),一般セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 複数のWeb Wrapperによる高精度な情報抽出(セッション4:Web応用)
- 複数のWeb Wrapperによる高精度な情報抽出(セッション4:Web応用)
- 複数の Web Wrapper による高精度な情報抽出
- 単語・意味属性間共起に基づくコーパス概念ベースの生成方式
- 数10万件のコンテンツを対象とするにぎわい情報を用いたナビゲーションインタフェース
- 研究最前線からの報告--日英両言語の機械翻訳の現状と将来の展望
- 未知語の概念ベクトル推定手法(知識獲得,知識表現,生成)
- 未知語の概念ベクトル推定手法(知識獲得,知識表現,生成)
- E-016 種会話からの派生による話し言葉コーパス構築(E.自然言語・文書・ゲーム)
- 全単語間共起を考慮した概念ベース生成手法(一般,First Person Visionのための認識・理解)
- D-5-5 クエリログを利用した未知語抽出手法(D-5. 言語理解とコミュニケーション,一般セッション)
- 学習データのクラスタリングを用いた文書分類(手法検討,ライフログ活用技術,オフィス情報システム,ライフインテリジェンス)
- 単語間の階層関係に基づくテキスト分類方式(一般セッション,センシング技術とその応用)
- F-4 概念ベクトルによるトピックセグメンテーションのニュース音声への適用(音声・音声言語情報処理,F.音声・音楽)
- RJ-010 タグクラウドにおける感情の合図(J分野:ヒューマンコミュニケーション&インタラクション,査読付き論文)
- 単語間の階層関係に基づくテキスト分類方式(一般セッション,センシング技術とその応用)
- 単語・意味属性間共起に基づく単語間の階層関係の抽出(言語理解とオントロジーシンポジウム)
- 複数のWeb Wrapperによる高精度な情報抽出
- 複数の機械学習手法を用いた退院時サマリからの自動DPCコーディング
- 医療分野に特化した概念ベースによるDPCコーディング
- 文書クラスタリングアルゴリズムと基準の比較 (パターン認識・メディア理解)
- 文書クラスタリングアルゴリズムと基準の比較 (データ工学)
- 単語・意味属性間共起に基づく概念ベースの拡張方式
- クラスタ内変動最小基準に基づくテキストセグメンテーション(自然言語)
- クラスター内変動最小アルゴリズムに基づくトピックセグメンテーション
- 単語の概念ベクトルを用いたテキストセグメンテーション(21世紀のグループウェア)
- Web検索ログを用いた特定の話題における関心事分析(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 文書クラスタリングアルゴリズムと基準の比較(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- Web検索ログを用いた特定の話題における関心事分析(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 文書クラスタリングアルゴリズムと基準の比較(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- アクセスログを用いたクロスドメイン環境における情報推薦
- アクセスログを用いたクロスドメイン環境における情報推薦
- 競合学習を用いた情報理論的クラスタリング(人工知能,データマイニング)
- 競合学習を用いた情報理論的クラスタリング
- 単語概念ベクトルを用いた文書群からの代表語抽出
- PB電話機を用いた自動電話番号案内システムの開発と評価(データ工学,Web情報システム,システム開発論文)