単語間の階層関係に基づくテキスト分類方式(一般セッション,センシング技術とその応用)
スポンサーリンク
概要
- 論文の詳細を見る
従来のテキスト分類方式は、文書をベクトルとして表現し、コサイン類似度やユークリッド距離のような双方向性のある尺度を、ベクトル間の近さのベースと考えるものが多い。これに対し本稿では、カルバック・ライブラー距離という双方向性のない尺度をテキスト分類に導入する。単語ベクトル間の距離尺度としてカルバック・ライブラー距離を用いると、コサイン類似度を用いた場合と比べ、単語間の連想の様相が変わる。本稿では、この性質を利用し、従来のコサイン類似度やユークリッド距離をベースとする分類方式と、カルバック・ライブラー距離をベースとする分類方式を組み合わせる方式を提案する。評価実験の結果、組み合わせることにより、従来方式よりも精度が向上することを確認した。
- 社団法人電子情報通信学会の論文
- 2007-05-17
著者
-
内山 俊郎
日本電信電話株式会社NTTサイバーソリューション研究所
-
別所 克人
日本電信電話株式会社NTTサイバーソリューション研究所
-
片岡 良治
日本電信電話株式会社NTTサイバーソリューション研究所
-
片岡 良治
日本電信電話株式会社サイバーソリューション研究所
-
内山 俊郎
日本電信電話株式会社サイバーソリューション研究所
-
別所 克人
日本電信電話株式会社サイバーソリューション研究所
-
片岡 良治
Nttサイバーソリューション研究所
-
内山 俊郎
日本電信電話株式会社 サイバーソリューション研究所
-
片岡 良治
日本電信電話株式会社NTTサイバースペース研究所
-
片岡 良治
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
片岡 良治
日本電信電話株式会社 NTTサイバーソリューション研究所
関連論文
- 仮想マルチスペクトルカメラ表現を用いたスペクトルに基づく画像生成法 (画像符号化・映像メディア処理レター特集)
- 検索クエリを用いた場所の関連語の取得 (「知能と社会・ネットワーク」および一般)
- 全単語間共起を考慮した概念ベース生成手法 (パターン認識・メディア理解)
- 全単語間共起を考慮した概念ベース生成手法 (画像工学)
- 医療分野に特化した概念ベースによるDPCコーディング (医用画像)
- 音声認識を用いたマルチメディアコンテンツのインデクシング
- 仮想マルチスペクトルカメラ表現を用いたスペクトルに基づく画像生成法(画像認識,コンピュータビジョン)
- モバイル端末を考慮したロケーションアウェア情報検索(ポスターセッション,iDBフォーラム2008(招待講演・ポスター英語ディスカッション))
- 話題構造抽出に基づく会議音声インデクシングシステム(音声,聴覚)
- マルチスペクトル撮影による光源スペクトルの計測(画像認識,コンピュータビジョン)
- 単語概念ベクトルを用いた文書群からの代表語抽出(テーマ,膨大なデータから学ぶもの)
- ウェブ検索を利用したしきい値選択型テキストセグメンテーション(jDBワークショップ)
- 目的指向型ブログ検索システムBLOGRANGERの提案およびユーザ評価
- グラフ分析を利用した文書集合からの話題構造マイニング(テキストマイニング,データ工学論文)
- ポータルサービスを支えるナビゲーション技術(オフィスインフォメーションシステム及び一般)
- 絵文字の語義抽出と役割の曖昧性解消 (「知能と社会・ネットワーク」および一般)
- αダイバージェンスに基づく単語連想と文書分類への適用(テーマ関連セッション3,コンピュータビジョンとパターン認識のための学習理論)
- ベクトル量子化によるマルチスペクトル画像特徴表現と画像検索
- ベクトル量子化によるマルチスペクトル画像特徴と表現と画像検索
- ソーシャルブックマークユーザのタグ付与行動に基づくスパマー判別手法(ウェブ情報とデータベースに関して(ポスター講演))
- マルチファセット型ブログ検索システムBLOGRANGERの開発(オフィスインフォメーションシステム及び一般)
- 医療分野に特化した概念ベースによるDPCコーディング(一般,First Person Visionのための認識・理解)
- 競合学習を用いたエントロピー最小基準クラスタリング法(一般,First Person Visionのための認識・理解)
- 全単語間共起を考慮した概念ベース生成手法(一般,First Person Visionのための認識・理解)
- αダイバージェンスに基づく単語連想と文書分類への適用(テーマ関連セッション3)
- 確信度推定を用いた複数分類器の結合 (「Web情報処理」および一般発表)
- マルチスペクトル撮影による光源環境計測とスペクトルに基づく画像生成(テーマセッション, ユビキタスメディアの将来展望)
- 多原色による分光的画像再現 : 観察者メタメリズムの影響を解消するディスプレイ
- 通信・放送機構 赤坂ナチュラルビジョンリサーチセンター : ナチュラルビジョン(次世代映像表示・伝送システム)の研究開発
- ベクトル量子化によるマルチスペクトル画像検索(画像処理,画像パターン認識)
- TAO-2 ナチュラルビジョン : 次世代映像表示・伝送システム(大型プロジェクト紹介,学術系企画)
- 通信・放送機構 赤坂ナチュラルビジョンリサーチセンターの研究紹介 : ナチュラルビジョンの研究開発プロジェクト
- 楕円体問合せのための空間変換を用いた類似探索アルゴリズム
- 文書情報統合のためのテキスト表現モデルの提案と主題グラフを用いた実現
- マルチスペクトル撮影による光源環境計測とスペクトルに基づく画像生成(テーマセッション, ユビキタスメディアの将来展望)
- Web検索を用いたテキストセグメンテーション (特集 いまだかつてない検索サービス実現に向けたWebコンピューティング技術)
- ネット上の会話からの話題即時抽出技術の評価について(Webからの知識発見とネット応用)
- ネット上の会話からの話題即時抽出技術の評価について(Webからの知識発見とネット応用)
- 単語概念ベクトルを用いた文書群からの代表語抽出(テーマ,膨大なデータから学ぶもの)
- ウェブ検索を利用したしきい値選択型テキストセグメンテーション(jDBワークショップ)
- 適合性分布が異なる情報源を用いたランキング学習
- 概念ベースに基づくWeb検索のクエリタイプ判定手法とその評価
- 医療分野に特化した概念ベースによるDPCコーディング(一般,First Person Visionのための認識・理解)
- 医療分野に特化した概念ベースによるDPCコーディング(一般,First Person Visionのための認識・理解)
- レアクエリを対象とした非クリック分析によるクエリ推薦方式の提案
- 評判検索におけるクエリ依存型の評価極性付与(意見・評判情報処理)
- ブログ記事からの意見文検索(意見・評判情報処理)
- 評判検索におけるクエリ依存型の評価極性付与
- 競合学習を用いたエントロピー最小基準クラスタリング法(一般,First Person Visionのための認識・理解)
- 競合学習を用いたエントロピー最小基準クラスタリング法(一般,First Person Visionのための認識・理解)
- 全単語間共起を考慮した概念ベース生成手法(一般,First Person Visionのための認識・理解)
- 大語彙連続音声認識を用いた音声・映像コンテンツのインデクシング
- 一様範囲の推定を用いたテクスチャ画像の領域分割
- D-006 ラベル指向情報検索における分類ラベル統合方式の検討(D.データベース)
- D-035 クエリログから抽出した関連語集合を用いたウェブページ検索(D分野:データベース,一般論文)
- ウェブ検索を利用したしきい値選択型テキストセグメンテーション
- 血管の接続性を考慮したパノラマ眼底画像の作成
- 3D-6 絵文字を考慮したテキスト解析の研究(自然言語処理(1),一般セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 文書情報統合のためのテキスト表現モデルの提案と主題グラフを用いた実現
- 複数のWeb Wrapperによる高精度な情報抽出(セッション4:Web応用)
- 複数のWeb Wrapperによる高精度な情報抽出(セッション4:Web応用)
- 複数の Web Wrapper による高精度な情報抽出
- ブログ記事要約における重要文位置の調査
- 特徴的な固有表現を用いたラベル指向ナビゲーション手法の提案
- E-011 記事群の冗長度を削減するためのRSSニュースリーダ(E分野:自然言語)
- Blogのタグ間類似度のスコアリング
- コミュニティ抽出のためのクエリ共起語のクラスタリングに関する一考察(オフィスインフォメーションシステム及び一般)
- D-10-9 耐障害性を備えた全文検索エンジンの実装(D-10. ディペンダブルコンピューティング,一般セッション)
- 単語・意味属性間共起に基づくコーパス概念ベースの生成方式
- 未知語の概念ベクトル推定手法(知識獲得,知識表現,生成)
- 未知語の概念ベクトル推定手法(知識獲得,知識表現,生成)
- 全単語間共起を考慮した概念ベース生成手法(一般,First Person Visionのための認識・理解)
- D-5-5 クエリログを利用した未知語抽出手法(D-5. 言語理解とコミュニケーション,一般セッション)
- 学習データのクラスタリングを用いた文書分類(手法検討,ライフログ活用技術,オフィス情報システム,ライフインテリジェンス)
- 単語間の階層関係に基づくテキスト分類方式(一般セッション,センシング技術とその応用)
- F-4 概念ベクトルによるトピックセグメンテーションのニュース音声への適用(音声・音声言語情報処理,F.音声・音楽)
- RJ-010 タグクラウドにおける感情の合図(J分野:ヒューマンコミュニケーション&インタラクション,査読付き論文)
- E-038 文書構造を考慮した近接度スコアを用いた文書検索結果ランキング方式(E分野:自然言語・音声・音楽,一般論文)
- 検索結果のアクセス分析に基づく情報要求ベースのランキング(ウェブ情報とデータベースに関して(ポスター講演))
- 単語間の階層関係に基づくテキスト分類方式(一般セッション,センシング技術とその応用)
- 単語・意味属性間共起に基づく単語間の階層関係の抽出(言語理解とオントロジーシンポジウム)
- 複数のWeb Wrapperによる高精度な情報抽出
- 複数の機械学習手法を用いた退院時サマリからの自動DPCコーディング
- 医療分野に特化した概念ベースによるDPCコーディング
- 文書クラスタリングアルゴリズムと基準の比較 (パターン認識・メディア理解)
- 文書クラスタリングアルゴリズムと基準の比較 (データ工学)
- 単語・意味属性間共起に基づく概念ベースの拡張方式
- クラスタ内変動最小基準に基づくテキストセグメンテーション(自然言語)
- クラスター内変動最小アルゴリズムに基づくトピックセグメンテーション
- 単語の概念ベクトルを用いたテキストセグメンテーション(21世紀のグループウェア)
- Web検索ログを用いた特定の話題における関心事分析(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 文書クラスタリングアルゴリズムと基準の比較(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- Web検索ログを用いた特定の話題における関心事分析(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 文書クラスタリングアルゴリズムと基準の比較(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- アクセスログを用いたクロスドメイン環境における情報推薦
- アクセスログを用いたクロスドメイン環境における情報推薦
- 競合学習を用いた情報理論的クラスタリング(人工知能,データマイニング)
- 競合学習を用いた情報理論的クラスタリング
- 単語概念ベクトルを用いた文書群からの代表語抽出
- 単語概念ベクトルを用いた文書群からの代表語抽出