未知語の概念ベクトル推定手法(知識獲得,知識表現,生成)
スポンサーリンク
概要
- 論文の詳細を見る
他の単語との共起パターンから導出される単語の意味表現である概念ベクトルとその集合である概念ベースは、テキストの話題構造化や検索に非常に有用なものであるが、概念ベースに含まれない単語としての未知語には概念ベクトルが付与されず、概念ベースを利用した処理において考慮されないという問題がある。本稿では、テキストにおける共起情報から、未知語の概念ベクトルを推定する手法を提案する。新聞記事を用いたトピックセグメンテーションの評価実験の結果、推定ベクトルを用いる手法は、用いない手法よりも精度が向上することを検証した。
- 社団法人電子情報通信学会の論文
- 2004-10-28
著者
-
奥 雅博
NTTソフトウェア株式会社
-
奥 雅博
日本電信電話株式会社NTTサイバーソリューション研究所
-
別所 克人
日本電信電話株式会社NTTサイバーソリューション研究所
-
奥 雅博
日本電信電話株式会社 Ntt光ソフトサービス推進プロジェクト
-
別所 克人
日本電信電話株式会社サイバーソリューション研究所
関連論文
- コメント・トラックバック分析に基づくブログ記事の影響度判定(Webマイニング,情報爆発論文)
- 映像解析技術に基づく編集機能をもつモバイル映像ブログシステム(コンテンツ技術,Web情報システム)
- 仮想マルチスペクトルカメラ表現を用いたスペクトルに基づく画像生成法 (画像符号化・映像メディア処理レター特集)
- 音声認識を用いたマルチメディアコンテンツのインデクシング
- 仮想マルチスペクトルカメラ表現を用いたスペクトルに基づく画像生成法(画像認識,コンピュータビジョン)
- 映像シーン連動型掲示板コミュニケーションを用いたコミュニティ協働型メタデータ抽出方法(コンテンツ技術,Web情報システム)
- "気づき"に着目した情報提供システム「HotWindow」の開発(マルチメディア処理)
- blogページ集合に対する話題語句抽出手法(分類, ブログ)
- blogページ集合に対する話題語句抽出手法(分類, ブログ)
- 時系列ニュース記事における最新話題語抽出方法(重要語抽出・検索・文書分類)
- 時系列ニュース記事における最新話題語抽出方法(重要語抽出・検索・文書分類)
- 時系列ニュース記事における最新話題語抽出方法(重要語抽出・検索・文書分類)
- 比較評価情報を用いたオブジェクトのランキング手法 (特集 いまだかつてない検索サービス実現に向けたWebコンピューティング技術)
- 話題構造抽出に基づく会議音声インデクシングシステム(音声,聴覚)
- マルチスペクトル撮影による光源スペクトルの計測(画像認識,コンピュータビジョン)
- 単語概念ベクトルを用いた文書群からの代表語抽出(テーマ,膨大なデータから学ぶもの)
- ウェブ検索を利用したしきい値選択型テキストセグメンテーション(jDBワークショップ)
- Blogからの体験情報抽出(Webインテリジェンス,情報洪水時代のネットワークサービス)
- 目的指向型ブログ検索システムBLOGRANGERの提案およびユーザ評価
- 血管特徴を用いた眼底画像合成法(画像認識,コンピュータビジョン)
- Memory-Retriever : 体験獲得情報を想起させる行動検索手法(情報検索,インタラクション技術の原理と応用)
- グラフ分析を利用した文書集合からの話題構造マイニング(テキストマイニング,データ工学論文)
- ポータルサービスを支えるナビゲーション技術(オフィスインフォメーションシステム及び一般)
- グループトピックス 第3回 NTTコア技術シンポジウム「ポータル技術シンポジウム」開催報告
- 新しいポータルサービスの創出を目指して (特集 次世代ポータル技術)
- 絵文字の語義抽出と役割の曖昧性解消 (「知能と社会・ネットワーク」および一般)
- αダイバージェンスに基づく単語連想と文書分類への適用(テーマ関連セッション3,コンピュータビジョンとパターン認識のための学習理論)
- 競合学習を用いたエントロピー最小基準クラスタリング法(一般,First Person Visionのための認識・理解)
- 全単語間共起を考慮した概念ベース生成手法(一般,First Person Visionのための認識・理解)
- コメント・トラックバック分析に基づくブログ記事の影響度判定
- αダイバージェンスに基づく単語連想と文書分類への適用(テーマ関連セッション3)
- 確信度推定を用いた複数分類器の結合 (「Web情報処理」および一般発表)
- 投稿型教育支援システム「国体応援ニュース」の開発とその評価
- Web検索を用いたテキストセグメンテーション (特集 いまだかつてない検索サービス実現に向けたWebコンピューティング技術)
- 単語概念ベクトルを用いた文書群からの代表語抽出(テーマ,膨大なデータから学ぶもの)
- ウェブ検索を利用したしきい値選択型テキストセグメンテーション(jDBワークショップ)
- NaMiSEN: ウェブ閲覧履歴への個人嗜好情報付加・抽出ツールの開発(オフィスにおけるデジタルドキュメント/コンテンツ管理技術及び一般)
- NaMiSEN: ウェブ閲覧履歴への個人嗜好情報付加・抽出ツールの開発(オフィスにおけるデジタルドキュメント/コンテンツ管理技術及び一般)
- Web ページのヘッドライン生成のための統計的要約
- 話題構造抽出に基づく会議音声インデクシング
- 競合学習を用いたエントロピー最小基準クラスタリング法(一般,First Person Visionのための認識・理解)
- 競合学習を用いたエントロピー最小基準クラスタリング法(一般,First Person Visionのための認識・理解)
- 全単語間共起を考慮した概念ベース生成手法(一般,First Person Visionのための認識・理解)
- 時系列ニュース記事における最新話題語抽出方法(重要語抽出・検索・文書分類)
- 大語彙連続音声認識を用いた音声・映像コンテンツのインデクシング
- ウェブ検索を利用したしきい値選択型テキストセグメンテーション
- 血管の接続性を考慮したパノラマ眼底画像の作成
- 3D-6 絵文字を考慮したテキスト解析の研究(自然言語処理(1),一般セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 単語・意味属性間共起に基づくコーパス概念ベースの生成方式
- 数10万件のコンテンツを対象とするにぎわい情報を用いたナビゲーションインタフェース
- 研究最前線からの報告--日英両言語の機械翻訳の現状と将来の展望
- 未知語の概念ベクトル推定手法(知識獲得,知識表現,生成)
- 未知語の概念ベクトル推定手法(知識獲得,知識表現,生成)
- E-016 種会話からの派生による話し言葉コーパス構築(E.自然言語・文書・ゲーム)
- 全単語間共起を考慮した概念ベース生成手法(一般,First Person Visionのための認識・理解)
- D-5-5 クエリログを利用した未知語抽出手法(D-5. 言語理解とコミュニケーション,一般セッション)
- 学習データのクラスタリングを用いた文書分類(手法検討,ライフログ活用技術,オフィス情報システム,ライフインテリジェンス)
- 単語間の階層関係に基づくテキスト分類方式(一般セッション,センシング技術とその応用)
- F-4 概念ベクトルによるトピックセグメンテーションのニュース音声への適用(音声・音声言語情報処理,F.音声・音楽)
- 単語間の階層関係に基づくテキスト分類方式(一般セッション,センシング技術とその応用)
- 単語・意味属性間共起に基づく単語間の階層関係の抽出(言語理解とオントロジーシンポジウム)
- 文書クラスタリングアルゴリズムと基準の比較 (パターン認識・メディア理解)
- 文書クラスタリングアルゴリズムと基準の比較 (データ工学)
- 単語・意味属性間共起に基づく概念ベースの拡張方式
- クラスタ内変動最小基準に基づくテキストセグメンテーション(自然言語)
- クラスター内変動最小アルゴリズムに基づくトピックセグメンテーション
- 単語の概念ベクトルを用いたテキストセグメンテーション(21世紀のグループウェア)
- インスタント質問文検索システムの提案(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- インスタント質問文検索システムの提案(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 文書クラスタリングアルゴリズムと基準の比較(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 文書クラスタリングアルゴリズムと基準の比較(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 単語概念ベクトルを用いた文書群からの代表語抽出
- 単語概念ベクトルを用いた文書群からの代表語抽出
- PB電話機を用いた自動電話番号案内システムの開発と評価(データ工学,Web情報システム,システム開発論文)