全単語間共起を考慮した概念ベース生成手法(一般,First Person Visionのための認識・理解)
スポンサーリンク
概要
- 論文の詳細を見る
単語の意味表現としての概念ベクトルの生成方式として,各単語にランダムでかつユニークな番号集合を振り,単語・番号間共起行列をとることにより,全単語間の共起を考慮できる方式を提案する.提案方式は,全単語間共起の情報を含みながら,概念ベクトル生成及び使用におけるメモリ使用量が増えることはないという特徴をもつ.また,こうして生成した単語概念ベクトルをクラスタリングし,その結果できたクラスタの番号を各単語に振り,単語・クラスタ間共起行列をとって,単語・番号間共起行列と結合させる方式も提案する.これらの方式により生成した概念ベクトルを使用して,各種言語処理の精度を測定したところ,従来の概念ベクトル生成方式で生成した概念ベクトルを使用するよりも精度が向上することを確認した.
- 2010-05-06
著者
-
内山 俊郎
日本電信電話株式会社NTTサイバーソリューション研究所
-
別所 克人
日本電信電話株式会社NTTサイバーソリューション研究所
-
内山 匡
日本電信電話株式会社NTTサイバーソリューション研究所
-
内山 俊郎
日本電信電話株式会社サイバーソリューション研究所
-
内山 俊郎
NTTサイバーソリューション研究所
-
別所 克人
日本電信電話株式会社サイバーソリューション研究所
-
内山 匡
日本電信電話株式会社サイバーソリューション研究所
-
内山 俊郎
日本電信電話株式会社 サイバーソリューション研究所
-
内山 匡
日本電信電話株式会社 NTT サービスエボリューション研究所
関連論文
- 仮想マルチスペクトルカメラ表現を用いたスペクトルに基づく画像生成法 (画像符号化・映像メディア処理レター特集)
- 検索クエリを用いた場所の関連語の取得 (「知能と社会・ネットワーク」および一般)
- PC操作履歴収集システム「メモリ・リトリーバ」 (特集 ライフログ活用サービスの基盤技術)
- 全単語間共起を考慮した概念ベース生成手法 (パターン認識・メディア理解)
- 全単語間共起を考慮した概念ベース生成手法 (画像工学)
- 医療分野に特化した概念ベースによるDPCコーディング (医用画像)
- 音声認識を用いたマルチメディアコンテンツのインデクシング
- 仮想マルチスペクトルカメラ表現を用いたスペクトルに基づく画像生成法(画像認識,コンピュータビジョン)
- ブログ文書集合を用いた語句関連性の抽出手法 (特集 いまだかつてない検索サービス実現に向けたWebコンピューティング技術)
- 話題構造抽出に基づく会議音声インデクシングシステム(音声,聴覚)
- マルチスペクトル撮影による光源スペクトルの計測(画像認識,コンピュータビジョン)
- 単語概念ベクトルを用いた文書群からの代表語抽出(テーマ,膨大なデータから学ぶもの)
- ウェブ検索を利用したしきい値選択型テキストセグメンテーション(jDBワークショップ)
- 絵文字の語義抽出と役割の曖昧性解消 (「知能と社会・ネットワーク」および一般)
- αダイバージェンスに基づく単語連想と文書分類への適用(テーマ関連セッション3,コンピュータビジョンとパターン認識のための学習理論)
- ベクトル量子化によるマルチスペクトル画像特徴表現と画像検索
- ベクトル量子化によるマルチスペクトル画像特徴と表現と画像検索
- 医療分野に特化した概念ベースによるDPCコーディング(一般,First Person Visionのための認識・理解)
- 競合学習を用いたエントロピー最小基準クラスタリング法(一般,First Person Visionのための認識・理解)
- 全単語間共起を考慮した概念ベース生成手法(一般,First Person Visionのための認識・理解)
- αダイバージェンスに基づく単語連想と文書分類への適用(テーマ関連セッション3)
- 確信度推定を用いた複数分類器の結合 (「Web情報処理」および一般発表)
- マルチスペクトル撮影による光源環境計測とスペクトルに基づく画像生成(テーマセッション, ユビキタスメディアの将来展望)
- 多原色による分光的画像再現 : 観察者メタメリズムの影響を解消するディスプレイ
- 通信・放送機構 赤坂ナチュラルビジョンリサーチセンター : ナチュラルビジョン(次世代映像表示・伝送システム)の研究開発
- ベクトル量子化によるマルチスペクトル画像検索(画像処理,画像パターン認識)
- TAO-2 ナチュラルビジョン : 次世代映像表示・伝送システム(大型プロジェクト紹介,学術系企画)
- 通信・放送機構 赤坂ナチュラルビジョンリサーチセンターの研究紹介 : ナチュラルビジョンの研究開発プロジェクト
- マルチスペクトル撮影による光源環境計測とスペクトルに基づく画像生成(テーマセッション, ユビキタスメディアの将来展望)
- Web検索を用いたテキストセグメンテーション (特集 いまだかつてない検索サービス実現に向けたWebコンピューティング技術)
- 単語概念ベクトルを用いた文書群からの代表語抽出(テーマ,膨大なデータから学ぶもの)
- ウェブ検索を利用したしきい値選択型テキストセグメンテーション(jDBワークショップ)
- 医療分野に特化した概念ベースによるDPCコーディング(一般,First Person Visionのための認識・理解)
- 医療分野に特化した概念ベースによるDPCコーディング(一般,First Person Visionのための認識・理解)
- 話題構造抽出に基づく会議音声インデクシング
- 競合学習を用いたエントロピー最小基準クラスタリング法(一般,First Person Visionのための認識・理解)
- 競合学習を用いたエントロピー最小基準クラスタリング法(一般,First Person Visionのための認識・理解)
- 時刻情報を考慮したロケーションベースドサービス(LBS)によるコンテンツ表示インタフェースについて(システム開発,ライフログ活用技術,オフィス情報システム,情報通信マネジメント,一般)
- 全単語間共起を考慮した概念ベース生成手法(一般,First Person Visionのための認識・理解)
- 大語彙連続音声認識を用いた音声・映像コンテンツのインデクシング
- 一様範囲の推定を用いたテクスチャ画像の領域分割
- MyBoom:Wikipediaに基づくWeb閲覧履歴からの興味情報推薦システム(不均質なライフログからのデータマイニング及び一般)
- 複数特徴量を統合したvisual wordsによる料理画像の分類(画像情報の分類と多重化,ドキュメントオートメーションとオンサイトデータ活用技術,及び一般)
- D-4-11 Web文書からの軽量な本文抽出法(D-4. データ工学,一般セッション)
- Wikipediaを用いたWeb閲覧履歴からのキーワードプロファイル抽出とその応用(jDBワークショップ)
- Wikipediaを用いたWeb閲覧履歴からのキーワードプロファイル抽出とその応用(jDBワークショップ)
- ウェブ検索を利用したしきい値選択型テキストセグメンテーション
- 血管の接続性を考慮したパノラマ眼底画像の作成
- 3D-6 絵文字を考慮したテキスト解析の研究(自然言語処理(1),一般セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 複数のWeb Wrapperによる高精度な情報抽出(セッション4:Web応用)
- 複数のWeb Wrapperによる高精度な情報抽出(セッション4:Web応用)
- 複数の Web Wrapper による高精度な情報抽出
- 単語・意味属性間共起に基づくコーパス概念ベースの生成方式
- 未知語の概念ベクトル推定手法(知識獲得,知識表現,生成)
- 未知語の概念ベクトル推定手法(知識獲得,知識表現,生成)
- 全単語間共起を考慮した概念ベース生成手法(一般,First Person Visionのための認識・理解)
- D-5-5 クエリログを利用した未知語抽出手法(D-5. 言語理解とコミュニケーション,一般セッション)
- 学習データのクラスタリングを用いた文書分類(手法検討,ライフログ活用技術,オフィス情報システム,ライフインテリジェンス)
- 単語間の階層関係に基づくテキスト分類方式(一般セッション,センシング技術とその応用)
- F-4 概念ベクトルによるトピックセグメンテーションのニュース音声への適用(音声・音声言語情報処理,F.音声・音楽)
- RJ-010 タグクラウドにおける感情の合図(J分野:ヒューマンコミュニケーション&インタラクション,査読付き論文)
- 単語間の階層関係に基づくテキスト分類方式(一般セッション,センシング技術とその応用)
- 単語・意味属性間共起に基づく単語間の階層関係の抽出(言語理解とオントロジーシンポジウム)
- 複数のWeb Wrapperによる高精度な情報抽出
- 複数の機械学習手法を用いた退院時サマリからの自動DPCコーディング
- 医療分野に特化した概念ベースによるDPCコーディング
- 文書クラスタリングアルゴリズムと基準の比較 (パターン認識・メディア理解)
- 文書クラスタリングアルゴリズムと基準の比較 (データ工学)
- Web検索ログを用いた特定の話題における関心事分析 (パターン認識・メディア理解)
- Web検索ログを用いた特定の話題における関心事分析 (データ工学)
- D-9-7 CGM活用型大規模コンテンツ可視化システム『どれみる?マップ』の構築と公開について(D-9. オフィスインフォメーションシステム,一般セッション)
- 単語・意味属性間共起に基づく概念ベースの拡張方式
- クラスタ内変動最小基準に基づくテキストセグメンテーション(自然言語)
- クラスター内変動最小アルゴリズムに基づくトピックセグメンテーション
- 単語の概念ベクトルを用いたテキストセグメンテーション(21世紀のグループウェア)
- インスタント質問文検索システムの提案(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- インスタント質問文検索システムの提案(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- Web検索ログを用いた特定の話題における関心事分析(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 文書クラスタリングアルゴリズムと基準の比較(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- Web検索ログを用いた特定の話題における関心事分析(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 文書クラスタリングアルゴリズムと基準の比較(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- アクセスログを用いたクロスドメイン環境における情報推薦
- アクセスログを用いたクロスドメイン環境における情報推薦
- 競合学習を用いた情報理論的クラスタリング(人工知能,データマイニング)
- 階層的オートタギング技術とその応用
- 競合学習を用いた情報理論的クラスタリング文書クラスタリングにおける基準及びアルゴリズムの比較
- 競合学習を用いた情報理論的クラスタリング
- 単語概念ベクトルを用いた文書群からの代表語抽出
- タクソノミを用いたNoveltyの高いアイテムの推薦手法(データ工学,Web情報システム)
- 単語概念ベクトルを用いた文書群からの代表語抽出
- マルコフ確率場を用いたソーシャルネットワークからのユーザ属性推定(人工知能,データマイニング,インターネット技術とその応用論文)
- 競合学習を用いた情報理論的クラスタリング文書クラスタリングにおける基準及びアルゴリズムの比較(テーマセッション,コンピュータビジョンとパターン認識のための機械学習及び企業ニーズセッション)
- モニター調査型ログ収集による競合サイト間の比較分析(ログ分析と推定,ライフログ活用技術,オフィスインフォメーションシステム,ライフインテリジェンス,及び一般)
- 競合学習を用いた情報理論的クラスタリング文書クラスタリングにおける基準及びアルゴリズムの比較(コンピュータビジョンとパターン認識のための機械学習及び企業ニーズセッション)