キーワード抽出の整数計画問題としての定式化(機械学習・応用)
スポンサーリンク
概要
- 論文の詳細を見る
本稿では文書からキーワードを自動抽出する手法を提案する.提案手法は教師ありデータを用いない手法に分類される.提案手法の特徴は,単語単体に関する特徴量と,二つの単語間の関係に関する特徴を同時に適切に考慮できる点にある.これを実現するために,キーワード抽出を,組み合わせ最適化問題の下位問題である施設配置問題の考えから捉え,キーワード抽出課題を整数計画問題として定式化する.評価実験を通して,単語単体に関する特徴量と,二つの単語間の関係に関する特徴を組み合わせることが性能向上に貢献すること,及び組み合わせを実現する方法論として提案手法が有効に機能することを示す.
- 一般社団法人情報処理学会の論文
- 2008-11-19
著者
-
石川 正道
東京工業大学
-
石川 正道
東工大
-
橋本 泰一
東京工業大学統合研究院
-
高村 大也
東京工業大学精密工学研究所
-
乾 孝司
東京工業大学統合研究院
-
橋本 泰一
東京工業大学
-
乾 孝司
奈良先端科学技術大学院大学情報科学研究科
-
乾 孝司
筑波大学大学院システム情報工学研究科
-
内海 和夫
東京工業大学統合研究院
-
高村 大也
東京工業大学 精密工学研究所
-
乾 孝司
奈良先端科学技術大学院大学情報科学研究科情報処理学専攻
-
石川 正道
東京工大
-
高村 大也
東京工業大学
関連論文
- 社会課題とその解決に結びつく科学技術に関する有用知識の抽出
- 社会課題発見のための文書クラスタリングとクラスタ評価指標(情報分析・要約(テーマセッション1))
- スピンモデルによる単語の感情極性抽出(自然言語)
- 品詞間接続制約のLR構文解析表への組み込みの局所性の解消
- 論文と特許を対象にした技術動向分析 第7回,第8回NTCIRワークショップ 特許マイニングタスク
- 拡張固有表現タグ付きコーパスの構築(マイニング・知識獲得・固有表現)
- 第34回結晶成長討論会開催報告(学会活動報告)
- 二酸化炭素臨界流体中の動的ピストン効果研究のためのフライト実験装置の開発
- イベントの生起時間帯判定(分類, ブログ)
- 1.テキスト評価分析の技術とその応用(ユーザ作成のコンテンツに着目した嗜好・評判抽出, 利用者の好みをとらえ活かす-嗜好抽出技術の最前線-)
- 特許情報処理を指向したテストコレクションの構築 : 情報検索と自然言語処理の融合を目指して(NTCIR特別セッション)
- 特許情報処理を指向したテストコレクションの構築 : 情報検索と自然言語処理の融合を目指して(NTCIR特別セッション)
- 二酸化炭素臨界流体中の動的ピストン効果研究のためのフライト実験装置の開発
- 臨界点近傍流体中の「ピストン効果」素過程の直接観察
- 施設配置問題による文書要約のモデル化
- WEB上の画像の分類とメタデータ付与による携帯電話向けWEB表示(セッション1:メタデータと自動分類、知識支援)
- WEB上の画像の分類とメタデータ付与による携帯電話向けWEB表示(セッション1:メタデータと自動分類、知識支援)
- 重要文抽出と文圧縮を組み合わせた新たな抽出的要約手法(翻訳・要約・抽出)
- 重要文抽出と文圧縮を組み合わせた新たな抽出的要約手法(翻訳・要約・抽出)
- 文書要約の最大充足化問題によるモデル化(翻訳・要約)
- 文書要約の最大充足化問題によるモデル化(翻訳・要約)
- 複数の分類スコアを用いたクラス所属確率の推定
- 文の感情極性判定における事例重み付けによるドメイン適応(情報抽出・評判分析)
- ブログ記事集合を用いたポストとコメントとの自動分離抽出手法の提案
- E-014 新聞記事からの社会課題に対する技術的対策情報の抽出(自然言語・音声・音楽,一般論文)
- 関係データベースを用いた構文木付きコーパス検索手法
- テキスト構文構造類似度を用いた類似文検索手法(セッション3: メタデータとオントロジ応用)
- テキスト構文構造類似度を用いた類似文検索手法(セッション3: メタデータとオントロジ応用)
- 大規模日本語文法の開発
- 日英言語横断情報検索のための翻訳知識の獲得
- 単語の共起情報を利用した文法主導の係り受け解析(基盤・要素技術)(セマンティックウェブと自然言語処理その他一般)
- システム主導型コーパス作成インターフェースとその評価(抽出,コーパス)
- 決定リストにおける規則の適用順序に関する考察
- 自然言語解析のためのMSLRパーザ・ツールキット
- 2000-NL-138-12 統計的手法に基づく形容詞または形容動詞の修飾先の決定
- NLC2000-21 統計的手法に基づく形容詞または形容動詞の修飾先の決定
- 構造付きコーパスからの統語的知識の自動獲得とその精密化
- 偉人の言葉から学ぶ(編集委員今年の抱負2011)
- テキスト中のイベントの生起時間帯判定(自然言語)
- 専門用語抽出における助詞情報の利用に関する一考察(情報抽出・ラベル付与)
- 2F08 東京工業大学統合研究院における大学シンクタンク機能の創設と課題((ホットイシュー) 次の学際・融合研究に向けて (5), 第20回年次学術大会講演要旨集II)
- 語彙ネットワークからの単語の感情極性抽出 : 統計力学的視点からの精度改善法(IBIS2010(情報論的学習理論ワークショップ))
- キーワード抽出の整数計画問題としての定式化(機械学習・応用)
- 社会課題発見のための文書クラスタリングとクラスタ評価指標(情報分析・要約(テーマセッション1))
- 文書クラスタリングによるトピック抽出および課題発見
- 文書からの組織名抽出における辞書利用(情報抽出・ラベル付与)
- 2E07 大規模テキストマイニングによる医療分野の社会課題・技術トレンド抽出(メトリクス,一般講演,第22回年次学術大会)
- 共起語に基づいた階層型文書クラスタリング手法(セッション1:テキストマイニング)
- 共起語に基づいた階層型文書クラスタリング手法(セッション1:テキストマイニング)
- 微小重力下での結晶成長(第13回結晶成長国際会議(ICCG-13/ICVGE-11))
- 隠れ変数モデルによる複数語表現の感情極性分類(自然言語)
- テキストを対象とした評価情報の分析に関する研究動向
- 極性反転に対応した評価表現モデル(言語の統計モデル)
- 極性反転に対応した評価表現モデル(言語の統計モデル)
- 文書内に現れる因果関係の出現特性調査(解析, QA, 言語調査)
- 文書内に現れる因果関係の出現特性調査(解析, QA, 言語調査)
- スピンモデルによる単語の感情極性判定(シソーラス・辞書)
- 文書内に現れる因果関係の出現特性調査
- 接続標識「ため」に基づく文書集合からの因果関係知識の自動獲得(自然言語)
- 接続助詞「ため」を含む複文から因果関係知識を獲得する
- 接続助詞「ため」を含む複文から因果関係知識を獲得する
- 複数のパーザを利用した統計的部分係り受け解析
- 語釈文を利用した「p/n 辞書」の作成 (テーマ なぜインタラクションでなければならないか?)
- 分類スコアに基づいたクラス事後確率の推定(コーパス, 学習, 対話, 要約)
- 機械学習とルールベースの組み合わせによる自動職業コーディング
- ルールベース手法と機械学習による自由回答の分類 : 職業コーディング自動化の方法(非定型データ分析の可能性)
- 機械学習とルールベースによる職業コーディング(テキスト検索,分類)
- 符号化問題として解く日本語係り受け解析(文の解析)
- blog分類のための半教師有り学習(Web情報アクセス)
- blog分類のための半教師有り学習(Web情報アクセス)
- 単語極性反転モデルによる評価文分類
- 単語極性反転モデルによる評価文分類(感情・評価)
- 3. 微小重力下低温プラズマにおける基礎物理化学(微小重力環境を利用したプラズマプロセスへの誘い)
- 宇宙環境における基礎化学の研究シナリオ
- ゆらぎと微小重力
- 分子プログラミングへの物質科学からの期待(期待される結晶成長)
- 5. 微小重力下プラズマCVDによるダイヤモンド生成(微小重力環境を利用したプラズマプロセスへの誘い)
- 宇宙ステーションと化学
- カーネル関数によるカテゴリ構造のモデル化(分類、クラスタリング, 機械学習)(言語理解とコミュニケーション)
- カーネル関数によるカテゴリ構造のモデル化
- カーネル関数によるカテゴリ構造のモデル化(分類、クラスタリング,機械学習)
- 複数文質問のタイプ同定(自然言語)
- 26pTD-6 スピンモデルを用いた評価表現辞書構築における精度改善法(26pTD ネットワーク一般2・生物・生態系,領域11(統計力学,物性基礎論,応用数学,力学,流体物理))
- アスペクト被覆を可能にした最小値最大化問題に基づく文書要約モデル
- 評価語の相互依存関係を考慮した三つ組抽出 (言語理解とコミュニケーション)
- アスペクト被覆を可能にした最小値最大化問題に基づく文書要約モデル
- 異なる文書中の文間関係の特定(言い換え・質問応答)
- 異なる文書中の文間関係の特定(言い換え・質問応答)
- 機械学習による科学技術論文からの書誌情報の自動抽出(オントロジ・抽出(2))(セマンティックウェブと自然言語処理その他一般)
- テキストコーパスを用いた漢字詳細読みの自動生成(一般:障害者支援,聴覚障害及び一般)
- 評価語の相互依存関係を考慮した三つ組抽出(意見抽出/文書分類,第1回テキストマイニング・シンポジウム)
- 21pGU-4 高精度な評価表現辞書構築への統計力学的アプローチ(21pGU 情報統計力学1,領域11(統計力学,物性基礎論,応用数学,力学,流体物理))
- 職業コーディング支援システム(NANACO)の開発とJGSS-2003における適用
- F-006 単語の系列及び依存木を用いた評価文書の自動分類(F.人工知能)
- コロイド結晶成長の謎を解き明かせ (特集 国際宇宙ステーション時代の結晶成長(その2))
- リムる・ドヤる・ポジる・パフェる-Webを用いたカタカナ動詞の言い換え・語源の獲得-
- 隣接するツイート間の関係を考慮したマイクロブログのトピック推定
- リムる・ドヤる・ポジる・パフェる-Webを用いたカタカナ動詞の言い換え・語源の獲得-
- 隣接するツイート間の関係を考慮したマイクロブログのトピック推定
- コロイド結晶成長の謎を解き明かせ(国際宇宙ステーション時代の結晶成長その2)