機械学習による科学技術論文からの書誌情報の自動抽出(オントロジ・抽出(2))(セマンティックウェブと自然言語処理その他一般)
スポンサーリンク
概要
- 論文の詳細を見る
本論文では,電子化された学術論文から,その論文ファイルの書誌情報および参考文献の書誌情報を抽出する手法を提案する.両書誌情報の抽出ともにサポートベクトルマシンによる機械学習手法を使用し,論文ファイルの書誌情報には,視覚的素性と言語的素性を用いることで,また参考文献の書誌情報抽出には各フィールドの出現順を制約に組み入れることで高精度で抽出が出来るようになった.
- 2003-09-29
著者
-
難波 英嗣
広島市立大学
-
奥村 学
東京工業大学
-
高村 大也
東京工業大学精密工学研究所
-
高村 大也
東京工業大学 精密工学研究所
-
阿辺川 武
東京工業大
-
阿辺川 武
国立情報学研究所 連想情報学研究開発センター
-
高村 大也
東京工業大学
関連論文
- 大域的な文章構造の類似性を利用したクローズドキャプション中の定型的な文章区間の抽出(自然言語処理)
- 半教師有りクラスタリングを用いた Web 検索結果における人名の曖昧性解消
- スピンモデルによる単語の感情極性抽出(自然言語)
- 新語義の発見 : 意味解析における新しいタスク(編集委員今年の抱負2009:経糸から横糸まで)
- 論文と特許を対象にした技術動向分析 第7回,第8回NTCIRワークショップ 特許マイニングタスク
- NTCIR-7速報(NTCIR特別セッション)
- プレゼンテーションスライド情報の構造抽出(コンテンツ技術・Web情報システム,知識基盤社会を支える情報技術論文)
- 放送番組を素材としたマルチメディア百科事典の自動構築
- 元会長 田中穂積先生を偲んで
- プレゼンテーションスライド情報の構造化(ライフログ活用技術とその課題,オフィス情報システム,デジタルドキュメント,一般)
- 隠れマルコフモデルを用いた論文とプレゼンテーションシートの対応付け(表理解,アライメント,抽出)
- 特許,論文間の引用関係を用いた論文用語の特許用語への変換(語彙・文書書類)
- E-015 複合語翻訳による異言語で記述された書誌情報の同定(E.自然言語・文書・ゲーム)
- イベントの生起時間帯判定(分類, ブログ)
- 1.テキスト評価分析の技術とその応用(ユーザ作成のコンテンツに着目した嗜好・評判抽出, 利用者の好みをとらえ活かす-嗜好抽出技術の最前線-)
- 翻訳知識を用いた英語論文表題の構造解析(解析・抽出)
- プレゼンテーションスライド情報の構造化(ライフログ活用技術とその課題,オフィス情報システム,デジタルドキュメント,一般)
- 特許情報処理を指向したテストコレクションの構築 : 情報検索と自然言語処理の融合を目指して(NTCIR特別セッション)
- 特許情報処理を指向したテストコレクションの構築 : 情報検索と自然言語処理の融合を目指して(NTCIR特別セッション)
- テキスト要約の自動評価(テキストの自動評価)
- 知財活用の実際 論文と特許データベースを統合したジャンル横断検索および技術動向分析(知財)
- 抜粋による複数文書要約を評価するためのコーパスと評価指標
- C11 特許,論文データベースを統合した検索環境および動向分析ツールの構築(セッションC1(情報処理技術),一般発表概要:各セッション報告,INFOPRO2006)
- 情報抽出を利用した複数文書要約(テキストの可視化と要約)
- 論文データベースからのイディオム用例検索(検索)
- 文書横断文間関係を考慮した動向情報の抽出と可視化(情報抽出・可視化)
- 特許, 論文データベースを統合した検索環境の構築(重要語抽出・検索・文書分類)
- 文書横断文間関係を考慮した動向情報の抽出と可視化(情報抽出・可視化)
- 特許, 論文データベースを統合した検索環境の構築(重要語抽出・検索・文書分類)
- ブログマイニング技術の最新動向
- 代表性のあるコーパスを利用した日本語意味解析(日本語コーパス)
- WEB上の画像の分類とメタデータ付与による携帯電話向けWEB表示(セッション1:メタデータと自動分類、知識支援)
- WEB上の画像の分類とメタデータ付与による携帯電話向けWEB表示(セッション1:メタデータと自動分類、知識支援)
- 重要文抽出と文圧縮を組み合わせた新たな抽出的要約手法(翻訳・要約・抽出)
- テキストの結束性判定のためのentity gridモデルの素性の検討(意味・談話)
- 重要文抽出と文圧縮を組み合わせた新たな抽出的要約手法(翻訳・要約・抽出)
- テキストの結束性判定のためのentity gridモデルの素性の検討(意味・談話)
- 新たなパラダイムシフトの可能性
- ブログにおける偏り補正のための書き手のプロファイリング(情報の信頼性評価)
- 文書要約の最大充足化問題によるモデル化(翻訳・要約)
- 文書要約の最大充足化問題によるモデル化(翻訳・要約)
- 複数の分類スコアを用いたクラス所属確率の推定
- 文の感情極性判定における事例重み付けによるドメイン適応(情報抽出・評判分析)
- 単語の用例の半教師有りクラスタリング(単語・語彙(I))
- 言い換えを用いたテキスト要約の自動評価
- 言い換えを用いたテキストの自動評価
- 語義曖昧性解消のための領域適応手法の自動選択
- 言い換えを用いたテキストの自動評価
- AdaBoostを利用した字幕テキストからの定型表現文章区間抽出(テキストの類似性・文処理モデル)
- AdaBoostを利用した字幕テキストからの定型表現文章区間抽出(テキストの類似性・文処理モデル)
- 言い換えを用いた技術マニュアルの類似文検索
- 投票型回帰モデルによる要約の自動評価法
- 拡張ストリングカーネルを用いた要約システムの自動評価法(自然言語,情報処理技術のフロンティア)
- 文書要約の自動評価手法の提案と評価(セグメンテーション・要約)
- 国語辞典に「古い」と注記される語の現代書き言葉における使用傾向の調査
- テキストの断片に対する局所的一貫性モデル
- 事象の認識による発話生成に向けて(特別セッション「言語理解と行動」(3))
- 情報量の異なる複数の視点を考慮した実況解説の自動生成
- 事象の認識による発話生成に向けて(特別セッション : 言語理解と行動(3))
- 繰り返し構造を用いたWebページの構造化に関する研究
- Web上のテキストコーパスを利用したオノマトペ概念辞書の自動構築
- AAAI90
- D-5-12 EMアルゴリズムを利用した属性名抽出の検討(D-5.言語理解とコミュニケーション,一般講演)
- E_017 クローズドキャプションを対象とした被写体の動作推定(E分野:自然言語)
- 論文用語の特許用語への自動変換
- 特集「実践的多人数インタラクションの動向と展望」にあたって
- blogからの比較関係抽出(web情報抽出)
- テキスト中のイベントの生起時間帯判定(自然言語)
- 外国人ための科学技術日本語読解支援システム「あすなろ」の開発
- 外国人ための科学技術日本語読解支援システム「あすなろ」の開発
- 3D-6 レストランレビュー文章群からの評判とその対象の抽出(自然言語処理,一般セッション,人工知能と認知科学)
- 格変換による単文の言い換え
- 技術成果を効果的に伝える表題作成支援手法 : 開発と評価(自然言語)
- タイトルの文型が読者の関心に及ぼす影響の分析
- 表題の表現が読者の関心に与える影響分析
- 隠れ変数モデルによる複数語表現の感情極性分類(自然言語)
- テキストを対象とした評価情報の分析に関する研究動向
- 極性反転に対応した評価表現モデル(言語の統計モデル)
- 極性反転に対応した評価表現モデル(言語の統計モデル)
- 文書内に現れる因果関係の出現特性調査(解析, QA, 言語調査)
- 文書内に現れる因果関係の出現特性調査(解析, QA, 言語調査)
- スピンモデルによる単語の感情極性判定(シソーラス・辞書)
- 分類スコアに基づいたクラス事後確率の推定(コーパス, 学習, 対話, 要約)
- 機械学習とルールベースの組み合わせによる自動職業コーディング
- ルールベース手法と機械学習による自由回答の分類 : 職業コーディング自動化の方法(非定型データ分析の可能性)
- 機械学習とルールベースによる職業コーディング(テキスト検索,分類)
- 英語ディクテーション学習支援システムの構築
- 2種類の翻訳システムを用いた学術論文の特許分類体系への自動分類
- 符号化問題として解く日本語係り受け解析(文の解析)
- blog分類のための半教師有り学習(Web情報アクセス)
- 2 Text Summarization Challenge : 自動要約の評価型ワークショップ(テキスト自動要約 : 知的活動支援の基本技術として)
- 旅行ブログエントリからの観光情報の自動抽出
- Support Vector Machineを用いた談話構造解析
- 2010年度論文賞の受賞論文紹介 : ジャンル横断情報アクセスを目指して
- 動向情報の抽出と要約 : 動向をまとめる
- 隠れマルコフモデルを用いた論文とプレゼンテーションシートの対応付け(表理解,アライメント,抽出)
- 機械学習による科学技術論文からの書誌情報の自動抽出(オントロジ・抽出(2))(セマンティックウェブと自然言語処理その他一般)
- HT-1-4 ブログからのユーザの行動経路の自動抽出と可視化(HT-1.大規模災害時におけるソーシャルメディアの知的活用,チュートリアルセッション,ソサイエティ企画)
- 論文と特許からの技術動向情報の抽出と可視化
- Twitterと論文との自動対応付け(「ソーシャルコンピューティング研究最前線」,ポスター発表のためのショートプレゼン,ソーシャルコンピューティング)