著者キーワード中での共起に基づく専門用語間の関連度計算法
スポンサーリンク
概要
- 論文の詳細を見る
本論文では, 学術文献に与えられる著書キーワード中での共起情報を利用して, 専門用語の間の関連度を計算する方法について検討する.学術文献データベースに登録された著書キーワード項目を利用すると, 独立した複合語を単位とする共起情報を簡単に得ることができるが, 一つの文献についてたかだか数語が共起するのみであることから, データのスパース性の問題が生じる.そこで本論文では, 関連度の計算において間接的な共起関係をも考慮することとし, 文献ごとのキーワード集合を共起関係リンクで結んだ大規模な用語グラフを作成した上で, 平均経路長を用いて任意の二つの用語集合間の距離を定義する.また, 実際に大規模な学術文献データベースを用いて作成した用語グラフをテキストの自動分類問題に適用することによって, 提案する関連度計算法のもっともらしさを評価し, 直接共起や出現文脈ベクトルを用いる場合と比較を行う.
- 2000-11-25
著者
関連論文
- 商品および商品についての情報源に対する信頼の統計的ネットワークモデル
- Grozea, C., Gehl, C. and Popescu, M., ENCOPLOT: Pairwise Sequence Matching in Linear Time Applied to Plagiarism Detection, Proc. 3rd Pan Workshop, Uncovering Plagiarism, Authorship and Social Software Misuse, pp. 10-18, 2009, 剽窃の検出技術
- 2. 座談会 女性会員を取り巻く環境はこんなです(女性会員に期待する)
- 帰納推論による時系列データからの関係構造の抽出スキル解析に向けたプラットフォーム
- D-4-13 TV Searchbar: Webからの放送コンテンツの参照(D-4. データ工学,一般セッション)
- 語彙概念構造を利用した複合名詞内の係り関係の解析(システムLSIの設計技術と設計自動化)
- 文法的制約を用いた複合語解析モデルの作成
- 語基の詳細な特徴を考慮した複合語解析モデル
- 学術情報の統合に向けた大規模リンケージ基盤の構築
- 3.アカデミックリンケージ : 膨大な学術情報へのアクセスを支援するリンケージ基盤(パートII:情報分野研究者のためのオンリーワン共有イノベーションプラットフォーム,情報爆発時代におけるわくわくするITの創出を目指して)
- 6J-4 情報爆発時代のための制約つきクラスタリングを用いた制約つきフィードバック手法の提案(情報爆発時代における情報検索・推薦技術およびWebコミュニティ分析,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- A22 KAKEN βと研究者リゾルバーαの情報構造 : KAKEN β1.12と研究者リゾルバーα1.12(セッションA2(情報システムの構築1),一般発表概要,第5回情報プロフェッショナルシンポジウム)
- D-5-8 情報圧縮に基づくデータ間類似度によるパーソナライゼーション(D-5. 言語理解とコミュニケーション,一般セッション)
- D-5-7 マルチモーダル情報を用いた放送番組からの人物相関図生成(D-5. 言語理解とコミュニケーション,一般セッション)
- 完全N部グラフ構造を用いた単語の多義性獲得(「自動推論:帰納,演繹,モデル検査/生成,学習,発見,仮説推論,論理プログラム,プランニングetc.」及び一般)(一般及び自動推論)
- 小特集「国際会議で見つけたオススメ論文」にあたって
- 発話を意識した文推薦システムの構築と評価
- 発話を意識した文推薦システムの構築と評価
- 沈黙のWeb(編集委員今年の抱負2009:経糸から横糸まで)
- 論文情報ナビゲータの構築(セッション5 : 文書データベース)
- 論文情報ナビゲータの構築(セッション5 : 文書データベース)
- 情報検索における圧縮距離の適用に関する考察
- 言語処理における尤度比の問題点:対訳コーパスからの訳語対抽出を例として
- 大規模学術情報データベースに適した情報検索システムの開発
- 情報検索サービスNACSIS-IRの新たな展開 (情報検索の新潮流)
- 3Q-8 視線検出装置を用いた研究者の論文の読み方の解析(情報抽出,学生セッション,データベースとメディア,情報処理学会創立50周年記念)
- D-5-8 視線情報によるユーザプロファイルの文書推薦における有用性(D-5.言語理解とコミュニケーション,一般セッション)
- 視線情報を用いたユーザプロファイル獲得と文書推薦
- 4U-8 検索用キーフレーズの解析及び抽出手法の提案(文書の分類と検索,学生セッション,人工知能と認知科学)
- 司書資格取得者に対する追跡調査 : 仕事・満足度を中心として
- 土木関連用語辞典の見出し語の分析と検索システムにおける活用に関する考察(辞書と辞典)
- 土木関連用語辞典の見出し語の分析と検索システムにおける活用に関する考察(辞書と辞典)
- 著者キーワード中での共起に基づく専門用語間の関連度計算法
- 対象の変化とデータの変化--専門用語の語彙成長研究における出来事と構造との接点を巡って
- 専門用語抽出・解析処理を考慮したコーパスの作成
- 専門分野における複合名詞の語構成要素の品詞相当カテゴリーに関する一考察
- 専門用語の語構成要素成長曲線に与える用語内語構成要素結束性の影響について
- 名詞と動詞の依存関係を利用したテキストからのIS-A関係の発見方法
- F-020 テキストコーパスからの上下関係抽出(F分野:人工知能・ゲーム)
- D-011 数式とその周辺情報を利用した数式概念検索の実現(D分野:データベース,一般論文)
- D-006 視聴中の番組を起点とした関連番組検索(データベース,一般論文)
- 3Q-9 名前同定のためのSVM特徴素の抽出と適用(情報抽出,学生セッション,データベースとメディア,情報処理学会創立50周年記念)
- 大規模データベースを利用したリンケージシステムの提案と実装
- 1ZM-3 ネットワーク構造からみたQ&Aコミュニティの分析(ソーシャルネットワーク,学生セッション,コンピュータと人間社会,情報処理学会創立50周年記念)
- レコード同定問題に関する研究の課題と現状(データ工学論文)
- 大規模テキストコーパスを用いた語の類似度計算に関する考察(自然言語,新しいパラダイムの中での分散システム/インターネット運用・管理)
- 語彙の制約を考慮した複合語解析モデルの構築
- 語彙の制約を考慮した複合語解析モデルの構築
- 情報学の明日を考える (特集 情報学の第4ステージ)
- Helmer, S., Measuring the structural similarity of semistructured documents using entropy(情報の似ている度合いを圧縮プログラムで計測), Proc. 33rd International Conference on Very Large Data Bases, pp.1022-1032, 2007
- 特集「情報の信頼性評価」にあたって
- テキストと「意味の解像度」
- On Some Implications of Sample-Size Dependency of Statistical Measures in Lotka-type Data to the Interpretation of Bibliometric Phenomena
- 2000-NL-138-7 対訳コーパスにおける低頻度語の性質 : 訳語対自動抽出に向けた基礎研究
- NLC2000-16 対訳コーパスにおける低頻度語の性質 : 訳語対自動抽出に向けた基礎研究
- 複数書誌データベース統合における重複エントリーの高速検出法(セッション5 : 文書データベース)
- 多重ネットワークの調査とシミュレーション (「知能と社会・ネットワーク」および一般発表)
- 共起に基づく類似性尺度(自然言語とコンピュータ)
- Webコーパスを用いた語の類似度計算に関する考察
- Pasca, M. and Durme, B. V.:What you seek is what you get: Extraction of class attributes from query logs, Proc. 20th Int. Joint Conf. Artificial Intelligence (IJCAI-07), pp.2832-2837(2007)
- テキストを媒体とする情報の伝達をめぐって(編集委員2007年の抱負)
- テキストを媒体とする情報の伝達をめぐって
- Webコーパスを用いた語の類似度計算に関する考察 (「Web Intelligence」および一般発表)
- 類語関係抽出タスクにおけるコーパス規模拡大の影響(言語モデル・単語)
- 類語関係抽出タスクにおけるコーパス規模拡大の影響(言語モデル・単語)
- I_070 Proxy上でのWeb画像分類(I分野:画像認識・メディア理解)
- 語義の違いを検出するための大規模コーパス処理手法の検討(「自動化:推論,発見,学習,データマイニング」及び一般)
- 日本語専門分野テキストコーパスからの複合語用語の抽出(抽出)
- 文法パターンに基づく用語抽出モデルの構築(言語理解とコミュニケーション一般)
- 語彙概念構造を利用した助詞「に」に関する複合名詞の分析
- 語彙概念構造を利用した助詞「に」に関する複合名詞の分析
- 総理大臣国会演説における基本的文体特徴量の探索的分析
- 総理大臣演説における語彙多様性の変化(セッションN-13(MK301) 一般セッション 言語)
- コミュニケーションメディアの情報伝達性能の包括的比較
- 日本語専門語彙の有契性構造の分析
- 言語の工学--言語実務専門家の実践と言語の科学の間で (特集 言語処理研究の新展開--計算機と言語学の対話に向けて)
- 生きた言葉と図書館の課題 : 粗悪言語を売りつけられる時代に : 2007年11月8日、臨光館204番教室において
- 近代的主体の成立と図書・図書館による近代の存立
- 日本語専門語彙の構成における外来語語基の位置づけ
- いわゆる順位頻度分布と頻度度数分布との関係について : Baayen(2001)からの紹介を中心に(短信)
- 自然言語処理と言語実体化の効用 (特集 空の言語学--言語に実体はあるか)
- 未出現事象の比率を推定する--Good-Turing推定の直感的意味付け
- Minimum Consistent-DFA生成問題の厳密解法に対するハイブリッドアプローチ
- Web上の文書を対象とした産学連携研究開発情報抽出の試み
- 多クラス文書分類問題におけるZiv-Merhav Crossparsingの適用と評価
- 複数書誌データベース統合における重複エントリーの高速検出法(セッション5 : 文書データベース)
- 異種データベース間でのレコード照合に関する研究動向
- NTCIR-9総括と今後の展望
- NTCIR-9総括と今後の展望
- 2-1 閲覧中のWebコンテンツを起点とした関連番組検索(第2部門 メディア処理2)
- 自然言語処理と計算代数の接合による数学問題へのアプローチ(ロボットは東大に入れるか?)
- 2012年度人工知能学会全国大会を終えて
- SATソルバーを用いた最小無矛盾DFAの生成
- 「2012年度全国大会速報論文特集」にあたって
- 3-4 Wikipediaの変更履歴を利用した関連番組検索(第3部門 インタフェース・その他)
- 「種と類」の話
- E-031 A Method for Corresponding Paragraphs with Sentences in Academic Paper's Abstract
- E-030 Towards the Integration of Natural Language and Eye Tracking Information for Predicting Comma Placement in Chinese Sentence
- D-025 更新履歴による注目度を利用した番組検索結果のリランキング(クラスタリング,D分野:データベース)
- Twitter上の「おはよう」を例とした崩れた異表記の認識(地域情報&ソーシヤルメデイア,第4回集合知シンポジウム)