多言語Wikipediaの差異情報抽出手法の提案
スポンサーリンク
概要
- 論文の詳細を見る
Wikipedia は,日本語版や英語版などの各言語版によって記述されている情報の量が異なる.そのため,一つの言語版だけでは情報量が不足する記事が多く存在する.特に文化に関する記事ではその傾向が顕著である.そこで本研究では多言語版 Wikipedia を用いて,日本語版における海外に関する記述の不足を,日本語版以外の記事から抽出し提示するシステムを提案する.具体的には,ユーザの入力した海外の事柄に関する英語版の記事と日本語版の記事を比較し,その差分情報を提示する.この時,言語間の情報の粒度が異なるため,一つの日本語版の記事が一つの英語版の記事に対応するとは限らない.そこで,比較対象となる複数の英語版の記事を,リンクグラフを用いて抽出し,抽出された複数の英語版の記事と日本語版の記事を比較対象とし,その差分情報を抽出する手法を提案する.
- 2011-10-27
著者
関連論文
- 気分距離に基づく名言検索に関する研究
- コミュニティ型コンテンツにおける重要だが無視されているコメントの抽出手法の提案
- コミュニティ型コンテンツのコンテンツホール検索の提案
- Wikipediaを用いたコンテンツホール検索の提案(セッション7a:Web解析)
- コンテンツホール検索のための掲示板対話の解析(jDBワークショップ)
- Wikipediaにおけるキーパーソン抽出による信頼度算出精度および速度の改善
- User-Generated Contentにおける潜在情報抽出手法の提案
- 文のポジティブ・ネガティブ値を考慮した名言検索手法の提案
- コンテンツホール検索のための掲示板対話の解析(jDBワークショップ)
- 4ZP-5 気分距離に基づく名言検索手法の提案(情報爆発時代におけるWeb検索技術,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)