クエリと説明文の関係を表す記述要素辞書の構築(検索調査,第2回テキストマイニング・シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
我々は以前「ある話題語について検索したとき、得られた文章が話題語についてのどのような内容を説明しているかを推定する」という問題を設定した。例えば「ローパスフィルタ」ならば「機能」「副作用」「設計方法」などの語があり得る。これらの語を記述要素と呼ぶ。本稿ではこの記述要素の辞書をIPADIC中の73006語の名詞群から人手判定し、構築した。記述要素は「話題語と文の関係を表す名詞」であり、ここでは当該名詞が満たすべき、また満たすべきでない性質を明らかにした。性質はそれぞれ話題語の性質を表す包含性、話題語の説明に文が続くかを表す文接続性、その名詞が話題語とは異なる具体的事物を示す実在性、説明が固有名詞や名詞のリストであり文にはならないことを表す固有性、話題語についての説明であれば大部分を拾ってしまう抽象性、説明文に特徴がないことを示す非安定性の6つが存在する。結果「工程」のような記述要素の核となる基本要素1664語、記述要素の後に続く説明文が特定のキーワードを持たない「影響」のような語を含む非安定要素222語、「概要」のように話題語の説明であれば大部分を含んでしまう抽象要素140語、「着衣」のような話題語と結びついて複合語として新たな話題語になってしまい関係名にならない語である具体要素47語が得られた。また副産物として、純粋に属性と呼べる語が持つべき性質を明らかにした。
- 2012-08-23
著者
関連論文
- Webコーパスの提案(コーパス構築)(セマンティックウェブと自然言語処理その他一般)
- Wikipediaからの大規模な人オントロジー構築
- 日本語用言を見つめ直す
- 日本語語彙大系を用いたWikipediaからの汎用オントロジー構築
- Wikipedia からの大規模な人オントロジー構築
- 構文片を用いた分野の同定を必要としない意見・評判情報抽出(「主観表現処理の最前線」シンポジウム)
- 決定木を用いた日本語ゼロ代名詞補完
- コーパスを利用した効率的な翻訳規則の拡充
- 大規模オープンソース日英対訳コーパスの構築
- 大規模オープンソース日英対訳コーパスの構築
- 複数決定木を用いた入力誤りに頑健な省略補完手法
- 決定木学習による日本語対話文の格要素省略補完
- 音声対話における頑健な主語補完手法
- 単語と品詞の混合 n-gram を用いた形態素解析
- 要約事例を用例として模倣利用したニュース記事要約
- 用例利用型による文間接続関係の同定
- 文書に対する大衆の興味の強さの推定
- LE-003 講義スライドへの書き起こしデータの対応付け(自然言語・音声・音楽)
- LE-002 要約事例を用例として利用したニュース記事要約(自然言語・音声・音楽)
- 濃縮還元型文要約モデルの検討(談話・要約)
- 文間接続関係の自動同定のための人間による同定分析(談話・要約)
- 濃縮還元型文要約モデルの検討(談話・要約)
- 文間接続関係の自動同定のための人間による同定分析(談話・要約)
- 類似用例文の部分的置換による文短縮(解析,分析)
- 「新幹線要約」のための文末の整形
- 「サ変動詞+名詞」の複合名詞への換言
- 国会会議録を対象とする話し言葉要約
- 繰り返し学習を用いた話題に順応する意見文抽出
- 順位付け文書からの影響因子マイニング(マイニング、要約)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- 5 テキスト自動要約における新たな展開と展望 : 統計的方法,換言処理,そして…(テキスト自動要約 : 知的活動支援の基本技術として)
- 日本語語彙大系を用いた Wikipedia からの汎用オントロジー構築
- 「新幹線要約」のための文末の整形(マイニング、要約)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- 「新幹線要約」のための文末の整形(マイニング、要約)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- 順位付け文書からの影響因子マイニング(マイニング、要約)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- 特徴的冗長表現に着目した国会会議録要約(コーパス分析・言い換え)(セマンティックウェブと自然言語処理その他一般)
- 説明文と記述要素の関係要因の調査 : そこにクエリの「何」が書かれているのか(検索,第1回テキストマイニング・シンポジウム)
- クエリと説明文の関係を表す記述要素辞書の構築 (言語理解とコミュニケーション)
- カテゴリ名と記事名の意味属性分類に基づくWikipediaからの上位下位関係オントロジーの構築
- 保険関連文書間の自動対応付け (産業日本語関連)
- 特徴的冗長表現に着目した国会会議録要約
- クエリと説明文の関係を表す記述要素辞書の構築(検索調査,第2回テキストマイニング・シンポジウム)
- 質問意図によるQAサイト質問文の自動分類 (思考と言語)
- 質問意図によるQAサイト質問文の自動分類 (言語理解とコミュニケーション)
- カテゴリ名と記事名の意味属性分類に基づく Wikipedia からの上位下位関係オントロジーの構築
- 用言等換言辞書を用いた換言の考察 (思考と言語)
- 用言等換言辞書を用いた換言の考察 (言語理解とコミュニケーション)
- 日本語用言を見つめ直す (自然言語処理(NL) : 語彙・オントロジー・知識獲得)
- 全文を翻訳しようとしない機械翻訳 : ワードグラフによる部分的機械翻訳の試み (機械翻訳技術の向上)
- 質問意図によるQAサイト質問文の自動分類(Web分析,言語処理・言語分析の社会応用,及び一般)
- 質問意図によるQAサイト質問文の自動分類(Web分析,言語処理・言語分析の社会応用,及び一般)