テキスト含意認識に有効な意味類似度変換及びその獲得法
スポンサーリンク
概要
- 論文の詳細を見る
Predicting entailment between two given texts is an important task on which the performance of numerous NLP tasks such as question answering, text summarization, and information extraction depend.The degree to which two texts are similar has been used extensively as a key feature in much previous work in predicting entailment. However, using similarity scores directly, without proper transformations, results in suboptimal performance. Given a set of lexical similarity measures, we propose a method that jointly learns both (a) a set of non-linear transformation functions for those similarity measures and, (b) the optimal non-linear combination of those transformation functions to predict textual entailment. Our method consistently outperforms numerous baselines, reporting a micro-averaged <I>F</I>-score of <I>46.48</I> on the RTE-7 benchmark dataset. The proposed method is ranked <I>2</I>-nd among <I>33</I> entailment systems participated in RTE-7, demonstrating its competitiveness over numerous other entailment approaches. Although our method is statistically comparable to the current state-of-the-art, we require less external knowledge resources.
著者
-
石塚 満
東京大学大学院情報理工学研究科
-
ボレガラ ダヌシカ
東京大学大学院 情報理工学系研究科 電子情報学専攻
-
横手 健一
東京大学大学院 情報理工学系研究科 電子情報学専攻
-
石塚 満
東京大学大学院 情報理工学系研究科 電子情報学専攻
関連論文
- 文書分類手法を応用したインタラクティブプレゼンテーションにおける視聴者発話の理解(音声言語処理)
- 3U-6 インタラクティブなプレゼンテーションでのユーザ発話の自然な制限のための複数エージェントの利用(音声言語情報処理,学生セッション,人工知能と認知科学)
- MFTを用いたロボットの動作中における音声認識
- インタラクション機能を有するプレゼンテーション記述言語の開発(インタフェース,入出力,その他)
- ブログ上での話題伝播に注目した重要語判別
- 1S-1 Weblogからのタレントに関する好感度情報抽出(情報検索・評価分析,学生セッション,人工知能と認知科学)
- E-055 Annotating Semantic Structure of Web Text based on CDL.nl
- 4V-8 社会ネットワークマイニングのためのネットワーク構造を用いた属性生成(マルチエージェント(2),学生セッション,人工知能と認知科学)
- 4U-1 語の出現予測を用いたテキスト分類(文書の分類と検索,学生セッション,人工知能と認知科学)
- 3ZK-3 Webを用いた人物の別名抽出(情報爆発時代におけるWeb技術およびWeb情報抽出,学生セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 3ZK-2 汎用的なWeb推薦アルゴリズムの提案(情報爆発時代におけるWeb技術およびWeb情報抽出,学生セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 3ZK-1 Webから抽出した企業間ネットワークに基づく企業価値の予測(情報爆発時代におけるWeb技術およびWeb情報抽出,学生セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- Web上の情報を用いた弱い社会的関係のネットワーク抽出手法(データマイニング)
- Web 上の情報を用いた企業間関係の抽出
- インタラクション機能を有するプレゼンテーション記述言語の開発(HAIにおけるコミュニケーションとインタラクション適応)
- 「人工知能学事典」編集四方山話
- Web からの研究者ネットワーク抽出の大規模化
- Semantic Webのための人の社会ネットワーク抽出と利用(ネットワークサービス)
- 文書分類手法を応用したインタラクティブプレゼンテーションにおける視聴者発話の理解(音声言語処理)
- 修辞構造のアノテーションに基づく要約生成
- Web 上の情報からの人間関係ネットワークの抽出
- ロボットの共生的対話システムとマルチモーダルな表現システムの開発と評価(テーマセッション(1), ロボットとの相互作用のための言語処理・パターン認識・メディア理解)
- ロボットの共生的対話システムとマルチモーダルな表現システムの開発と評価(テーマセッション(1), ロボットとの相互作用のための言語処理・パターン認識・メディア理解)
- 2ちゃんねるが盛り上がるダイナミズム(社会活動支援)
- A-16-16 ヒューマノイドロボットとアニメキャラクタによる共同プレゼンテーションMPML-HR Ver.2.0(A-16.マルチメディア・仮想環境基礎,一般講演)
- 5W-7 Webからの人物の属性情報抽出(言語情報抽出,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 影響の普及モデルに基づくオンラインコミュニティ参加者のプロファイリング
- 語の活性度に基づくキーワード抽出法
- AreaView2001 : WWWからの構造化した領域総覧提示システム
- テキストによるコミュニケーションにおける影響の普及モデル
- D-8-27 Key Graph手法によるマウス拒絶反応に関するDNAマイクロアレイデータからの発見支援
- 時系列WWWページからの流行の予測
- 8.パネル討論:エージェントの社会的インパクト(社会に向き合うエージェントシステム)
- 1ZG-4 アバタージェスチャ辞書のユーザフィードバックを用いた自動生成手法(コミュニケーション支援,学生セッション,インタフェース,情報処理学会創立50周年記念)
- 自然言語テキスト意味概念の共通的記述による次世代 Web 基盤
- 1億人, 10億人, 50億人
- 3J-3 SPARQLを利用したCDL(Concept Description Language)データの検索(情報爆発時代における構造化文書とストレージ技術,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 概念グラフマッチングによる自然言語テキストの意味的検索(一般,「Webサービス・クラウド」及び一般)
- 3K-3 概念グラフのマッチングによる自然言語テキストの意味検索システムの開発(情報爆発時代におけるテキスト処理・Wikipedia,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 4ZP-1 単語ペア間の潜在的関係を利用する関係検索エンジン(情報爆発時代におけるWeb検索技術,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 4ZP-2 潜在的関係を利用する検索システムの対称性による候補語リランキング法(情報爆発時代におけるWeb検索技術,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- マルチモーダルプレゼンテーション記述言語MPMLの感情表現機能
- マルチモーダルプレゼンテーション記述言語MPMLの感情表現機能
- マルチモーダルプレゼンテーション記述言語MPMLのヒューマノイドへの拡張とその心理学的評価(ロボットとコミュニケーション及び一般)
- WWWと連携する擬人化エージェントとのHAI(HAI : ヒューマンエージェントインタラクション)
- 5ZN-4 Webからの関連語抽出の役割分類を用いた拡張と精度向上(情報爆発時代におけるWebマイニング,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- D-001 Web上の情報を用いた企業間関係の抽出(D分野:データベース)
- 制約充足問題における変数の値の重みとアーク制約要素重みの相互変換
- 5W-8 Wikipediaからの要約生成パターンの抽出(言語情報抽出,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- J-33 固有空間法を用いた二次元顔画像からの三次元キャラクター生成(アニメーション,J.グラフィクス・画像)
- 可変長遺伝子を用いた進化型アナログ回路
- E-034 概念辞書を利用した日本語テキストのエンティティ間の意味役割分類(E分野:自然言語・音声・音楽,一般論文)
- 1X-9 教師なし学習を用いた談話解析手法に関する一検討(意味・談話解析,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- E-2 複数文書からのテキスト断片抽出法(要約・情報検索,E.自然言語・文書)
- エンティティペア間類似性を利用した潜在関係検索
- エージェントキャラクタによるWWW連携プレゼンテーション : マルチモーダル・プレゼンテーション記述言語MPML
- エージェントキャラクタによるWWW連携プレゼンテーション : マルチモーダル・プレゼンテーション記述言語MPML
- 論文ネットワークからのリンクマイニング(情報抽出,特集「Web情報処理」及び一般)
- 論文ネットワークからのリンクマイニング
- B-6-53 クラシファイア・システムによるレート制御方式(B-6. ネットワークシステム, 通信2)
- 関係の対称性を用いたRelational Searchの精度向上法
- 特集7 : 研究速報 : 小規模並列プロセッサによる人工エージェント連続動作像の実時間生成
- 特集3 : 研究解説 : 新しいヒューマンインタフェースへ向けての並列コンピュータ(TN-VIT)上のビジュアル・ソフトウェアエージェント(VSA)
- E-36 概念の共起辞書を用いた文書特徴の抽出(知識獲得,E.自然言語・文書)
- 人工知能学会20周年を迎えて(人工知能学会創設20周年記念企画)
- Edward H. Shortliffe : Computer-Based Medical Consultations : MYCIN(20世紀の名著名論)
- 会長就任挨拶
- 係り受け関係に基づくグラフ構造を用いた質問応答システム(構文,係り受け解析)
- 係り受け関係に基づくグラフ構造を用いた質問応答システム(構文, 係り受け解析)(言語理解とコミュニケーション)
- A-15-16 携帯電話用 3 次元顔型エージェント
- 語の共起の統計情報に基づく文書からのキーワード抽出アルゴリズム
- ソーシャルメディア雑感(第1部:学会創設25周年に寄せて,人工知能学会25周年特集「四半世紀を越えて」)
- テキストデータマイニングのための統合環境 : TETDMプロジェクト(解析手法,第1回テキストマイニング・シンポジウム)
- 検索エンジンを用いた関連語の自動抽出
- SF-050-3 進行再発大腸癌治療における3次治療としての抗EGFR抗体の有効性(SF-050 サージカルフォーラム(50)大腸 分子標的療法,第112回日本外科学会定期学術集会)
- SF-104-2 長期高カロリー輸液投与患者血中微量元素濃度の推移からみた微量元素投与量の妥当性の検討(SF-104 サージカルフォーラム(104)周術期管理-3(感染症),第112回日本外科学会定期学術集会)
- PS-137-2 大腸癌術後炎症性マーカーとしてのhepcidinの有用性(PS-137 大腸 侵襲・サイトカイン,ポスターセッション,第112回日本外科学会定期学術集会)
- PS-081-1 結腸癌手術における術後SSI発生の危険因子の検討(PS-081 大腸 周術期管理-1,ポスターセッション,第112回日本外科学会定期学術集会)
- SF-003-5 炎症性反応マーカーを用いた術前CEA正常大腸癌症例に対する予後予測(SF-003 サージカルフォーラム(3)大腸 予後因子,第112回日本外科学会定期学術集会)
- テキスト含意認識に有効な意味類似度変換及びその獲得法