階層構造を利用したテキスト間類似度の効率的計算法
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,階層非循環有向グラフカーネル(Hierarchical Directed Acyclic Graph Kernel : HDAG Kernel)と名付けた新しい計算手法を提案する.これは,テキスト内の様々な構造を「階層を許した非循環有向グラフ」で表現し,このグラフ間の類似度を定義することで,テキスト内の様々な構造を取り入れた類似度を計算する方法である.提案手法により,文・文節・固有表現といった意味的なまとまりや依存関係・照応関係といったテキスト内の様々な構造を反映した類似度を現実的な時間で計算できる.本稿では,対応付けされた要約文や,質問タイプに基づく質問文の類似性評価の実験を行い提案手法の有効性を検証した.
- 一般社団法人情報処理学会の論文
- 2003-03-06
著者
-
鈴木 潤
日本電信電話株式会社 Nttコミュニケーション科学基礎研究所
-
佐々木 裕
The University Of Manchester
-
前田 英作
日本電信電話株式会社NTTコミュニケーション科学基礎研究所人間情報研究部
-
平尾 努
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
佐々木 裕
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
鈴木 潤
日本電信電話株式会社 Ntt コミュニケーション科学基礎研究所
-
佐々木 裕
Ntt情報通信網研究所
-
平尾 努
日本電信電話株式会社 Ntt コミュニケーション科学基礎研究所
-
前田 英作
日本電信電話(株)コミュニケーション科学基礎研究所
関連論文
- 携帯型端末を用いた音声自動翻訳システムとフィールド実験(モバイルと放送の融合時代を迎えて(1セグ放送, モバイル放送, 携帯放送融合サービス, 1セグ対応携帯端末, モバイルコンテンツと放送コンテンツの融合, マルチメディア配信, ディジタル放送受信機, および一般))
- 最適化問題としての文書要約
- パーティクルフィルタとこう配法の組合せによる頭部姿勢と表情の同時推定(メディア処理,画像の認識・理解論文)
- 表情認識のための変動輝度テンプレートとその頭部姿勢変動に対する頑健性の一検討(テーマ関連セッション3)
- 最大マージン原理にもとづく多重トピック文書の自動分類(フィルタリング、文書分類)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- 音声翻訳研究の展開(機械翻訳)
- NTCIRにおける質問応答技術の評価と今後の展望(NTCIR特別セッション)
- カーネル法 : 基礎と応用(手,顔,身体表現の認識,理解)
- テキスト要約の自動評価(テキストの自動評価)
- 抜粋による複数文書要約を評価するためのコーパスと評価指標
- NTCIRにおける質問応答技術の評価と今後の展望(NTCIR特別セッション)
- F値最大化学習に基づく文書の多重ラベリング(機械学習)
- 高次元特徴空間に適した半教師あり条件付確率場の検証(機械学習)
- 携帯型端末を用いた音声自動翻訳システムとフィールド実験
- 機械翻訳システム評価法の最前線
- 識別学習による組合せ最適化問題としての文短縮手法
- 単一言語コーパスにおける文の自動対応付け手法(自然言語)
- 階層非循環有向グラフカーネル(情報論的学習理論論文)
- SVMを用いた学習型質問応答システムSAIQA-II(自然言語)
- 単語属性N-gramと統計的機械学習による質問タイプ同定(自然言語)(「インタラクション:理論,技術,応用,評価」)
- 機械学習のための組み合わせ素性の選択基準について(分類、クラスタリング,機械学習)
- 言語パターンに着目した複数文書要約(要約)
- 機械学習のための組み合わせ素性の選択基準について(分類、クラスタリング, 機械学習)(言語理解とコミュニケーション)
- 言語パターンに着目した複数文書要約(言語理解とコミュニケーション)
- 機械学習のための組み合わせ素性の選択基準について
- 言語パターンに着目した複数文書要約
- 素性選択機能をもったString Kernelの提案(パタン発見)(セマンティックウェブと自然言語処理その他一般)
- 素性選択機能をもった String Kernel の提案
- 階層構造を利用したテキスト間類似度の効率的計算法
- LE-10 統計的機械学習を用いた質問タイプ同定(E. 自然言語・文書)
- SAIQA : 大量文書に基づく質問応答システム
- SAIQA : 大量文書に基づく質問応答システム
- 構文情報に依存しない文短縮手法
- 投票型回帰モデルによる要約の自動評価法
- 辞書式順序を持つペナルティによるゼロ代名詞解消(自然言語)
- 拡張ストリングカーネルを用いた要約システムの自動評価法(自然言語,情報処理技術のフロンティア)
- 最大マージン原理に基づく多重ラベリング学習(自然言語処理)
- 文書要約の自動評価手法の提案と評価(セグメンテーション・要約)
- 優先度学習を用いた自然言語処理(解析)
- 生物医学文献からの遺伝子機能フレーズの抽出(抽出,マイニング)
- 保有知識の確信度に基づく対話型映像認識理解システムの質問生成戦略(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 保有知識の確信度に基づく対話型映像認識理解システムの質問生成戦略(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 自動要約評価型ワークショップ : Text Summrization Challenge(TSC)(音声・言語における標準化動向)(第6回音声言語シンポジウム)
- 自動要約評価型ワークショップ : Text Summrization Challenge(TSC)(音声・言語における標準化動向)(第6回音声言語シンポジウム)
- 自動要約評価型ワークショップ : Text Summrization Challenge(TSC)(音声・言語における標準化動向)(第6回音声言語シンポジウム)
- 動向情報の要約と可視化に関するワークショップの提案(検索,要約)
- 動向情報の要約と可視化に関するワークショップの提案(検索,要約)
- 文書要約における抽出単位と評価法についての考察(要約)
- 対話データの統計量を用いたPOMDPによる対話制御(対話,第11回音声言語シンポジウム)
- 対話データの統計量を用いたPOMDPによる対話制御
- 変動輝度テンプレートによる頭部姿勢と表情の同時推定
- 表情認識のための変動輝度テンプレートとその頭部姿勢変動に対する頑健性の一検討(テーマ関連セッション3,顔・ジェスチャの認識・理解)
- 表情認識のための変動輝度テンプレートとその頭部姿勢変動に対する頑健性の一検討(テーマ関連セッション3,顔・ジェスチャの認識・理解)
- 音声認識と音声翻訳の国際的共通評価基盤構築に向けて
- 参加者から見たNTCIR(NTCIR : 情報アクセスに関わるテキスト処理技術の評価ワークショップ)
- ブリッジプレイの終盤における必勝戦術の論理的考察
- 総合学習による質問応答システムの新しい構成法 : CLQAに向けて(質問応答)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- 総合学習による質問応答システムの新しい構成法 : CLQAに向けて(質問応答)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- 対話的制約充足手法による制約プログラミングの実現
- 手続き型言語によるプロダクションシステム制御手法のCAIシステムへの適用と評価
- 環境知能のすすめ(オーガナイズドセッション,アンビエント環境知能)
- 環境知能のすすめ(オーガナイズドセッション,アンビエント環境知能)
- 環境知能のすすめ(オーガナイズドセッション)
- カーネル法 : 基礎と応用(手,顔,身体表現の認識,理解)
- カーネル法 : 基礎と応用
- 連載を終えて(これからの情報処理学会)
- LH-003 変動輝度テンプレートを用いた頭部姿勢変動に頑健な確率的表情認識手法(画像認識・メディア理解)
- 阿部圭一(著), 明文術 伝わる日本語の書きかた, NTT出版(株), 189p., 1,890円(税込), ISBN4-7571-0196-1
- 6 バイオ自然言語処理のための機械学習技術(ポストゲノム時代に高まるバイオ自然言語処理への期待 : バイオ自然言語処理最新事情)
- 0 編集にあたって(ポストゲノム時代に高まるバイオ自然言語処理への期待 : バイオ自然言語処理最新事情)
- COLING-2000参加報告
- 文書情報からの分野オントロジー構築の支援
- 質問応答システムの比較と評価
- F値
- オントロジー主導による情報抽出 (「オントロジーの基礎と応用」)
- オントロジ主導による情報抽出の検討
- 質問応答システム:SAIQA--何でも答える物知り博士 (特集論文1 高度検索技術)
- E-6 固有表現を利用した大量文書の時系列ブラウジング法(要約・情報検索,E.自然言語・文書)
- 質問に適応した文書要約手法とその評価
- 世界図書館を飲み込む次世代ヒューマノイド--知識処理と言語処理の新しい展開 (特集論文1 人にやさしい対話型コンピュータ)
- AAAI-99参加報告
- 型付き論理プログラムの正例からの学習
- セグメント単位の評価指標最大化に基づく条件付確率場の学習
- Support Vector Machineを用いた重要文抽出法(自然言語)
- 機械学習による複数文書からの重要文抽出
- LE-11 機械学習を用いた複数文書要約(E. 自然言語・文書)
- ポータルサービスを支える検索技術 (特集論文1 高度検索技術)
- セグメント単位の評価指標最大化に基づく条件付確率場の学習(自然言語処理)
- Order SVM : 一般化順序統計量に基づく順位付け関数の推定(情報論的学習理論論文小特集)
- 大規模データを用いた半教師あり学習による高精度係り受け解析モデルの学習
- 対話型映像認識理解における動的学習戦略に関する取り組み(テーマセッション,PRMUのフロンティア・グランドチャレンジ)
- POMDPによるTrigram対話制御(対話,第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- POMDPによるTrigram対話制御(対話,第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- LG-5 順序関係を推定する位置づけ学習問題とその解法(G. 人工知能)
- ILPにおける仮説言語の型付き論理プログラムへの拡張
- 擬人化エージェントとの音声対話時におけるユーザの非言語動作からの難/易及び興味/退屈の推定(ユーザ状態推定,人とエージェントのインタラクション論文)
- RHB^+ : 正例に基づく型付ILPシステム
- 不均衡データにおける偽陽性率を考慮したスパム判別器のオンライン学習
- D-007 偽陽性率に着目したオンライン学習を用いたスパム判別(Web,D分野:データベース)
- 語順の相関に基づく機械翻訳の自動評価法