事物間関係の推定における文書内頻度を考慮した補完類似度の性能評価
スポンサーリンク
概要
- 論文の詳細を見る
本研究では,文字認識の分野で用いられている補完類似度をテキストコーパスから事物間の関係を推定する問題に適用する際に,事物が持つ各文書における頻度を考慮した場合を考える.補完類似度は,ベクトルで表された文字の画像パターンの類似度を測ることによって劣化印刷文字を認識するために経験的に開発された尺度である.この扱うベクトルをコーパス中の事物の出現パターンに置き換えると,補完類似度は事物間関係の推定に適用できる.そこで,これまでに二値ベクトルを対象として事物間関係の推定を行った。しかし,二値ベクトルでは,Document Frequencyしか考慮しておらず,Term Frequency(文書内頻度)を考慮していない.そこで,Term Frequencyを考慮した多値ベクトルを対象とした補完類似度を用いて事物間関係の推定を行った.その結果,Term Frequencyを考慮した補完類似度のほうが推定能力が高かったことを報告する.
- 一般社団法人情報処理学会の論文
- 2002-11-12
著者
-
山本 英子
神戸大学大学院工学研究科
-
内山 将夫
独立行政法人情報通信研究機構
-
井佐原 均
独立行政法人 情報通信研究機構 けいはんな情報通信融合研究センター
-
井佐原 均
情報通信研究機構
-
内山 将夫
独立行政法人情報通信研究機構 知識創成コミュニケーション研究センター
-
山本 英子
情報通信研究機構
-
山本 英子
独立行政法人 通信総合研究所
-
井佐原 均
独立行政法人情報通信研究機構 知識創成コミュニケーション研究センター
-
井佐原 均
独立行政法人 情報通信研究機構
関連論文
- E-021 大規模単言語コーパスの利用による機械翻訳用対訳辞書の新規連語獲得性能の向上(E分野:自然言語・音声・音楽)
- LN-003 英語学習者の英文読解能力推定のための読解時間予測法(教育・人文科学)
- 日本語発話文の敬語の誤用を指摘するシステム(人工知能)
- コーパスに基づくがん用語集合の作成と評価
- 言語音を解読する神経機構 : 音のどこに解読の手がかりは書き込まれるか?
- 話し言葉における引用節・挿入節の自動認定および係り受け解析への応用
- 3D-1 言語資源メタデータデータベースSHACHIの構築と利用(自然言語処理,一般セッション,人工知能と認知科学)
- 日本語話し言葉コーパスとその構築技術 (ヒューマンコミュニケーション特集) -- (自然言語)
- 話し言葉における引用節の自動認定および引用符の付与(第8回音声言語シンポジウム)
- 話し言葉における引用節の自動認定および引用符の付与(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 話し言葉における引用節の自動認定および引用符の付与
- 学習者発話におけるintelligibilityに関する一考察(言語の学習・教育)
- AS-4-3 敬語の誤用を指摘するシステム : GUIの実装(AS-4.円滑なコミュニケーション,シンポジウム)
- LE-002 テンス・アスペクト・モダリティの翻訳における機械翻訳システムの誤りの調査(E分野:自然言語)
- 日本語話し言葉の係り受け解析と文境界推定の相互作用による高精度化
- 『日本語話し言葉コーパス』における自己修復部(Dタグ)の自動検出および修正に関する検討(合同セッション「対話」)
- 自然言語処理技術を用いた大会プログラム作成支援について
- テキストにおける首尾一貫性(coherence)と文脈表現構造
- 実験的な知識に基づく文脈表現構造からの英語テキスト生成
- シリーズ型質問文に対して単純結合法を利用した逓減的加点質問応答システム
- 階層構造データ列の簡易な高速検索アルゴリズム(重要語抽出・検索・文書分類)
- 階層構造データ列の簡易な高速検索アルゴリズム(重要語抽出・検索・文書分類)
- 言語学的考察および機械学習手法に基づく意見分析支援--要求意図を取り出す一手法 (2005年情報学シンポジウム講演論文集--社会システムを支える情報学) -- (セッション5:知識獲得・記述の支援)
- 効率的な語彙獲得のための英文読解教材の作成
- フェイスシートとの関係を利用した自由回答アンケートの分析(解析)
- 新聞記事コーパスでの単語出現特徴を利用した観光イベント情報の検索支援
- フェイスシートとの関係を利用した自由回答アンケートの分析(解析)
- 英文読解のためのコースウェアの作成(教育)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- 英文読解のためのコースウェアの作成(教育)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- 英語教育のための分野特徴単語の選定尺度の比較
- 自由回答アンケートにおける要求意図判定基準
- 質問応答システムにおける逓減加点法に基づく複数記事情報の利用(質問応答・文書分類・自動収集)
- 英文読解のためのコースウェアの作成
- 複数尺度の統計的統合法とその専門用語抽出への応用(オントロジ・抽出(2))(セマンティックウェブと自然言語処理その他一般)
- 複数尺度の統計的統合法とその専門用語抽出への応用
- 日英新聞の記事および文を対応付けるための高信頼性尺度
- WWW検索における複数検索結果の統合処理とその評価(データベースと感性,デザイン,バイオインフォマティクス,音楽,環境,医学,建築分野との連携)
- 事物間関係の推定における文書内頻度を考慮した補完類似度の性能評価
- SENSEVAL2J 辞書タスクでのCRLの取り組み : 日本語単語の多義性解消における種々の機械学習手法と素性の比較
- 近似文字列照合による全文検索のための接尾辞配列の高速走査法
- コーパスからの形容詞概念階層の構築と評価 : 実データによる形容詞オントロジーの構築にむけて
- 形容詞概念抽出のための統語パタン分析 : コーパスからの日本語語彙オントロジーの構築をめざして(言語理解とオントロジーシンポジウム)
- コーパスからの単語間の意味関係の獲得とその応用 (ヒューマンコミュニケーション特集) -- (自然言語)
- 出現状況の包含関係による語彙の階層構造の構築(知識処理,情報処理技術のフロンティア)
- コーパス中の呼応表現を抽出する問題における類似尺度
- F-004 出現状況の包含関係を利用した語彙の階層関係の自動構築(F.人工知能)
- 共起情報に基づく呼応関係自動抽出法の検討(抽出(1))
- 自己組織型意味マップにおける形容詞と抽象名詞の分布 : 客観的なシソーラスをめざして(言語理解とコミュニケーション一般)
- 日本語名詞の意味マップの自己組織化
- 日本語連体修飾要素の多義解消に関する語彙意味論的検討
- 情報抽出表とソートグラフを利用したテキストマイニングシステム Simpleminer
- 入力文の格助詞ごとに学習データを分割した機械学習による受身文の能動文への変換における格助詞の変換
- 大規模記事群からの数値固有表現情報のテキストマイニング可視化システム(ツール・システム)
- 非階層関係にある関連語集合の抽出と発想支援への適用
- E_003 検索に有効な知識の自動獲得 : 質問拡張を超えて(E分野:自然言語)
- 日本語発話文における敬語の誤用を指摘するシステムの開発
- Web文書集合からの専門用語獲得(自然言語,情報処理技術のフロンティア)
- E_029 関係節の英日翻訳法に関する統計的特徴抽出の試み(E分野:自然言語)
- D09 ネットワーク分析を用いた印象抽出に関する研究(デザインプロセス(創造性研究部会),「想像」する「創造」〜人間とデザインの新しい関係〜,第56回春季研究発表大会)
- D07 創造性理解のための概念生成過程の仮想モデリング(デザインプロセス(創造性研究部会),「想像」する「創造」〜人間とデザインの新しい関係〜,第56回春季研究発表大会)
- グループ・ディスカッションの相互行為過程の評価と分析のための指標 : フォーカス・グループ・インタビューデータの分析から
- 機械学習を用いた日本語複合辞のチャンキング(抽出, 言い換え)
- 『日本語話し言葉コーパス』における自己修復部(Dタグ)の自動検出および修正に関する検討(合同セッション「対話」)
- 土俵と取り組み
- テキストコーパスの作成 : RWC, JEIDA, Orchid
- 共通日本語話し言葉コーパスの設計
- 最近思うこと
- 属性影響語を用いた専門用語判別(専門用語)
- 属性影響語を用いた専門用語判別(専門用語)
- 統計的に獲得された用語への属性ラベル付与(Web情報処理)
- 検索支援に向けたWeb文書集合からの用語獲得(Web情報処理)
- 統計的に獲得された用語への属性ラベル付与(Web情報処理)
- 検索支援に向けたWeb文書集合からの用語獲得(Web情報処理)
- 後続要素を予告する表現の分析
- E-41 出現頻度を考慮した補完類似度による事象間関係の推定(知識獲得,E.自然言語・文書)
- 英文読解効率テストの有効性の検証(言語の学習・教育)
- LN_005 英文読解速度テストの有効性の検証(N分野:教育・人文科学)
- 二言語コーパスからの語彙知識獲得のための対訳辞書登録候補の選別
- LE-003 サポートベクターマシンを用いた対訳辞書登録候補の自動選別(E分野:自然言語)
- 前置詞句・等位構造を含む英語固有表現とその対訳表現の獲得(対訳表現獲得)
- 複合語の内部情報・外部情報を統合的に利用した訳語対の抽出
- LK-005 読解過程検定ツールOPERATION2の評価(K. ヒューマンコミュニケーション&インタラクション)
- 非階層関係にある関連語集合の抽出と発想支援への適用(抽出)
- 大規模オープンソース日英対訳コーパスの構築
- 大規模オープンソース日英対訳コーパスの構築
- 論文アブストラクトから原子分子の状態の情報を検出,抽出する方法の研究
- 知的ニュースリーダにおける表層的話題関連性の抽出
- 日英新聞記事の対応付けと精度評価
- 統計的手法による分野非依存のテキスト分割
- 自動要約のための文重要度の比較
- AS-6-1 発話文の敬語の誤用を指摘するシステム : プロトタイプの開発(AS-6. 円滑なコミュニケーションの解明へのアプローチ, 基礎・境界)
- 複数の辞書の定義文の照合に基づく同義表現の自動獲得
- NICT自然言語グループの紹介(けいはんな学研セッション,特別企画講演)
- 英語を介した日中対訳辞書の自動構築
- SENSEVAL2J辞書タスクでのCRLの取り組み
- 種々の機械学習手法を用いた多義解消実験
- 音声翻訳システム実利用データを用いたシステム改善手法(音声翻訳,統計的機械学習,異文化コラボレーション論文)
- 音声翻訳システム実利用データを用いたシステム改善手法
- 話し合いへの印象に影響を及ぼす会話行動 : プロの司会者と素人の印象評定の比較および話し合いの相互行為過程の分析
- 多言語音声翻訳システム"VoiceTra"の構築と実運用による大規模実証実験(音声,聴覚,システム開発論文)