タームのrepresentativenessを測る
スポンサーリンク
概要
- 論文の詳細を見る
文書検索において,検索の結果得られた文書数が大きい場合,その内容を把握し,意図した方向へと検索を進めることは容易ではない.これを補助するためには,文書集合の内容を俯瞰するために,文書集合中の特徴語を提示することが有効であるとわかってきた.本研究は,特徴語を選ぶための,単語の話題性もしくは分野代表性(representativeness)を測る新しい指標を提案する.日経新聞を用いた指標の選別能力の評価実験,学術情報センターのAI論文アブストラクトを用いた用語抽出実験を通して,新指標の有効性を示す.
- 一般社団法人情報処理学会の論文
- 1999-09-10
著者
-
丹羽 芳樹
(株)日立製作所中央研究所
-
久光 徹
(株)日立製作所中央研究所
-
久光 徹
日立製作所基礎研究所
-
久光 徹
日立製作所
-
辻井 潤一
東京大学理学部情報科学科
-
辻井 潤一
東京大学
-
丹羽 芳樹
日立製作所中央研究所
-
辻井 潤一
東京大学大学院情報理工学系研究科
-
辻井 潤一
東京大学大学院情報理工学系研究科コンピュータ科学専攻|マンチェスター大学情報学研究科|英国国立テキストマニングセンター
関連論文
- 連載:理学のキーワード : 第26回
- 情報大航海プロジェクトにおける共通技術 : 画像・映像処理技術の紹介
- 理学のキーワード : 第11回
- 頑健なHPSGパーザの出力からTDL意味表現への変換手法(推論・意味)
- MK-6 東京大学理学部生物情報科学学部教育特別プログラム(大型プロジェクト紹介,学術系企画)
- 医療用語のコード化手法 : 部分文字列のテキスト近似被覆問題(専門用語)
- 96 テンプレート入力方式の読影レポート作成システムの開発と試用(医療情報管理 RIS・情報支援)
- 対話的文書検索における文書クラスタリングの役割
- OCR誤認識後処理の効率化 : 補単語抽出方法と動詞活用処理を中心に
- 形態素解析プログラムANIMAの設計と評価
- 情報検索支援のためのシソーラス管理システムの提案
- 対話的文書検索における文書クラスタリングの役割
- 一般語との曖昧性を持つタンパク質名の自動検出(情報抽出・単語分類)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- 一般語との曖昧性を持つタンパク質名の自動検出(情報抽出・単語分類)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- E-028 テーマ指向性単語重み付け方式の提案と単文書要約への適用(E.自然言語・文書・ゲーム)
- 2P-3 タームのrepresentativenessを測るための新指標
- タームのrepresentativenessを測る
- コーパスに基づく動詞の多義解消
- 辞書を使わない日本語専門用語の自動分割
- 専門用語の自動抽出
- コーパスに基づく動詞の多義解消
- 1C-1 高速な類似文字列検索アルゴリズム(情報検索・情報推薦,一般セッション,データベースとメディア,情報処理学会創立50周年記念)
- HPSG Supertagging の精度向上のための単語クラスタリング
- HPSG Supertagging の精度向上のための単語クラスタリング
- 編集にあたって(自然言語処理の高度化による知的生産性の向上)
- 深い構文解析のための高被覆な中国語HPSG文法の開発
- 日本語CCGの語彙項目獲得(語彙・概念の獲得と同義語)
- SupertaggingとCFG-filteringによるHPSG構文解析の高速化(深い言語処理のためのフレームワーク)
- 純粋な逐次処理による構文解析での探索候補数の削減(構文解析・機械翻訳)
- 純粋な逐次処理による構文解析での探索候補数の削減(構文解析・機械翻訳)
- 頑健なHPSGパーザの出力からTDL意味表現への変換手法(推論・意味)
- 教師なし隠れマルコフモデルを利用した最大エントロピータグ付けモデル
- PCFGと分岐HMMを用いた構文解析(文構造解析)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- PCFGと分岐HMMを用いた構文解析(文構造解析)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- PCFGと分岐HMMを用いた構文解析
- 実用的な文法を開発するためのデバッグツール
- 言語理解・意味理解の先駆者田中穂積先生の想い出(8)
- 相互作用情報タグつき生命科学論文アブストラクトコーパスの作成(Text mining)
- 4 バイオNLPのためのコーパスと各種リソースの現状(ポストゲノム時代に高まるバイオ自然言語処理への期待 : バイオ自然言語処理最新事情)
- ゲノム科学におけるテキストマイニングと自然言語処理 (ゲノムサイエンスの新たなる挑戦) -- (第3部 ゲノム情報科学)
- 医療用語のコード化手法 : 部分文字列のテキスト近似被覆問題(専門用語)
- 言語データマネージメントのための言語タグを利用した区間演算と区間検索
- 連想に基づく情報アクセス技術 : 汎用連想計算エンジンGETAを用いて(最新情報検索技術)
- あいまい検索の技術と応用 (特集 インターネット検索技術と日本語研究)
- TD-1-6 DualNAVIによる連想的テキストアクセス
- 組み合わせ的確率モデルに基づく特徴単語選択方法 : 超幾何分布の応用
- 類似例の存在を否定的な要因として用いる重要バイグラムの収集支援方法
- 書き換え規則と文脈情報を用いた形態素解析後処理
- 書き換え規則と文脈情報を用いた形態素解析後処理
- 統計量とルールを組み合わせて有用な括弧表現を抽出する手法
- WWWホームページからの共起語自動抽出実験
- 括弧表現から統計量を用いて有用情報を抽出する手法
- 辞書と共起情報を用いた新聞記事からの人名獲得
- 動的な共起解析を用いた対話的文書検索支援
- 生命の理解とオントロジー (特集 ゲノムサイエンスの新地平--30億文字の生命設計図を探る)
- 3つ以下の候補から係り先を選択する係り受け解析モデル
- 並列HPSGパーザーに向けて
- 生きた言葉を捉える技術--自然言語処理の躍進と新たな課題 (特集 言語学的探究の行方--「生きたことば」と言語研究)
- 計算機による言語情報処理研究と言語学 (特集 言語処理研究の新展開--計算機と言語学の対話に向けて)
- 6 ゲノム情報学と言語処理(ゲノム情報科学 : 観測技術の進展を支えるインフォマティクス)
- リレー対談 認知科学との対話(4)計算言語学から探る人間の知--辻井潤一×辻幸夫
- 言語を計算機でどのように捉えるか (特集 ことばのコンピュートピア--人間との対話を目ざして)
- ことばとコンピュータ--言語理解のプロセスを探る-12・最終回-計算言語学の展開と行方
- ことばとコンピュータ (11)二つの言語学は統合可能か
- ことばとコンピュータ--言語理解のプロセスをさぐる(10)反カテゴリカルなシステムの可能性
- ことばとコンピュータ(9)90年代言語処理研究--その転回の源流
- ことばとコンピュータ--言語理解のプロセスをさぐる(8)八〇年代合理主義の功罪
- ことばとコンピュータ--言語理解のプロセスをさぐる(7)合理主義の曲がり角
- ことばとコンピュータ(6)移行派理論のブレークスルー
- ことばとコンピュータ--言語理解のプロセスをさぐる(5)確率モデルによる機械翻訳の進化
- ことばとコンピュータ(4)機械翻訳における経験主義と合理主義
- マルチプルアライメントによる放送に対する反響の抽出(「主観表現処理の最前線」シンポジウム)
- 日本語固有表現抽出の難易度を示す指標の提案と評価
- 全ての部分文字列を考慮した文書分類(分類)
- UIMAを基盤とする相互運用性の向上と自動組み合わせ比較 : 国際共同プロジェクトU-Compare(アーキテクチャ)
- UIMAを基盤とする相互運用性の向上と自動組み合わせ比較 : 国際共同プロジェクトU-Compare(アーキテクチャ)
- レビューに対する評価指標の自動付与
- 特別寄稿 情報の消費を効率化する第3の革命
- 電子文書による情報アクセスと情報の共有
- 特許のトータルな系でのシステム構成、明晰な日本語の定義などが重要 (Japio年誌ネット座談会 特許分野における機械翻訳の活用と、特許版・産業日本語への期待)
- 基調講演 テキストから知識・情報へ:生命科学を題材にして (2003年情報学シンポジウム講演論文集--データの共有と知識の発見・創造) -- (知識創造のための基盤技術)
- e-サイエンスから研究活動の電子化へ
- 普通のなかの個別性 (誌上月報 シリーズ言語科学(1)文法理論:レキシコンと統語)
- 招待講演 情報共有と知識共有のための言語処理技術の最前線 (〔教育システム情報学会〕言語・知識処理応用研究部会 第82回研究会)
- 7-b) 連想統合による医学・生物学知識の活用ソリューション(企業におけるバイオNLPへの取り組み)(ポストゲノム時代に高まるバイオ自然言語処理への期待 : バイオ自然言語処理最新事情)
- 編集にあたって(ゲノム情報科学 : 観測技術の進展を支えるインフォマティクス)
- 編集にあたって(使いやすくなった自然言語処理のフリーソフト : 知っておきたいツールの中身)
- 固有表現抽出のための大規模訓練データの自動獲得
- 固有表現抽出のための大規模訓練データの自動獲得
- 条件付き確率最大法を利用した日本語形態素解析
- 編集にあたって(テキスト自動要約 : 知的活動支援の基本技術として)
- 文書走査を用いた複合名詞解析
- 自動意味役割付与における意味役割の汎化
- 文書走査を用いた複合名詞解析について
- 日本語形態素解析における効率的な動詞活用処理
- 日本語形態素解析における効率的な動詞活用処理
- 接続コスト最小法による日本語形態素解析
- 漢字仮名混じり文形態素解析における非サ変動詞の分割単位設定について
- 単語ベクトルを用いた多義語の意味推定 : 共起ベクトルと定義距離ベクトルの比較
- 動的な共起解析を用いた対話的文書検索支援