出現密度分布を用いた語の重要説明箇所の特定
スポンサーリンク
概要
- 論文の詳細を見る
本論文では, テキスト中にある語が複数箇所出現する場合, その中からその語の重要な説明箇所を自動的に特定する方法を提案する. 語に対して, 重要な, あるいは関連性の高い説明をしようとすれば, 必然的にその語を繰り返し用いる必要がある. そこで, 語のテキスト中での出現密度分布を調べ, その高密度な出現位置を取り出すことによって, その話の重要説明箇所を特定することができる. 密度計算には, ハニング窓関数を用いてある範囲の語の出現を重み付きで加算するという方法を用いる. 新書20冊, 180キーワードに対する評価実験によって本手法の有効性を具体的に示す.
- 一般社団法人情報処理学会の論文
- 1996-09-12
著者
-
黒橋 禎夫
京都大学大学院情報学研究科知能情報学専攻
-
長尾 眞
京都大学大学院工学研究科電子通信工学専攻
-
長尾 眞
京都大学大学院情報学研究科知能情報学専攻
-
白木 伸征
京都大学大学院工学研究科電子通信工学専攻:(現)株式会社豊田中央研究所
-
長尾 眞
京都大学大学院工学研究科 電子通信工学専攻
-
黒橋 禎夫
京都大学大学院情報学研究科
関連論文
- 6.言語・画像のデータ依存情報処理(情報処理技術の未来地図,50周年記念特集号)
- 同一文抽出に基づく類似ページの検出と分類
- 国立国会図書館 館長対談(第13回)前フランス国立図書館長 ジャン-ノエル・ジャンヌネー氏 文化の多様性と知の伝承
- 国立国会図書館 館長対談(第7回)デジタル時代のスウェーデン国立図書館の挑戦 (デジタル時代のスウェーデン国立図書館の挑戦--スウェーデン国立図書館長 グンナー・サーリン氏)
- 大規模テキストコーパスからの知識獲得
- 情報爆発時代における情報管理・融合・活用基盤(情報爆発時代に向けた新しいIT基盤技術の研究)
- 表層・語彙的特徴量に基づくブログの面白さ分析(学生セッション I)
- 本の森を歩く(特別篇)館長 長尾真が読書週間に選ぶ9冊
- 絵画解説文の対象情報・感性的情報の抽出
- 画像の内容を説明するテキストを利用した画像解析
- キャプションと記事テキストの文字列照合による報道番組と新聞記事との対応づけの自動化
- パターン情報と自然言語情報の統合による植物図鑑の図の理解
- キャプションと記事テキストの最長一致文字列照合による報道番組と新聞記事との対応づけの自動化
- 図鑑の解説文から内容抽出を行うための専門知識の構築
- 植物図鑑のテキストと図による植物用語間の階層関係の獲得
- 概念の属性を表す名詞述語文の述語の自動分類
- 図鑑の解説文から内容抽出を行なうための専門知識の構築
- TVニュースと新聞記事の対応づけ
- 単語の共起頻度と出現位置による新聞の関連記事の検索手法
- 表層的手がかりによる六法全書法律文での要件部・効果部の抽出手法
- 形態素の共起頻度と出現位置による新聞関連記事の検索手法
- 日本語文生成における語彙選択に必要な要因とその性質
- 巻頭対談 国立国会図書館長・長尾真氏 VS.東京理科大学理事長・塚本桓世氏 これからの図書館のあり方と利用について
- 創立40周年記念祝典のご報告
- 日本の大学のあるべき姿 (特集1 大学改革はどこへ向かうのか?) -- (大学を問う)
- 名詞句「AのB」「AB」の用例を利用した換喩解析
- 科学的説明の確実性について
- 確率的モデルによる仮名漢字変換
- 2. 先端技術を生み出す独創性 : 2-1 独創性とは(900号記念特集)
- インタラクティブ・エッセイ : 再コメント
- 電子図書館の正しい概念を持とう (インタラクティブ・エッセイ)
- 構文情報を利用した電子ニュース記事のクラスタリングシステムの作成と評価
- nグラム統計によるコーパスからの未知語抽出
- 21世紀情報社会へ向って
- 構文情報を利用した電子ニュース記事のクラスタリングシステムの作成と評価
- 表層表現と用例を用いた照応省略解析手法
- 日本語文章における表層表現と用例を用いた動詞の省略の補完
- 意味ネットワークからの文章生成
- 国立国会図書館 館長対談(第12回)児童文学者 松岡享子氏 読書は本とのコミュニケーション
- 小規模タグ付きコーパスと自動獲得した大規模語彙知識を用いた識別モデルに基づくゼロ照応解析
- 文脈に依存した述語の同義関係獲得
- 日本語名詞における間接照応
- 1.キーワードサーチを超える情報爆発サーチ : 自然言語処理で価値ある未知をマイニング(パートI:情報爆発時代における新しい基盤技術,情報爆発時代におけるわくわくするITの創出を目指して)
- 用例ベース翻訳の確率的モデル化
- 機械翻訳最新事情 : (下)評価型ワークショップの動向と日本からの貢献
- 帰属文書数に基づくWebページ情報発信者の専門性分析
- 帰属文書数に基づくWebページ情報発信者の専門性分析
- メッセージの背後に潜む「問い」の抽出
- 多言語コミュニティヘの用例ベース翻訳の適用(言語グリッドと異文化コラボレーション)
- MDL原理に基づく辞書定義文の圧縮と共通性の発見
- 事例の重み付けに基づく自動獲得されたコーパスの効果的な利用法と評価極性分類への応用(「ユニバーサルコミュニケーションを実現するための言語処理技術」シンポジウム)
- 形態素クラスタリングによる形態素解析精度の向上
- タグ付きコーパスからの統語規則の獲得
- マルチエージェントシステムに対する期待
- AIマップ : 自然言語へのアプローチ
- 京都大学統合情報通信システムKUINSの基本概念とシステム設計
- 16. 自然言語の一般理論の試み
- RE-002 二段階の機械学習を用いたボトムアップ型の固有表現認識(自然言語・音声・音楽,査読付き論文)
- 言語の理解へ
- キーワード蒸留型クラスタリングによる大規模ウェブ情報の俯瞰
- クエリの語句の重要度と係り受けを考慮した自然文検索(検索・対話)
- クエリの語句の重要度と係り受けを考慮した自然文検索(検索・対話)
- 図解辞書とLDOCEの分野コードに基づく場面知識による英語名詞の多義性解消
- 3. 座談会 : 未来に向けての技術展望(あの技術は今… : 技術の変遷と21世紀への展望)
- 坂井利之先生の文化功労者顕彰を祝して
- 高等教育における教育改革と経営改善(挨拶)
- 大学教育評価をどうするか : 評価からFDへ(挨拶)
- 大学教員の教育能力をどう開発するか(挨拶)
- 21世紀社会を支える情報処理学会になるために : 会長就任にあたって
- 異分野の人との対話
- 大域的情報を用いた日本語固有表現認識
- 自然言語入力と目次との柔軟な照合による図書検索システム
- 出現密度分布を用いた語の重要説明箇所の特定
- 出現密度分布を用いた語の重要説明箇所の特定
- 目次情報を利用した図書検索システム
- 表層・語彙的特徴量に基づくブログの面白さ分析(学生セッション I)
- 国語辞典を用いた名詞句「AのB」の意味解析
- 依存関係確率モデルを用いた統計的句アライメント
- 形態論的制約を用いたオンライン未知語獲得
- E-009 長い複合名詞の構造的な固有表現認識(自然言語・音声・音楽,一般論文)
- 基調講演「電子図書館の構築」 (電子図書館時代の大学図書館の生産性(平成9年11月13日〜14日、会場:京都産業大学))
- 雑誌「自然言語処理」の発刊にあたって
- B33 科学技術文献を対象とする日中・中日機械翻訳 : 日中・中日言語処理技術の研究開発 その1(セッションB3情報システム構築2,一般発表概要,第7回情報プロフェッショナルシンポジウム)
- 4ZK-10 検索結果クラスタリングのためのページタイプの自動識別(情報爆発時代におけるテキストデータ処理,学生セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 同位語を利用した不在インデックス
- 同位語を利用した不在インデックス
- 基本語ドメイン辞書の構築と未知語ドメイン推定を用いたブログ自動分類法への応用
- 述語項構造の共起情報と格フレームを用いた事態間知識の自動獲得
- Web時代の音声・言語技術
- 3.情報爆発時代のWebのサーチ・分析技術(情報爆発が創り出すサイバーフィジカルな情報処理)
- 構文・照応・評価情報つきブログコーパスの構築
- 大規模格フレームを用いた識別モデルに基づく日本語ゼロ照応解析
- 構造を持った定型表現の自動獲得と機械翻訳での利用 (機械翻訳技術の向上)
- 日本語未知語のテキストからの自動獲得(知識発見,第1回テキストマイニング・シンポジウム)
- 大規模語彙的知識に基づく受身形と能動形の表層格の対応付け
- テキストの表層情報と潜在情報を利用した適合性フィードバック
- ユニット制約の緩和による柔軟な日本語文圧縮
- ユニット制約の緩和による柔軟な日本語文圧縮
- 日中共通漢字の整理とこれを利用した日中機械翻訳の高度化 (特許情報普及活動功労者表彰 発足記念版) -- (機械翻訳技術の向上)
- 語彙と文脈情報を用いた反義の詳細クラス分類