電子メールからのパーソナル情報抽出方法の検討 : 住所録作成支援への適用
スポンサーリンク
概要
- 論文の詳細を見る
電子メールには、末尾にsignatureが付与される場合が多い。このsignatureには送信者の姓名や電話番号等のパーソナル情報が含まれている。また、メールのheaderは送信者のメールアドレスを必ず含み、さらに姓名等の情報を含む場合もある。しかしsignatureの表現形式は多彩であり、含まれる属性数も様々で、パーソナル情報の抽出は単純なパターンマッチでは不十分である。我々はインターネット上の電子メールを対象に、header,signatureを自動検出し、そこからパーソナル情報を抽出して住所録の作成支援をする研究を行っている。このうち本稿では、特にパーソナル情報の抽出方法を中心に述べる。パーソナル情報の抽出は、テキストから特定の内容を抽出する内容抽出処理の一種と考えられる。しかし従来の内容抽出処理では対象テキストは新聞記事などに限定されおり、外枠などの飾り用の文字が使われ、抽出すべき内容(パーソナル情報)もデザイン的に配置される文字列となるsignatureには適用できない。また、抽出対象となる社名等は膨大な種類があり、かつ増え続けており、単語辞書にすべて登録することは不可能である。そこで姓名辞書のみをもち、特定の単語群をキーワードとして扱うことを特徴とするパーソナル情報抽出処理を提案する。
- 一般社団法人情報処理学会の論文
- 1996-03-06
著者
関連論文
- 日本語語彙大系について
- テキスト音声変換における読み・韻律付与処理の評価 : ニュース文を対象として
- PB入力型電話番号検索実験システムに用いる漢字説明文の評価
- 数値情報説明のための文生成技術
- 検索属性の優先順位に基づく自然語対話処理の代替案応答手法
- デ-タベ-ス検索における協調的な自然語対話処理と評価
- 言語行為に基づくメッセージのセグメント分割
- 1D-1 新聞記事の自動要約によるニュース速報配信
- 英和辞書からの日英翻訳ルールの自動獲得
- 日中機械翻訳プロトタイプ
- 日中機械翻訳プロトタイプ
- 速報型日英翻訳システムALTFLASH
- バイリンガル旅行会話コーパスに見られる話し言葉の特徴分析
- 多言語翻訳用ユーザインタフェース
- 3N-4 ナ型形容詞に対する日英対訳用例文の収集について
- 決定木を用いた日本語係受け解析
- 複合和語動詞に対する日英対訳用例文の収集について
- 日本文新聞記事からの英文ヘッドライン生成法について
- 電子化意味辞書 : 商用システム用辞書と「日本語語彙大系」
- 英単語に対する述語性の連語的日本語訳語の分析
- 英文記事ヘッドラインの特徴について
- 日英機械翻訳システムALT-J/Eの研究開発 (特集論文 日英機械翻訳技術)
- 新聞記事文における括弧書き表現の分析とその処理について
- 多段解析法による形態素解析を用いた音声合成用読み韻律情報設定法とその単語辞書構成
- 日本語文章読み上げ技術 : AUDIOTEX
- 音声出力による姓名漢字表記の説明方式
- Signature の局所的パターンマッチによる電子メールからの送信元住所録情報の抽出とそれを用いた住所録管理システム
- 電子メールを利用した住所録管理システム
- 姓名漢字表記を説明する対話システムの試作と評価
- 姓名漢字表記を説明する対話システムの試作と評価
- 情報交換に電子メールを用いる個人情報サーバの実現
- メッセージにおける送り手・受け手のユーザモデル抽出
- 言語表現を利用したメッセージの送り手の性別判定
- 文のおもしろさを決定する言語的な要因の分析
- メッセージの女性→男性表現変換検討
- DB検索におけるメニュー入力と自然語入力時間の比較
- 日本文音声出力のための言語処理方式
- 日本文音声出力システムの辞書構成 (日本文音声出力システム)
- 日本文音声出力システムの言語処理 (日本文音声出力システム)
- 階層的単語属性を用いた同形語の自動読み分け法
- 言語行為列をシナリオとした文生成
- 姓名入力支援システム
- メッセージにおける待遇表現の数量化
- 自然言語インタフェ-スにおける構文意味解析方式
- 日本語対話処理のためのユーザ入力支援
- コミュニケーションは人を超えて--社会情轍研究の過去,現在,未来 (特集論文1 コミュニケーション科学10年の歩み)
- 機械翻訳技術とその適用
- 電子メールからのパーソナル情報抽出方法の検討 : 住所録作成支援への適用