日本語文書に含まれる固有用語の自動抽出方式
スポンサーリンク
概要
- 論文の詳細を見る
機械翻訳やキーワード自動抽出などの日本語解析技術を応用した日本語処理システムの開発が盛んに行われている。これらのシステムでは,システムが持つ電子化辞書を用いて入力文を正確に解析することが必要である。従って,入力される文書に対して,辞書がどの程度充実しているかがシステムの精度を決める要因の1つとなる。特に,適用分野を考えると,文書の種類(新聞,論文など)などによって辞書に登録すべき語が異なる。適用分野に適合した辞書を作成するためには,一般語以外に辞書に登録すべき語(固有名詞や専門用語など)が数多く存在する。本稿では,このような語を『固有用語』と呼び,次のように定義する。<固有用語の定義>ある日本語文書でのみ使用されている製品名,会社名,人名などの固有名詞や,既知の単語の組み合わせからなる語であっても全体として新語(未知語)や専門用語,および,その文書中においてのみ使用されていると考えられる語。このような固有用語を文書中から自動的に抽出することは,キーワードの抽出や機械翻訳における辞書の充実などを支援する技術として重要である。
- 一般社団法人情報処理学会の論文
- 1990-09-04
著者
-
奥 雅博
Nttサイバーソリューション研究所
-
東田 正信
NTT情報通信処理研究所
-
奥 雅博
NTT情報通信研究所
-
東田 正信
(株)国際電気通信基礎技術研究所(ATR)経営企画部
-
東田 正信
Ntt情報流通プラットフォーム研究所
関連論文
- 特集「並列処理マシン」の編集にあたって
- 特集「並列処理技術」の編集にあたって
- 音節波形接続による単語音声合成
- オペレータレス自動電話番号検索システムの開発
- 形態素解析を利用したデータベース検索高速化方法
- PB電話機を利用した日本語入力方式
- オペレータレス自動電話番号検索システムに適した部分一致検索手法
- 音声による姓名同音異字候補の特定方法に関する検討
- PB入力型電話番号検索実験システムに用いる漢字説明文の評価
- 形態素解析を用いた中間部分一致検索の高速化手法
- 形態素解析を用いた中間部分一致検索の高速化手法
- 文字連鎖を用いた複合語同音異義語誤りの検出手法とその評価
- PB電話機を利用したデータベース検索における漢字情報の利用方法
- PB電話機を利用した電話番号案内方式に適した対話誘導戦略
- 関連記事の判定に関する検討
- 情報探索におけるGUIに関する一考察
- 数値情報説明のための文生成技術
- 日本文解析における述語相当の慣用的表現の扱い
- 日本語文書に含まれる固有用語の自動抽出方式
- 意味カテゴリを用いたサ変動詞同音異義語誤り検定方式
- 89-23 意味的な曖昧さを越えて
- 意味カテゴリを用いた複合語の同音異義語誤り検定方式
- 日英翻訳システムALT-J/Eにおける日英変換技術
- PB電話機を利用した電語番号案内技術
- 文生成における態の表現方法
- 2000-SLP-32-10 効率的な音声対話制御方式に関する一考案
- ベンチャー6 索引作成支援システム「SAKUIN君」
- 結合価構造に基づく「鼻が長い象」型埋め込み名詞句の解析
- 結合価構造に基づく日本語二重主格形容詞構文の解析
- 日英翻訳システムALT-J/Eの設計思想
- [特別招待論文]21世紀の電子デバイス技術への期待 : マルチメディア時代を迎えて
- [特別招待論文]21世紀の電子デバイス技術への期待 : マルチメディア時代を迎えて
- [特別招待論文]21世紀の電子デバイス技術への期待 : マルチメディア時代を迎えて
- SPIRITの概要 (キャリア共通計算機調達仕様の開発)
- 小特集「巨大システムにおける信頼性技術」の編集にあたって
- 音節波形接続による単語音声合成
- 日本文推敲支援システムREVISEにおける複合語同音異義語誤りの検出および訂正支援手法