IPAにおけるテキストコーパスの作成
スポンサーリンク
概要
- 論文の詳細を見る
IPA技術センターでは、動詞・形容詞・名詞辞書を作成する過程で見出し語の分析のために新聞、教科書、文芸作品などの実例をデータベース化してきた。けれども単語分割や品詞情報付加などの手を加えていないため、検索効率が悪い。そこで今回、一部のテキストに対し、単語分割と品詞情報付加を行なうことにした。欧米に比べ、日本ではコーパスと呼ばれるような電子化された言語データの作成および共有化が遅れている。IPAのような公共機関が、電子化データを公開することが望ましい。そこで、単語に分割し、品詞情報を付加したデータベースを、「IPAコーパス」と名付け、一般公開することにした。当稿では、IPAコーパスに収録するテキストや、付加する品詞情報について報告する。
- 一般社団法人情報処理学会の論文
- 1995-09-20
著者
関連論文
- 岩波国語辞典を利用した語義タグ付きテキストデータベースの作成
- 名詞辞書における下位区分間の意味的関係の記述
- 名詞の比喩的表現とその統語的特徴
- 計算機用日本語基本形容詞辞書について
- 計算機用日本語形容詞辞書の試作
- 計算機用辞書における動詞の意味関係の記述
- 計算機用自然言語辞書実用化の諸問題
- IPAL名詞辞書による多義性解消のためのコロケーションの分析(並列処理)
- トップダウンなパターン解析に基づく情報抽出
- IPALハイパーテキスト化のためのコロケーションの多義性の分析
- 統合辞書における文型の記述
- 名詞の下位区分間に見られる意味的関係の辞書記述
- 名詞辞書におけるコロケーションの記述
- コーパスデータに基づく名詞コロケーションの辞書記述
- 計算機用日本語辞書の開発
- 計算機用日本語基本名詞辞書の概要
- 計算機用日本語基本名詞辞書における記述項目の構成
- ルールベースを用いたテキスト分類サービス : 自動分類技術のビジネスへの応用(INFOSTAシンポジウム2000)
- 意味分類の言語学的構成法とWWW上のシソーラス構築
- 動詞・形容詞・名詞を統合する辞書の構築
- IPAにおけるテキストコーパスの作成