IPALハイパーテキスト化のためのコロケーションの多義性の分析
スポンサーリンク
概要
- 論文の詳細を見る
IPA技術センターでは、これまでに動詞辞書(861語)、形容詞辞書(136語)、並びに、名詞辞書(1,081語)を開発し、公開している。名詞辞書では、一つの見出し語を区分したうえで、共起する述語(コロケーションの用例を意味素性別に分類して記載している。IPALハイパーテキスト化に際して、動詞辞書、形容詞辞書と名詞辞書との間に自動的にリンクを張る時、該当区分を決定するのにこのコロケーションの情報を参照する。この時、コロケーションの中に同一のものが複数個あるものがあると、リンク先が一意に定まらなくなる。そこで、最初に、名詞と述語のペアが慣用表現と重複するものを調べた結果、72例の慣用表現が重複するものであることがわかった。続いて、その72例と記載されている全てのコロケーション43,362例とを足して異なりを算出したところ、37,590であった。そして、重複するものが、延べで10,561、異なりで4,619もあることがわかった。つまり、2、3個重複するコロケーションが4,000以上もあるということである。本稿では、重複例を分析してわかった重複のパターンと重複の要因について述べる。
- 一般社団法人情報処理学会の論文
- 1996-09-04
著者
-
橋本 三奈子
情報処理振興事業協会(IPA) 技術センター
-
桑畑 和佳子
情報処理振興事業協会(ipa)技術センター:(現)富士通株式会社
-
桑畑 和佳子
情報処理振興事業協会
-
橋本 三奈子
情報処理振興事業協会(ipa)技術センター:(現)富士通株式会社
-
橋本 三奈子
情報処理振興事業協 技術セ
-
青山 文啓
桜美林大学
-
青山 文啓
桜美林大学:情報処理振興事業協会(ipa)技術センターwg委員主査
関連論文
- 名詞辞書における下位区分間の意味的関係の記述
- 名詞の比喩的表現とその統語的特徴
- 計算機用日本語基本形容詞辞書について
- 計算機用日本語形容詞辞書の試作
- 計算機用辞書における動詞の意味関係の記述
- 計算機用自然言語辞書実用化の諸問題
- IPAL名詞辞書による多義性解消のためのコロケーションの分析(並列処理)
- トップダウンなパターン解析に基づく情報抽出
- IPALハイパーテキスト化のためのコロケーションの多義性の分析
- 統合辞書における文型の記述
- 名詞の下位区分間に見られる意味的関係の辞書記述
- 名詞辞書におけるコロケーションの記述
- コーパスデータに基づく名詞コロケーションの辞書記述
- 計算機用日本語辞書の開発
- 計算機用日本語基本名詞辞書の概要
- 計算機用日本語基本名詞辞書における記述項目の構成
- 形容詞の3つの用法--終止,連体,連用
- 文書中の情報を整理する情報抽出技術 (特集 電子図書館を支える技術)
- 意味分類の言語学的構成法とWWW上のシソーラス構築
- 動詞・形容詞・名詞を統合する辞書の構築
- IPAにおけるテキストコーパスの作成
- 情報科学・工学,私はこう考える : 日本語処理,私はこう考える
- 統語情報に基づいた辞書の試み : IPALの場合
- 複文の解剖学(文型と意味)