英語形態素解析用辞書のコンパクト化
スポンサーリンク
概要
- 論文の詳細を見る
一般的に,自然言語処理に用いられる単語辞書は十万語にのぼるような大規模なものが多く,一単語が持つ形態素情報,構文情報等のデータも,細かく表現されている反面,複雑化し,扱いにくいものとなっている事が多くみられる。しかし,実際においては,そのような大規模辞書をそのまま利用する事は少なく,システムに必要な情報のみを取り出したシステム用辞書を作り出し,辞書コストの低減を図っている事が多い。本稿では,英語を入力文とし,品詞の推定等を行う形態素解析処理において,そのシステムの特徴を生かし,名詞類を品詞として持つ単語を辞書より削除することによる辞書のコンパクト化の実現方法,および,そのコンパクト辞書を用いて英語形態素解析(Emor)を行った実験結果,今後の課題を述べる。
- 一般社団法人情報処理学会の論文
- 1990-09-04
著者
-
川崎 正博
富士通研究所
-
松井 くにお
富士通研
-
松井 くにお
富士通研究所
-
西野 文人
富士通研究所
-
西野 文人
富士通研
-
西野 文人
富士通研究開発中心
-
西野 文人
(株)富士通研究所 コンピュータシステム研究所 ドキュメント処理研究部
関連論文
- 日本語情報検索システム評価用テストコレクション BMIR-J2
- Webアノテーション技術を用いたコンテクストによる情報整理方式の提案(セッション情報の構造化/整理)
- インターネットにおける情報利用の現状と期待 : 電子協アンケートの結果から
- 連想検索における属性語の抽出方式
- 連想ナビゲーション
- 情報検索システム評価用ベンチマークVer.1.0(BMIR-J1)について (メディア統合および環境統合のための高機能データベースシステム、および一般)
- 10.イノベーションを生み出す鍵がここにある : ソフトウェアジャパン2007からのメッセージ(ITフォーラムへの誘い)
- ナレッジマネジメントツール:ビジネス情報ナビゲーター (特集:ユビキタス) -- (ユビキタスを支える技術)
- セマンティックWebにおけるメタデータとその活用(セマンティックWeb)
- ソーシャルな情報再構成による情報共有システムの提案
- スケジュール情報からのインフォーマルコミュニティ抽出(セッション1: コミュニティー支援・コミュニケーション支援)
- スケジュール情報からのインフォーマルコミュニティ抽出(セッション1: コミュニティー支援・コミュニケーション支援)
- トップダウンなパターン解析に基づく情報抽出
- 文書中の情報を整理する情報抽出技術 (特集 電子図書館を支える技術)
- 検索ログからの話題抽出に向けて : サイト種別の自動判定の試み (情報処理学会 情報学基礎研究会(FI) 第69回 発表論文)
- 検索ログからの話題抽出に向けて : サイト種別の自動判定の試み
- FACOM 6365文書読取装置
- テキスト分類のためのカテゴリ割り付け戦略
- 5. 文字認識における自然言語処理 ( 自然言語処理技術の応用)
- 知識資産活用のための情報抽出 (2000年情報学シンポジウム--ネットワーク型情報メディアの活用と情報を活かす新技術) -- (セッション5:情報検索・情報抽出)
- 新聞記事からの用語集作成のためのテキスト分析
- 新聞記事からの人物・企業情報の抽出
- 新聞記事からの人物・企業情報の抽出
- 文書検索による概況調査支援システム (特集 Webコンピューティング) -- (ミドルウェアとコアテクノロジ)
- 2P-4 専門用語集を検索インタフェースとする文書群アクセス
- 日本語テキスト分類における特徴素抽出
- 擬似文字認識による文字認識後処理実験環境
- 英語形態素解析用辞書のコンパクト化
- 英語形態素解析Emorにおける品詞推定
- 未登録語テンプレートを用いた日本語形態素解析
- 日本語校正支援システム(Joyner)の研究について(4) : 正解語辞書作成
- 日本語校正支援システム(Joyner)の研究について(3) : 正解語探索
- 日本語校正支援システム(Joyner)の研究について(2) : 誤用候補展開処理
- 日本語校正支援システム(Joyner)の研究について(1) : 綴り誤り自動訂正について
- インスタントコミュニティ生成支援に関する一考察(オフィスインフォメーションシステム、Webシステム及び一般)
- 日本語文書リーダ後処理の実現と評価
- 日本語文書リーダ後処理における未登録語処理
- 1.ITフォーラムへの誘い(ITフォーラムへの誘い)
- 学会の集合知(これからの情報処理学会-第13回-)
- ナレッジマネジメントにおけるテキストマイニング(ナレッジマネジメント)
- ナレッジマネジメントの新展開(ナレッジマネジメント)
- ナレッジマネジメント : ナレッジマネジメントの新展開
- 自然言語処理技術の高度化はいかにして組織の競争力を生み出すのか(自然言語処理の高度化による知的生産性の向上)
- 初期質問文から蓄積された質問応答への効果的マッチング法
- 単純質問文から蓄積された質問応答文へのナビゲーション
- 校正支援システムJoyner における表記誤りの訂正方式
- 文書認識における言語情報の活用(2) : 認識誤りの自動訂正と指摘について
- 文書認識における言語情報の活用(1) : 概要
- カスタマーセンター支援システム
- 多国語間自動翻訳システム (科学万博-つくば′85特集号)
- WorkWare : WEBを用いた文書の時間順整理の試み
- WoekWare : WEBを用いた文書の時間順整理の試み
- 知的情報検索システムIRISにおける固有名詞抽出用形態素解析
- 知的情報検索システムIRISにおける構文意味解析部のデバッグ環境
- 知的情報検索システムIRISにおける等位接続解析方法について
- Linked Dataの企業での活用について
- SGMLを利用した情報共有とナビゲーションII : ナビゲーション
- SGMLを利用した情報共有とナビゲーションI : 情報共有
- 全文検索システムによるXML文書の検索 (INFOSTAシンポジウム'99)
- 高速テキスト検索エンジン
- Linked Data : つながるデータ,広がるサービス
- 知識の横断検索I-Scover