タグ無しコーパスからの複合語データの自動抽出
スポンサーリンク
概要
- 論文の詳細を見る
日本語処理における複合語の解析は、困難な問題であることが従来より指摘されている。これは、複合語は単語を組合せることで無限に生成でき、すべてを辞書に登録することは不可能であるため、十分な解析精度を得ることかできないからである。複合語の数の多さを解決する方法として、複合語を構成する単語を概念に置換し、その概念間の共起情報 (複合語概念対) を用いて複合語を解析する方法かいくつか提案されている。複合語解析において、木構造を成す概念情報を利用する場合、下位の階層を用いた方が細かな意味の違いを解析に反映できる。しかし実際には、大量の複合語概念対の獲得は困難なため、解析時には上位の階層の概念情報しか利用できない。高精度の複合語解析の実現には、下位の階層の概念までを含む大量の複合語概念対を獲得する必要がある。本稿では、タグ付きコーパスから抽出した複合語概念対を利用して、タグ無しコーパスから複合語概念対を自動抽出する方法を提案する。
- 一般社団法人情報処理学会の論文
- 1997-03-12
著者
-
鈴木 克志
三菱電機(株)パーソナル情報機器開発研究所
-
相川 勇之
三菱電機(株)情報技術総合研究所
-
鈴木 克志
三菱電機株式会社 情報技術総合研究所
-
細田 春美
三菱電機(株) 情報技術総合研究所
-
相川 勇之
三菱電機(株)
関連論文
- 技術文書標題からのキーワード抽出
- 概念抽出型テキストマイニングによるアンケート分析手法の提案
- D-5-2 CRM 向けテキストマイニング方式の提案
- eCRM向け概念抽出型テキストマイニング
- D-37 大規模検索システムにおける概念辞書自動更新(辞書・シソーラス,D.データベース)
- 言語事例推論を用いたネットワーク障害対応ガイダンス
- 1N-1 ヘルプデスク支援システムにおける用語獲得
- 2U-1 ヘルプデスク支援システムにおける言語事例データの類似検索
- コーパスからの同義語の獲得(2) : スパース性への対処
- コーパスからの同義語の獲得(1) : 近傍単語頻度統計によるアプローチ
- 対話型ヘルプデスク支援システムにお1ナる事例べース構築
- 自然言語事例ベース検索の設計支援への適用
- 自然言語事例ベースの仕様書文解析の評価
- eCRM向け概念抽出型テキストマイニング
- 言語事例推論を用いたネットワーク障害対応ガイダンス
- ヘルプデスク支援システムにおける問題解決機能
- 1P-4 ヘルプデスク支援システムにおける言語事例検索 : 全体構成
- 1P-3 ヘルプデスク支援システムにおける言語事例検索 : 類似文照合
- 4M-2 ヘルプデスク事例活用のための言語分析方式
- D-13-8 適合性フィードバックに基づいた文書チェックルール作成支援方式(D-13.知能ソフトウェア工学,一般講演)
- D-5-6 意味構造抽出のための係り受け解析に関する考察(D-5.言語理解とコミュニケーション,一般講演)
- 木・表構造間写像モデルに基づくXML入力画面自動生成方式(コンテンツ処理)
- 段落内共起情報を利用した文書自動分類方式
- 企業間文書情報共有におけるSGML文書内容検証方式
- WWWブラウザによるXML文書入力方式について
- 全文検索システムにおける文字成分表の作成手法
- 全文検索における例文検索
- カタカナ異表記を考慮したユーザ辞書システムの拡張
- 専門用語辞書からの情報抽出と翻訳支援への適用
- 日英機械翻訳における数量表現処理の拡張
- 「韻」に基づく並列句の解析
- 実用性の向上を目指した機械翻訳システムの改良(2)
- 漢字に関する異表記の調査
- 日英機械翻訳システムMELTRAN-J/Eにおける空間的機能名詞の処理
- 日英機械翻訳システムにおける長文の解析
- E-35 XML入力画面自動生成方式(自然言語処理応用,E.自然言語・文書)
- 電子申請におけるXML文書内容検証方式
- 次世代WebビジョンSemantic Webの技術動向
- 電子申請におけるXML文書内容検証方式 : 複数XML文書の内容間制約を記述する文書規約記述言語DRDL
- XML文書ワークフロー構築支援方式 : インターネットを用いた設計支援システムにおけるXML文書設計支援方式
- D-9-12 XML文書ワークフロー構築支援方式
- XMLによる電子申請書のメタ情報の表現について
- XMLスタイルシート作成ツールとワークフローへの応用
- 5P-2 企業間XML文書交換における文書規約の表現と利用について
- 5P-1 SGML文書のWWW入力・表示プログラム作成ツール
- XML文書のスタイルシート生成方式
- 4V-8 SGML文書の表組みレイアウト作成支援方式
- HTMLによるXML文書の入力方式について
- WWWブラウザによるSGML文書入力方式について
- 社内文書のSGMLによる標準化とイントラネットによる活用
- SGML文書の内容検証方式の検討
- リンク情報を利用したインターネット情報検索方式の検討
- MSLRパーザにおける未定義語処理の一検討
- B-6-42 ファクシミリ信号のIP伝送に関する一検討(B-6.ネットワークシステム,一般講演)
- B-6-9 VoIP音声多重伝送システムにおける冗長伝送に関する一検討(B-6.ネットワークシステム,一般講演)
- B-6-61 VoIP音声多重伝送システムの開発(2) : パケット多重方式(B-6.ネットワークシステム,一般講演)
- B-6-60 VoIP音声多重伝送システムの開発(1) : システム構成と多重制御(B-6.ネットワークシステム,一般講演)
- カタカナ異表記処理
- CYK法構文解析の一検討 : quick parsingについて
- データベースとProlog (プログラミング言語 Prolog)
- D-5-7 情報検索のタスク評価手法に関する一考察(D-5. 言語理解とコミュニケーション)
- インターネット情報監視システムの試作
- 既存紙文書からSGML文書への変換システムの試作
- 4N-4 アンケート自由記述のテキストマイニングに関する検討
- 共起情報を利用した新聞記事の自動分類結果の分析・評価
- 共起情報を利用した文書の自動分類
- 共起情報を利用した文書の自動分類について
- 文字成分表型全文検索システムのSGML文書検索への拡張
- D-5-1 インタネット全文検索と関連文書検索を用いたポータル構築支援
- ネットワーク上の文書テキスト検索・利用技術 (特集 IT時代のヒューマンインタフェース技術)
- 統計情報とコスト最小法に基づいた形態素解析
- タグ無しコーパスからの複合語データの自動抽出
- 自然言語事例ベースの仕様書文解析への応用
- E-16 単語共起照合に基づくクレーム抽出方式の改良(情報抽出,E.自然言語・文書)
- 製品情報広域検索システムにおけるデータベース自動構築方式
- 製品情報広域検索システムにおける検索方式
- MSLRパーザにおける未定義語処理の一方式