コーパスを用いた既存のシソーラスの拡張及び再構成のための一手法
スポンサーリンク
概要
- 論文の詳細を見る
単語間の上位下位関係を記述したシソーラスは、用例に基づく翻訳や情報検索等に広く使用されているが、いくつかの問題に直面している。一つの問題は、シソーラスの分野依存性である。データのオンライン化に伴い、一般分野の大規模なシソーラスが利用可能になったが、単語の語彙や、関係は処理しようとするテキストの分野に強く依存する。つまり、いくら大規模なシソーラスでも、処理しようとする分野の単語を含んでいなければ意味をなさない。かといって、分野に依存するシソーラスをゼロから作るのは容易ではない。また、分野に応じて、単語間の関係は微妙に変化しえるが、このような関係を従来のシソーラスは扱うことが出来ない。本論文では、これらの問題点の解決のための試みとして、既存のシソーラスを、大規模コーパスから得られた統計データを用いて拡張する手法について述べる。
- 一般社団法人情報処理学会の論文
- 1994-09-20
著者
関連論文
- ウインターワークショップ2008・イン・道後開催報告
- Web 2.0アプリケーションにおける代表的な攻撃手法とその対策
- テキストマイニング・類似文書検索システムによるEBMに基づく診療ガイドライン作成支援の有効性
- Cloud Computingの世界[I] : Googleの分散処理技術
- 8.クラウドコンピューティングにおけるセキュリティとコンプライアンス(クラウドの技術課題,将来展望,クラウドコンピューティング)
- 機密情報の漏洩を防ぐための文書再利用検出技術
- Cloud Computingの世界[II.完] : GoogleとAmazonの分散処理技術を中心に
- Web2.0におけるセキュリティー--セキュアなWeb2.0環境構築のために (特集 Web2.0による企業イノベーション)
- SOAを支えるWebサービスの最新動向(「セマンティックWebサービス」)
- 7-a) ポストゲノム時代のテキストマイニングミドルウェア(企業におけるバイオNLPへの取り組み)(ポストゲノム時代に高まるバイオ自然言語処理への期待 : バイオ自然言語処理最新事情)
- 大規模生物医学文献データベースのテキストマイニング・ツール (テキストマイニング(Part2))
- ライフサイエンス向けテキストマイニングツールMedTAKMI(テキストマイニングの応用(2))
- ライフサイエンス分野におけるテキストマイニング技術適用の動向(テキストマイニングの応用(2))
- 文献データベースからの生医学インフォマティクス (創薬ゲノミクス・創薬プロテオミクス・創薬インフォマティクス) -- (創薬インフォマティクス)
- (第54回) なんでXMLなの?(てれび・さろん〜知らないわけではないけれど〜)
- XML[II] : XMLとデータベース
- 2 Web Servicesによる動的な電子商取引の実現 : SOAP/WSDL/UDDI (グローバルネットワーク社会を構築するXML)
- Semantic Web : 機械のためのWeb
- XMLあれこれ
- 賛助会員のページ
- メタデータ
- XMLがもたらす創造的ネットワーク : 動的な情報源と分散エージェント (「創造的ネットワーク化情報環境に向けて」)
- ウインターワークショップ2008・イン・道後開催報告
- クラウド・コンピューティング
- 第15回人工知能国際会議報告
- XMLの意義と最新動向(学術・情報分野のためのXML基礎)
- WWWに見るメタデータの標準化動向
- XMLとその周辺の標準化動向の概要
- Webサービス
- LE-7 柔軟なテキストマイニングミドルウエアの構築(E. 自然言語・文書)
- Webサービス合成のための振舞い記述のしくみ(「Semantic Webとその周辺」)
- 知識ベースを利用した機械翻訳システムShalt2 ( 自然言語処理の実動システム)
- 英日機械翻訳システムShalt2における並列句の取り扱い
- 英英辞典中の単語の意味素性と例文を使った文の多義性の解消
- セマンティックWebツールの現状(セマンティックWebと計算機科学)
- Webサービス : ―Webにおける柔軟で動的なビジネス基盤―
- 4V-3 XMLを用いたアプリケーションの構築法 : 旅程表作成システムを例に
- 4V-2 XMLを用いたアプリケーションの構築法 : Java Beansによるフレームワーク
- Example-Based Machine Translationの問題点に関する考察
- InfoBus Repeater : A Java-based Publish/Subscribe Middleware
- インターネットでの情報の記述と交換方式の最近の動向(「XML:インターネット上での情報の記述と交換」)
- 小特集「XML:インターネット上での情報の記述と交換」にあたって
- Java用Publish/SubscribeミドルウエアSecure Distributed Info Busの設計と実装
- Java用Publish/SubscribeミドルウェアSecure Distributed InfoBusにおける鍵配送プロトコル
- Xu, J. and Croft, W. B.: Query Expansion Using Local and Global Document Analysis, Proc. 19th Annual Int. ACM SIGIR Conf. on Research and Development in Information Retrieval, pp. 4-11 (1996).
- クラウド・コンピューティング : 動向と今後の展望(クラウドとアナリティクス)
- 文脈を考慮した自然言語文の入力
- Information Outlining : 検索情報の可視化 行政情報の活用のために
- ICHIGANセキュリティ-局面に応じたポリシーの切り替えを可能にするセキュリティアーキテクチャ
- 第1回 : 自然言語処理/情報検索編
- 招待講演:RDFとその周辺--XML時代のデータ記述 (『1999年情報学シンポジウム』プログラム--WWW情報検索・電子図書館・セキュリティ・著作権・マルチメディア情報流通・感性情報処理) -- (セッション7:情報管理技術)
- コーパスに基づくシソーラス : 統計情報を用いた既存のシソーラスへの未知語の配置
- 新聞記事の関連付けと可視化のための一手法
- TMI'95参加報告
- 文の多義性解消における置換可能関係を用いた事例の適用率向上
- コーパスを用いた既存のシソーラスの拡張及び再構成のための一手法
- 文の多義性解消における事例の適用率向上のための一手法
- 日本アイ・ビー・エム(株)東京基礎研究所自然言語処理グループ
- 対訳コーパスからのパラレルシソーラスの抽出
- 92-33 Roget のカテゴリを用いた, 大規模コーパスで訓練された統計モデルによる多義性の解消
- 制約と事例の協調による協調性の解消 : 評価実験および考察
- 92-22 意味的知識優先の自然言語処理