クラスタリング手法と既存のシソーラスとの組合せ手法
スポンサーリンク
概要
- 論文の詳細を見る
日本語文を理解するためには種々の知識が必要である。とりわけ、シソーラスは自然言語処理における最も重要な知識である。しかし、田中らが指摘しているように、既存のシソーラスには下位の部分で多種多様な連想関係が存在するため、そのまま自然言語処理に適応するには問題が多い。そこで、自然言語処理に使用できるシソーラスを体系だてて作成する方法が、種々提案されているが、すべてを人手で作成することは容易ではない。一方、国語辞典の語釈文や客観的なデータ(例えば、名詞と動詞の係り受けデータ)を用いて自動的に単語を分類する手法も提案されている。前者は普遍的なシソーラスの作成が期待できる。また、後者の手法はクラスタリング手法と呼ばれ、なんらかの意味的な近さを表す距離を用いて、通常階層的に分類する。しかし、このような距離を用いる場合、妥当な意味分類ができるように??闘値を定める必要があるため、原理的にはすべての単語に対して階層構造を作成することが可能であるが、シソーラスではなくむしろ意味素性を作成することが目的となる。そこで、筆者らは比較的作成が容易なシソーラスの上位は人手により作成したものあるいは既存のシソーラスを用い、人手により作成が困難と思われる下位のレベルはクラスタリング手法を用いて単語を自動的に階層分類することとした。本稿では、当研究所で構築している対話データベース(ADD)から抽出した係り受け関係を用いて名詞を自動的に分類し、そのクラスタリング結果を既存のシソーラスと組み合わせる方法を示す。また、作成したシソーラスについて検討する。
- 一般社団法人情報処理学会の論文
- 1991-02-25
著者
関連論文
- HMMと一般化LR構文解析を用いた実時間大語彙連続音声認識装置の実現
- ポーズ単位に基づく音声言語統合処理と発話状況管理の統合 : 音声対話システムの試作
- ATR音声言語翻訳実験システムASURA
- 音声対話における言語現象 (<小特集>音声によるコンピュータとの対話を目指して)
- 発話単位の分割または接合による言語処理単位への変換
- 日独音声言語翻訳実験システム
- 音声言語日英翻訳実験システム(SL-TRANS)の概要
- 仕事量基準を用いたコーパスからの定型表現の自動抽出
- 電話またはキーボードを介した対話に基づく対話データベースADDの構築
- 対話データベースを用いた各種言語現象の検索
- 係り受け関係データから見たキーボード会話と電話会話の比較
- 慣用表現を利用した形態素情報収集法
- 電話対話データベースの構築
- 連想型知識ベースの推論方式
- 言語データベース統合管理システムのデータ管理方式
- 単語の共起関係を定義した知識ベースの構成
- 形態素情報収集支援システム
- 言語データベース統合管理システムのマンマシンインタフェース
- 言語データベース作成のためのシミュレーション会話 : 会話データのリアリティ改善
- 言語データベース用単語間の関係データ
- 言語データベース統合管理システム
- 日英音声翻訳システム ATR MATRIX
- ATRの新音声言語データベース
- 音声翻訳実験システム(ASURA)のシステム構成と性能評価
- 発話タイプ付きコーパスを用いた確率的対話モデルの自動生成
- 確率・統計的手法による対話構造のモデル化
- 構文規則と前終端記号バイグラムを併用する対話音声認識手法の高速化と高性能化
- 構文規則と前終端記号バイグラムを併用する対話音声認識手法の高速化と高性能化
- 対話テキストの意味空間における分類
- 音声認識候補の正規化認識確率に関する考察
- 日本語音声対話における発話意図タイプの自動生成
- 発話状況の情報を音声認識に用いた音声対話システム
- 定型文末表現の自動抽出
- 統計的手法による談話構造解析
- マルチモーダル翻訳対話における発話とジェスチャの関連性
- クラスタリング手法と既存のシソーラスとの組合せ手法
- 対訳情報を用いた単語のクラスタリングに関する考察
- ATRにおけるマルチモーダル翻訳通信研究 : マルチモーダル・ユーザ・インターフェースの実装
- SL-TRANSにおける文節候補の削減 : 係り受け関係を用いた文節候補選択
- 係り受け関係を用いた文節候補選択についての一考察
- 英語と日本語のマルチモーダル会話と電話会話における言語的・非言語的差異
- 形態素情報付きコーパスの再構成手法
- 音声言語処理のための部分木併合手法
- 日本語会話文の言語解析実験
- 日本語会話文の言語解析実験
- 音声言語処理のための構文解析ツールキット
- LRパーザ制御によるOne-pass型連続音声認識アルゴリズム
- 対訳対話コーパス作成のためのキーボード会話収録システム
- HMM-LR音声認識の大語彙への適用
- 音声認識システムにおける確率文法の有効性
- 文節間の連鎖制約を取り入れたHMM-LRの音声認識実験
- 対話構造を考慮した次発話予測手法の検討
- 対話構造の定量的評価
- 対話のインタラクション構造と話題の認識
- 発話単位の分割または接合による言語処理単位への変換手法
- 部分木に基づく構文規則と前終端記号バイグラムを併用する対話音声認識手法
- 次発話予測による音声認識結果の再順序付け
- 部分木を単位とする構文規則と前終端記号のバイグラムを利用した連続音声認識
- 部分木を単位とする構文規則と前終端記号のバイグラムを利用した連続音声認識
- 部分木を単位とする構文規則を利用した連続音声認識の効果
- 対話におけるAssumptionの役割
- テキスト・データベースからの慣用表現の自動抽出
- 自然発話の言語現象と音声認識用日本語文法
- 音声翻訳システムASURAの開発