二次記憶上の大規模語彙を用いる自然言語処理システム
スポンサーリンク
概要
- 論文の詳細を見る
文法規則と辞書とを分離した自然言語処理システムにおいては,扱う文の数や範囲が増カロするにつれて,文法規則と語乗双方とも増加する.このうち,文法規則は日本語の構文パターンに限りがあるので,ある程度のところで落ち着くが.語禁は無限に増加し,したがって辞脅の大きさは拡張を続けることになる.従来の自然言語処理システムにおいては,文法規則と辞書を主記憶上に置いて,構文を処理する手法をとっているものがほとんどであった.しかしながら,上記のように,語乗の増加に伴って主記憶上の辞書だけでは容易的に対処できなくなってきている.本論文では,辞書を主記憶と二次記憶の両方に作成し,大規模な語彙を用いることができるようにした構文解析システムについて述べる.文の中に頻出する動詞,助詞,助動詞などは主記憶上におき,語彙の中で多数を占める名詞は二次記憶上に常駐させてある.二次記憶上の辞書を効率的に検索するために辞書は順序ハシシュの形に展開されている.また,この辞書は,電子化された国語辞典の見出し語から自動的に抽出されたもので,約13万の語彙を有する.文法規則には計算機処理を想定して書かれた水谷文法を用いた.この文法を用いると,従来文法と比較して,構文解析木の数が少なくなり,後の意味処理の負担が軽減されることも示す.
- 一般社団法人情報処理学会の論文
- 1988-06-15
著者
-
井佐原 均
電子技術総合研究所
-
元吉 文男
産業技術総合研究所
-
元吉 文男
電子技術総合研究所
-
元吉 文男
電子技術総合研究所知能情報部
-
井佐原 均
電総研
-
井佐原 均
郵政省通信総合研究所関西先端研究センター知的機能研究室
-
井佐原 均
独立行政法人通信総合研究所
-
横山 晶一
電子技術総合研究所
-
井佐原 均
郵政省通信総合研究所
-
横山 晶一
電総研
関連論文
- 格情報を制約条件とした動詞階層化の試み
- 語音弁別の神経機構 : 失語症患者の研究から得られたもの
- 失語症例の音の分離能力(クリック音融合閾)と聴覚的言語理解の関係について
- 開発者の視点からの機械翻訳システムの技術的評価 : テストセットを用いた晶質評価法
- ユーザ定義述語を含む系の限量子消去法 (Computer Algebra : Design of Algorithms, Implementations and Applications)
- 論理式の置換と選言標準形への変形による論理プログラムの計算手続き
- 論理式の置換と選言標準形への変形による論理プログラムの計算手続き (テーマ:「予兆・チャンスの発見とその応用」および一般)
- 論理プログラムの新しい完備化と論理式の置換に基づく計算手続きについて
- 等号公理下での論理式の標準形とその一階言語への応用 (数式処理における理論と応用の研究)
- 論理プログラムの完備化と論理式の展開による証明手続きについて (プログラム変換と記号・数式処理)
- 代数知識のデータベース化の試み(数式処理と数学研究への応用)
- 遺伝的探索に基づく"虫"の進化(1) : ビジュアライズによる行動解析
- 名詞句「AのB」「AB」の用例を利用した換喩解析
- 文脈情報変換型機械翻訳システムCONTRAST : 解析・生成・知識表現
- 英語テキスト構造と冠詞現象
- テキストにおける首尾一貫性(coherence)と文脈表現構造
- 実験的な知識に基づく文脈表現構造からの英語テキスト生成
- 機械翻訳システムCONTRASTにおける文脈情報の利用
- LIPSシステムにおける記憶管理 (記憶階層)
- 将棋処理ソフトウェア「王将」について
- SOMを用いた日本語意味マップの自己組織化
- 日本語連体修飾要素の多義解消に関する語彙意味論的検討
- 意味ソートmsort : 意味的並べかえ手法による辞書の構築例とタグつきコーパスの作成例と情報提示システム例
- 文脈と対象世界モデルを利用した機械翻訳へ向けて (「機械翻訳」)
- 格助詞と格解釈 : 「で」の議論を中心に
- 助詞「から」の意味分類と判定法
- N進木拡張LINGOLのユ-ティリティ関数について
- 自然言語処理のためのプログラミングシステム--拡張LINGOLについて
- 最大エントロピーモデルに基づく形態素解析 : 未知語の問題の解決策
- 最大エントロピー法に基づくモデルを用いた日本語係り受け解析
- 文末から解析する統計的係り受け解析アルゴリズム
- MEによる日本語係り受け解析
- 話し言葉の接続詞「で」の特徴(自然言語)
- 演奏の表情を表す言葉が演奏に与える影響について (ことば工学研究会(第8回)テーマ:ことばの感性ははかれるか?どのように表現出来るか?)
- テキストコーパスの作成 : RWC, JEIDA, Orchid
- 科学技術振興調整費開放的融合研究推進制度 : (小特集:) : 大規模コーパスに基づく『話し言葉工学』の構築
- 語義の特異性を利用した慣用表現の自動抽出
- 片方向の共起性による述語型定型表現の自動抽出
- コーパスからの付属語的表現の自動抽出
- 疑似Nグラムを用いた助詞的定型表現の自動抽出
- コーパスからの関係表現の自動抽出
- JEIDA機械翻訳システム評価基準(品質評価編) : 英日翻訳の品質評価項目の検討と評価用コーパスの作成
- 語構成論に基づいたサ変動詞の分類
- 機械翻訳システム CONTRAST における概念表現
- Computerized Analysis of Syntactic and Semantic Information in Japanese Newspaper Articles
- 比較構造の概念表現について
- 文脈情報翻駅システムCONTRAST (自然言語理解)
- 未定義語を含む文の多段階構文解析
- Qualitative and Quantitative Characteristics of Japanese Sentences
- A Natural Language Processing System with a Large Vocabulary in Secondary Storage
- 日本語新聞記事解析における構文情報および意味情報の抽出法
- 二次記憶上の大規模語彙を用いる自然言語処理システム
- 文脈処理技術 (計算言語学)
- 品詞の並びに関するヒューリスティックスを用いた日本語同語反復表現の検出
- クラスタ例からの学習 : クラスタ属性の利用
- Puiseux展開プログラムの作成 (数式処理における理論と応用の研究)
- クラスタ例からの学習 : 分類対象集合全体の属性の利用
- 線形多項式方程式の解法プログラムの作成 (数式処理における理論と応用の研究)
- クラスタ例からの学習--クラスタに関する属性の利用
- Java による数式処理(数式処理における理論と応用の研究)
- クラスタ例からの学習--分類対象集合の全体に関わる特徴の利用
- 逐次代数拡大体の簡約表現(数式処理における理論と応用の研究)
- 高速多項式GCD計算法(数式処理における理論とその応用の研究)
- 5次方程式の可解性の高速判定法(数式処理における理論と応用の研究)
- 拡張述語言語ALLインタプリタの実現
- IREX :情報検索、情報抽出コンテスト
- 動詞共起情報を含む名詞辞書の獲得と利用
- 漸進的自然言語理解と概念階層
- 文末表現に着目した自由回答アンケートの分類
- 高速乗算システムの実現(数式処理における理論とその応用の研究)
- 位置情報と分野情報を用いた情報検索
- 最大エントロピーモデルと書き換え規則に基づく固有表現抽出
- 知的ニュースリーダが対象とする対話型ネットニュースの特徴
- 知的ニュースリーダにおける表層的話題関連性の抽出
- 重要文と要約の差異に基づく要約手法の調査
- 自動要約のための文重要度の比較
- An Approach to Abstract Generation
- 文脈理解のための拡張シソーラス知識表現法
- 1階述語言語の逐次漸近標準形について(数式処理と数学研究への応用)
- 巡回群をガロア群に持つ5次方程式の判別とその解法(数式処理と数学研究への応用)
- 数式二次元フロントエンドエディタ(数式処理と数学研究への応用)
- 一階述語インタプリタのアルゴリズム(数式処理と数学研究への応用)
- 数式処理と数学記号のあいまい性(数式処理と数学研究への応用)
- 数式処理の歴史と将来の展望 (数式処理)
- 国産数式処理システムGALにおけるパターンマッチング(数式処理と数学研究への応用)
- 根号による1のn乗根の解法(数式処理と数学研究への応用)
- INTERNAL REPRESENTATIONS OF FORMULAS IN JAPANESE COMPUTER ALGEBRA SYSTEM GAL(Formula Manipulation and Its Applications to Mathematical Study)
- ENVIRONMENT PROBLEMS IN FORMULA MANIPULATION SYSTEMS(Computer Algebra and its Applications to Mathematical Studies)
- Lisp マシン (高機能ワークステーション)
- 数式のグラフィックディスプレイによる出力(数式処理と数学研究への応用)
- 待遇表現の丁寧さの計算モデル
- 情報ハイウェイ時代のテキスト情報への知的アクセス ( 情報処理最前線)
- NLP2000-23 / NC2000-17 モジュール型ニューラルネットによる品詞の曖昧性解消
- NLP2000-23 / NC2000-17 モジュール型ニューラルネットによる品詞の曖昧性解消
- 国語辞典に基づくシソーラスの計算機処理
- シソーラス作成のための辞書関係語の抽出
- オブジェクト指向型概念辞書COOLにおける共起関係の表現
- 二か国語辞典における辞書記述項目の設計
- 上野晴樹, 石塚 満共編 :「知識の表現と利用」知識工学講座2, オーム社(1987.2)
- メル尺度を利用したホルマント抽出の一方法