文節数最小法を用いたべた書き日本語文の形態素解析
スポンサーリンク
概要
- 論文の詳細を見る
文節内における単語間の連接規則を記述した文法規則を用いるべた書き日本語文の形態素解析では, 日本語文としては不適当な解析を含む多くの解析結果が生じる. これらの解析結果から正しい解析を効率的に得る方法として, ヒューリスティックな情報が利用される. 従来, この手法としては最長一致法が用いられているが, 根拠が明らかでないうえに解析結果に尤度による優先順位をつけることができないという根本的な欠点がある. 本論文では, 解析結果の文節数によってその尤度を評価する文節数最小法を提案し, この手法に適した表方式の形態素解析アルゴリズムを与える. アルゴリズムの能率は, 最悪の場合に必要とするステップ数, メモリ数ともに入力文字列の長さnに対してO(n^2)である. また, 1,000文の入力文に対して解析実験を行い, 文節数最小法の有効性を確認した. その結果, 960文については文節数が最小となる解析に正解が存在し, 残り40文も一つ文節数が多い解析に正解が存在した. その他, 能率, 最初に出力される解析結果の誤り率, 尤度による順位付けの能力についても最長一致法と比較実験を行った. 最初に出力される解析結果の誤り率は, 文節数最小法で7.0%, 最長一致法で12.4%であり, このことも文節数最小法の有効性を十分示している.
- 一般社団法人情報処理学会の論文
- 1983-01-15
著者
-
吉田 将
九州芸術工科大学
-
吉田 将
九州工業大学情報工学部創設準備室
-
日高 達
九州大学工学部電子工学科
-
吉田 将
九州大学工学部
-
吉村 賢治
九州大学工学部電子工学科
-
吉村 賢治
福岡大学工学部電子情報工学科
-
吉田 将
九州工業大学
-
日高 達
九州大学工学部
-
吉村 賢治
福岡大学工学部電子工学科
関連論文
- シソーラスを用いた派生語の仮名漢字変換の特性(仮名漢字変換・形態素構文解析)
- 概念の連鎖反応モデル
- 文の解析と合成(その1)
- 共起関係データの今後の研究について
- 自然言語処理と概念の体系化について(3)
- 自然言語処理と概念の体系化について(2)
- 自然言語処理と概念の体系化について
- 集合指向言語 SOL の拡張とフローグラフのインターバル解析への応用
- 集合指向言語SOL のデータベースへの応用
- 集合指向言語SOLのデータベースへの応用 : SQLのホスト言語へのSOLの拡張
- 集合指向言語SOLとその言語処理系の開発
- 表層表現に基づく文章構造解析を利用した論文改訂支援システムの試作と評価
- 逐次変換方式による韓日翻訳ツールの試作
- 信念の翻意を考慮した確率信念システムによる対話モデル
- 表層表現に基づく文章構造解析による論文改訂支援システムの試作
- 場面の情感を考慮したBGMの自動生成システム
- 概念間の外見的な類似性と心理的な評価を利用した比喩表現の生成
- テンス・アスペクトを考慮した物語文章における事象間の時間関係の抽出
- テンス・アスペクトを考慮した物語文章における事象間の時間関係の抽出
- 概念間の情緒的類似性を考慮した比喩表現の生成
- 日本語文生成における親疎表現の取り扱いについて
- 日本語文生成における待遇表現の取り扱いについて
- 視点を考慮した文生成にむけて
- 語義文からの動詞間の上位-下位関係の抽出
- 三つ子の魂百まで : 学際的・複合的教育について
- 語義文における動詞間の上位-下位関係
- 語義文からの動詞の上位-下位関係の抽出
- 語義文における動詞間の上位-下位関係
- 確率文節文法とその応用
- ブラケット文法--句構造言語を特性化する文脈自由文法
- 辞書構築における諸問題 (計算言語学)
- 手書き漢字の識別実験
- 一括処理による手書き文字認識手法
- 語義文の表記的特徴に着目した形態素解析用辞書に関す基礎的考察
- 5. 自然言語処理から感性情報処理へ (九州発21世紀へのメッセージ)
- 語義文の機能表現について
- 国語辞典に基づくシソーラスと単語の意味分類に関する一考察
- 国語辞典に基づくシソーラスの構築に関する一考察
- 自然言語の機械処理について-概念の連結構造に関する基礎的考察-
- 日英機械翻訳のための述部処理システム
- 自然言語情報処理データ・ベース : 自然言語の標準化
- 日本語の機械処理--日本語文の標準形分解
- 名詞句「NのN」の解析におけるシソーラス知識の利用
- シソーラスと確率文法による派生語解析
- 用例に基づく派生語の確率的解析
- 用例に基づく派生語の確率的解析
- 機械翻訳システム開発における諸問題
- 1CD-Linuxを用いたグリッド環境の構築と検証
- パネル討論会 : 自然言語処理の現状と課題 : 第57年後期第25回全国大会報告
- Computer Science Unpluggedの教員免許更新講習での活用事例
- 日英専門用語の自動抽出
- 日本語科学技術文における専門用語の自動抽出システム
- 拡張B-treeと日本語単語辞書への応用
- 日本語処理のための機械辞書
- TSS環境におけるPascalの幾つかの教具
- 係り受け制約を含む文脈自由文法
- 係り受け制約を含む文脈自由文法
- 言語処理系の生成系MYLANGによるNBSG/PDプリコンパイラの試作
- ガーベッジコレクションを必要としない文字列処理機構
- 準最適テキスト圧縮符号
- 科学技術論文抄録における単語の統計的性質
- 英文テキスト圧縮についての一考究
- 要約文の話題の流れの最大化による自動要約
- 話題の流れを保持する自動要約(生成・要約)
- 確率文節文法による形態素解析実験について
- 単語の造語モデルを用いた単語の生起確率の推定
- 自然言語処理
- 機械翻訳のための構文解析手法 (機械翻訳)
- ブラケット文法
- 日本語確率文法とその解析アルゴリズム
- ブラケット文法の構文解析法
- ブラケット文法による句構造言語の特性化
- 文節数最小法を用いたべた書き日本語文の形態素解析
- 手書き文字認識におけるベクトルプロセッサの使用について
- マーク・カードを用いたFORTRANプログラムの処理
- ミニ・コンピュータを用いた初心者教育システム
- 日本語の構文分析--文節数最小法による文節分析アルゴリズムとその能率
- 日本語の構文分析--文節の統語規則と表方式に用いた文節構造分析アルゴリズム
- 静電式プリンタ/プロッタを用いた漢字出力システムについて
- 自然言語処理の必然性と課題 (自然言語処理への挑戦)
- 未登録語を含むべた書き日本語文の形態素解析への単語の造語モデルの利用
- 日本語における単語の造語モデルとその評価
- Prefix-Closed B-tree
- オブジェクト・プログラムの同系統上位計算機によるシミュレーション
- オブジェクトプログラムを同系統上位計算機でシミュレーションするためのプログラム
- 小型機によるFORTRANソースプログラムのエラーチェック
- 常識推論における推論の選択と文脈処理への応用
- 複合名詞の仮名漢字変換のための解析アルゴリズム
- シソーラスを利用した複合語の仮名漢字変換のための確率複合語文法
- 意味的結束性に基づく文脈処理
- 常識推論における推論の選択
- 操作の容易なオープン・カード入力システムの開発
- FORTRANベースによるコンピューター性能比較の試み
- 情報処理教育のためのプログラムファイル容量と出力量の時間解について
- フォートラン流のCAI用言語をもったCAIシステムの開発
- 情報処理教育のためのプログラムファイル容量の時間変動について
- 情報処理教育のためのプログラムファイル容量制御について
- 集団情報処理教育におけるプログラム用ファイル容量設定に関する一考察
- メモリ常駐形コンパイラーKITFORの開発 : CBEサポート・システムの開発
- 多端末入出力装置を用いた情報処理教育とシステムの待ち時間等について : 集団到着待ち行列の場合