漢字仮名混じり文形態素解析における非サ変動詞の分割単位設定について
スポンサーリンク
概要
- 論文の詳細を見る
漢字仮名混じり文の形態素解析については,従来数多くの研究があるが,分割単位の設定自体を自然言語処理の観点から考察した例はまれである.本論文では,「同一の語根から派生した自動詞/他動詞の扱い」と「活用形の扱い」の2点に焦点を絞り,非サ変動詞の活用形と助動詞活用形の複合部の,形態素解析における分割単位について考察する.従来第1の問題は考慮されておらず,第2の問題についても,自然言語処理の立場から,複数の手法を明示的に比較した例はない.第1の問題に関しては,上記のような動詞の語幹を,語根と自動詞化接辞,または,他動詞化接辞に分割する分割単位を提案する.新たな分割単位が,意味解析への入力として妥当であることを示すため,語根へ適切な意味表記を行えば,もとの動詞の必須補語の個数や,それらの意味役割が計算できることを述べる.語根と,上記の接辞を分割単位とすることは,自動詞/他動詞の派生対が数多く存在する日本語の処理において,きわめて有意義である.第2の問題に関しては,動詞語幹の末尾の子音を屈折接辞側へ付加することにより,構文解析に貢献しない分割を避け,しかも活用形処理にかかわる辞書見出しの数を最小にできることを示した.分割単位の間の接続を表明するための接続コード体系もあわせて示す.
- 一般社団法人情報処理学会の論文
- 1991-02-15
著者
関連論文
- ソフトウェア科学会第3回大会
- ゆう度付き形態素解析用の汎用アルゴリズムとそれを利用したうゆう度基準の比較
- 医療用語のコード化手法 : 部分文字列のテキスト近似被覆問題(専門用語)
- 96 テンプレート入力方式の読影レポート作成システムの開発と試用(医療情報管理 RIS・情報支援)
- 対話的文書検索における文書クラスタリングの役割
- OCR誤認識後処理の効率化 : 補単語抽出方法と動詞活用処理を中心に
- 形態素解析プログラムANIMAの設計と評価
- 対話的文書検索における文書クラスタリングの役割
- 一般語との曖昧性を持つタンパク質名の自動検出(情報抽出・単語分類)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- 一般語との曖昧性を持つタンパク質名の自動検出(情報抽出・単語分類)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- 「論理と自然言語」特集号を編集するにあたって
- 2P-3 タームのrepresentativenessを測るための新指標
- タームのrepresentativenessを測る
- 医療用語のコード化手法 : 部分文字列のテキスト近似被覆問題(専門用語)
- TD-1-6 DualNAVIによる連想的テキストアクセス
- 組み合わせ的確率モデルに基づく特徴単語選択方法 : 超幾何分布の応用
- 類似例の存在を否定的な要因として用いる重要バイグラムの収集支援方法
- 書き換え規則と文脈情報を用いた形態素解析後処理
- 書き換え規則と文脈情報を用いた形態素解析後処理
- 統計量とルールを組み合わせて有用な括弧表現を抽出する手法
- 括弧表現から統計量を用いて有用情報を抽出する手法
- 辞書と共起情報を用いた新聞記事からの人名獲得
- 7-b) 連想統合による医学・生物学知識の活用ソリューション(企業におけるバイオNLPへの取り組み)(ポストゲノム時代に高まるバイオ自然言語処理への期待 : バイオ自然言語処理最新事情)
- 編集にあたって(ゲノム情報科学 : 観測技術の進展を支えるインフォマティクス)
- 編集にあたって(使いやすくなった自然言語処理のフリーソフト : 知っておきたいツールの中身)
- 条件付き確率最大法を利用した日本語形態素解析
- 編集にあたって(テキスト自動要約 : 知的活動支援の基本技術として)
- 文書走査を用いた複合名詞解析
- 文書走査を用いた複合名詞解析について
- 日本語形態素解析における効率的な動詞活用処理
- 日本語形態素解析における効率的な動詞活用処理
- 接続コスト最小法による日本語形態素解析
- 漢字仮名混じり文形態素解析における非サ変動詞の分割単位設定について
- 単語ベクトルを用いた多義語の意味推定 : 共起ベクトルと定義距離ベクトルの比較
- 知識表現と自然言語理解 (「知識表現入門」〔第4回〕)
- 自然言語理解の基礎 : 意味論と語用論 (自然言語理解)
- ロジック・プログラミングと計算言語学 (計算言語学)
- 特集「計算言語学」の編集にあたって