日本語文章推敲支援ツール『推敲』におけるとりたて詞「は」の抽出法とその評価
スポンサーリンク
概要
- 論文の詳細を見る
日本語文章推敲支援ツール[推敲]は日本語文章を字面だけで解析し,推敲に役立つ情報を書き手に提供することを目的としてわれわれが開発したツールである.[推敲]には現在,受身,接続助詞「が」,指示詞「これ,それ,…」,とりたて詞(副助詞,係助詞の一部),否定表現などの候補を指摘する機能がある.文章中でそれらを使用していれば,「推敲」がそれを指摘し,書き手に推敲する手がかりを提供する.本論文では,とりたて詞「は」について,それを指摘する意義と,それを抽出する字面解析手法の構築およびその評価に関して述べている.とりたて詞「は」とは副助詞,係助詞「は」のことである.このとりたて詞「は」が文章中に現れる際に文が読み難くなる場合がある.そのために,文章を推敲する際にとりたて詞「は」に注意を払うことは有用である.「推敲」でとりたて詞「は」を指摘するために,字面解析でそれを抽出する方法を構築した.構築するに当たっては,日本語文章約70万字を実際に調査し,その結果を参考とした.さらに,別の文章に適用して評価を行った.構築した抽出法は文字についての簡単な条件をいくつか適用するだけの形になっている.これは,「指摘した候補を書き手が必ず吟味する」を「敲」の開発方針としているために,「とりたて詞でない「は」も候補の中に含まれてしまう」という誤りをある程度許しているからである.実際に構築した抽出法でとりたて詞「は」の候補を抽出すると,候補の中にいくつかのとりたて詞でない表現も含まれる.しかし,抽出精度(実際のとりたて詞の件数/総指摘件数)は,98%以上である.『推敲』で字面解析を採用したのは「実用規模の文章を待ち遠しくない時間で処理して欲しい」ためである.パソコン(PC-9801)上に実現した「推敲」で処理時間を測定すると,実用規模(1万字)の文章からすべてのとりたて詞「は」の候補を1秒以内で抽出できる.さらにこの抽出法は,解析対象の文章を一度しか走査しないので,検索時間は文章の長さに比例する.
- 1991-11-15
著者
関連論文
- (48) 情報系専門学科のカリキュラムのアイデンティティと評価方法(第4セッション 教育評価方法)
- 情報処理専門教育について 理工系情報専門学科におけるコアカリキュラムについて
- Tenderにおける資源「演算」の扱い
- 異なるスケジューラの共存制御法
- 異なるスケジュール法の共存制御法
- 日本語文章推敲支援ツール『推敲』におけるとりたて詞「は」の抽出法とその評価
- 日本語文章推敲支援ツール「推敲」における否定表現の抽出法
- ソフトウェアの解析と評価ツール(ソフトウェアツール 2 : 製造・評価・保守)
- 超高速ネットワークの目指すもの : 未来開拓プロジェクト「高度マルチメディア応用システム構築のための先進的ネットワークアーキテクチャの研究」総括
- 縦インデックス付きマジックセット法を用いた層状化データベースにおける否定質問と閉質問との効率的処理
- 演繹データベースにおける再帰質問のボトムアップ処理のためのプログラム変換手法
- 補足マジックセット法における否定の効率的処理
- 石油化学プラント危険箇所検索への演繹データベース手法の応用
- オブジェクト指向プログラムのテスト法に関する一考察
- 順序列テスト基準を用いたテスト充分性評価システムの試作
- 日本語文章推敲支援ツールのプロトタイピング
- 日本語文章推敲支援ツール
- 述語と格助詞を手がかりにした文構造の解析および推敲支援への応用
- 形態素解析を援用した字面解析手法による否定表現の抽出と評価
- プロセス走行時におけるプログラムの部分入替え法
- 定義使用グラフの拡張
- 電子メールを用いた日本語文による質問応答システムにおける類似質問の抽出について
- 2文字間の連接を利用した仮名漢字変換用辞書
- 卒業論文・学位論文に索引を付けさせる(「情報技術の新時代に向けて」)
- 一極集中と学会活動
- 半導体ディスク装置導入による性能改善の定量的評価
- C並行処理プログラムのためのテストケース生成系について
- オブジェクト指向プログラムのテストのためのモデルについて
- テストによって同期・通信誤りを発見するための並行処理プログラムのモデルに関する一考察
- 並行処理プログラムにおけるテストケースの定義と生成ツールの試作
- 並行処理プログラムのためのテスト支援ツールに関する一考察
- タスク型を含んだ並行処理プログラムのテスト法について
- 並行処理プログラムのテストケース作成ツールについて
- Adaプログラム分離コンパイル支援ツールADAMAKE
- 日本語文章推敲支援ツール『推敲』における字面解析 : 助詞「は」に着目して
- 順序列テスト基準に基づく並行処理プログラムのテスト充分性評価
- C並行処理プログラムのテスト充分性評価システムのソケットへの対応
- C並行処理プログラムのテスト充分性評価システムの試作
- 日本語文章推敲支援ツール「推敲」と文書処理システムとの結合方式に対する検討
- プログラム従属性理論に基づく並行処理ソフトウェアの統合的開発支援環境の構築
- プログラム従属性理論に基づく並行処理ソフトウェアの統合的開発支援環境の構築
- SR並行プログラムにおける依存関係についての考察
- プログラム依存表現に基づく統合的ソフトウェア開発支援環境について
- 並行プログラムのためのプロセス依存ネット生成ツール
- Ada並列処理プログラムのためのタスク依存ネット生成ツール
- TSS環境におけるプログラム実行演示システムの作成とその検討
- 構造をもった言語に対する会話的プロセッサ
- 情報処理専門教育について 大学等における情報系専門教育の改善への提言
- メタレベル計算を用いた協調処理の実現
- メタオブジェクトを用いた分散問題解決プログラムの分離記述
- プログラム依存グラフ可視化ツールの開発
- 推論関係型データベース管理システムにおけるプロダクションシステム構築支援機構の設計
- SNOBOL4 既存処理系への日本語テキスト処理機能の追加
- 日本語テキスト処理機能を追加したSNOBOL 4
- 実行回数計数機能を追加したSNOBOL4処理系とその移し換えについて
- N1方式大学間ネットワークを経由したソフトウェア移し換えの試み
- 並行処理プログラムの安全性破壊に対する順序列テスト基準の信頼性に関する一考察
- 安全性の破壊に対する順序列テスト基準の信頼性評価
- Cプログラムのためのプロセス間通信に基づくテスト基準について : 並行処理プログラムにおけるセマフォテスト基準
- OSの改版による性能の変化とその評価について
- TSS計算機システムの性能解析・評価システムとその適用例
- COBOLプログラム輪郭作成システムの移し換えについて
- FORTRAN プログラム動的解析システムの移し換えについて
- 76-02 FORTRANプログラムの動的解析システムとプリコンパイラ
- 計算の手間の評価とプログラムの動的解析システム (計算の手間とデータ構造)
- ネットワークを利用した無記名投票システムの開発
- OS動作の可視化機能
- OS動作の可視化機能
- Tenderにおける資源「時計」の実現
- Tenderにおける資源管理方式
- 複雑な表を生成するための表生成系について
- 浮動小数点数の総和の計算法の比較 (計算の手間と能率化)
- MIMD型並列計算機HYPHEN C-16における性能評価用プログラミングシステム
- DOループに関するコンパイル技法のテスト
- 日本語文章推敲支援ツール『推敲』における助詞「が」の抽出について
- 字面解析による助詞「が」の抽出
- 日本語文章推敲支援ツール『推敲』における助詞「が」の抽出について
- 字面解析手法を用いた否定表現抽出法の評価 : 朝日新聞記事データへの適用
- 日本語文章推敲支援ツール『推敲』における連用中止法の抽出について
- 相関論理Rcにおける強相関性原理について
- 相関論理への時間演算子の導入について
- 日本語文章推敲支援ツール『推敲』のパソコン上での実用化
- ハードウェアの特徴を活かしつつ移植性のよい応用ソフトウェアを開発するための一方法 : 日本語文章推敲支援ツール『推敲』の移植経験から
- 入れ子構造を許す言語処理で用いる名前表の一構成法とその解析
- 日本語文章推敲支援ツールにおける受身形の抽出法
- 分散環境における静的な処理分散法の実現と評価
- 日本語文における並列構造の簡便な推定法および推敲支援への適用
- 双方向学習支援システムMICE
- 文章推敲における並列構造の指摘
- 計算機マニュアルの分かりやすさの定量的評価方法
- 注釈付き論理プログラミングへの含意の入れ子表現の導入について
- Annotated Logic Programmingにおける矛盾の処理について
- 並行処理プログラムにおける共有変数のデータフローテスト基準
- 並行プログラムにおける広域データフローテスト基準の拡張
- 並行プログラムにおける広域データフローを用いたテスト基準の提案
- 並行プログラムからその拡張ペトリネットモデルへの変換
- PostScriptのフォント定義機能を用いた漢字の出力実験
- Fortranプログラム実行モニター : 数学的ソフトウエア作成支援ツール (数学的ソフトウェアの評価)
- 手続き間情報の解析と整理のツールAUDIEについて
- 命題帰結論理C_mと名辞帰結論理C_nの代数的モデル