日本語文章推敲支援ツール『推敲』における字面解析 : 助詞「は」に着目して
スポンサーリンク
概要
- 論文の詳細を見る
日本語文章推敲支援ツール『推敲』は、機械可読な形で存在する日本語文章を解析して推敲に役立つ情報を提供することを目的としたツールである。このツールの開発に当たって次の2つの方針を設けた。(1)文章中に問題となりそうな箇所があればそれを指摘できればよい。(実際に推敲するのは書き手である)(2)実用規模(1万字程度)の文章を待ち遠しくない時間で処理して欲しい。 日本語の文章は分かち書きされていない。そのため、日本語の文章を解析するには、まず辞書に基づいて形態素解析を行い、構文解析を行うのが普通である。しかし、辞書を使った文法処理を行うと、実用規模の文章では解析時間がかかりすぎて上記(2)の方針を満たさない。このため、我々は辞書を使わず文法処理も行わず字面だけで解析する方法を採ることにした。このために、『推敲』が指摘するものの中には誤りが含まれる。開発方針(1)から、『推敲』が指摘したものは書き手が一度は目を通すので、第一種の誤り「指摘に漏れがある」は犯してはならないけれど、第二種の誤り「指摘すべきでないものまで指摘してしまう」はある程度許容できる。字面だけの解析で第一種の誤りを犯さずに開発方針を満たす程度の精度が得られれば、『推敲』で採用する解析手法としては十分である。すでに、我々は指示詞(「これ、それ、あれ」など)、受身などの助動詞「れる、られる」、接続助詞「が」、否定表現の抽出を上記の条件を満たす形で実現することに成功した。指示詞の抽出は単に文字列照合のみであるけれども、受身の抽出、接続助詞「が」、否定表現の抽出のアルゴリズムは機械可読な日本語文章約100万字を実際に調査して構築した。ここでは、推敲作業を支援する情報の一つとして助詞「は」に注目することにした。
- 一般社団法人情報処理学会の論文
- 1989-10-16
著者
関連論文
- (48) 情報系専門学科のカリキュラムのアイデンティティと評価方法(第4セッション 教育評価方法)
- 情報処理専門教育について 理工系情報専門学科におけるコアカリキュラムについて
- Tenderにおける資源「演算」の扱い
- 異なるスケジューラの共存制御法
- 異なるスケジュール法の共存制御法
- 日本語文章推敲支援ツール『推敲』におけるとりたて詞「は」の抽出法とその評価
- 日本語文章推敲支援ツール「推敲」における否定表現の抽出法
- ソフトウェアの解析と評価ツール(ソフトウェアツール 2 : 製造・評価・保守)
- 超高速ネットワークの目指すもの : 未来開拓プロジェクト「高度マルチメディア応用システム構築のための先進的ネットワークアーキテクチャの研究」総括
- 縦インデックス付きマジックセット法を用いた層状化データベースにおける否定質問と閉質問との効率的処理
- 演繹データベースにおける再帰質問のボトムアップ処理のためのプログラム変換手法
- 補足マジックセット法における否定の効率的処理
- 石油化学プラント危険箇所検索への演繹データベース手法の応用
- オブジェクト指向プログラムのテスト法に関する一考察
- 順序列テスト基準を用いたテスト充分性評価システムの試作
- 日本語文章推敲支援ツールのプロトタイピング
- 日本語文章推敲支援ツール
- 述語と格助詞を手がかりにした文構造の解析および推敲支援への応用
- 形態素解析を援用した字面解析手法による否定表現の抽出と評価
- プロセス走行時におけるプログラムの部分入替え法
- 定義使用グラフの拡張
- 電子メールを用いた日本語文による質問応答システムにおける類似質問の抽出について
- 2文字間の連接を利用した仮名漢字変換用辞書
- 卒業論文・学位論文に索引を付けさせる(「情報技術の新時代に向けて」)
- 一極集中と学会活動
- 半導体ディスク装置導入による性能改善の定量的評価
- C並行処理プログラムのためのテストケース生成系について
- オブジェクト指向プログラムのテストのためのモデルについて
- テストによって同期・通信誤りを発見するための並行処理プログラムのモデルに関する一考察
- 並行処理プログラムにおけるテストケースの定義と生成ツールの試作
- 並行処理プログラムのためのテスト支援ツールに関する一考察
- タスク型を含んだ並行処理プログラムのテスト法について
- 並行処理プログラムのテストケース作成ツールについて
- Adaプログラム分離コンパイル支援ツールADAMAKE
- 日本語文章推敲支援ツール『推敲』における字面解析 : 助詞「は」に着目して
- 順序列テスト基準に基づく並行処理プログラムのテスト充分性評価
- C並行処理プログラムのテスト充分性評価システムのソケットへの対応
- C並行処理プログラムのテスト充分性評価システムの試作
- 日本語文章推敲支援ツール「推敲」と文書処理システムとの結合方式に対する検討
- プログラム従属性理論に基づく並行処理ソフトウェアの統合的開発支援環境の構築
- プログラム従属性理論に基づく並行処理ソフトウェアの統合的開発支援環境の構築
- SR並行プログラムにおける依存関係についての考察
- プログラム依存表現に基づく統合的ソフトウェア開発支援環境について
- 並行プログラムのためのプロセス依存ネット生成ツール
- Ada並列処理プログラムのためのタスク依存ネット生成ツール
- TSS環境におけるプログラム実行演示システムの作成とその検討
- 構造をもった言語に対する会話的プロセッサ
- 情報処理専門教育について 大学等における情報系専門教育の改善への提言
- メタレベル計算を用いた協調処理の実現
- メタオブジェクトを用いた分散問題解決プログラムの分離記述
- プログラム依存グラフ可視化ツールの開発
- 推論関係型データベース管理システムにおけるプロダクションシステム構築支援機構の設計
- SNOBOL4 既存処理系への日本語テキスト処理機能の追加
- 日本語テキスト処理機能を追加したSNOBOL 4
- 実行回数計数機能を追加したSNOBOL4処理系とその移し換えについて
- N1方式大学間ネットワークを経由したソフトウェア移し換えの試み
- 並行処理プログラムの安全性破壊に対する順序列テスト基準の信頼性に関する一考察
- 安全性の破壊に対する順序列テスト基準の信頼性評価
- Cプログラムのためのプロセス間通信に基づくテスト基準について : 並行処理プログラムにおけるセマフォテスト基準
- OSの改版による性能の変化とその評価について
- TSS計算機システムの性能解析・評価システムとその適用例
- COBOLプログラム輪郭作成システムの移し換えについて
- FORTRAN プログラム動的解析システムの移し換えについて
- 76-02 FORTRANプログラムの動的解析システムとプリコンパイラ
- 計算の手間の評価とプログラムの動的解析システム (計算の手間とデータ構造)
- ネットワークを利用した無記名投票システムの開発
- OS動作の可視化機能
- OS動作の可視化機能
- Tenderにおける資源「時計」の実現
- Tenderにおける資源管理方式
- 複雑な表を生成するための表生成系について
- 浮動小数点数の総和の計算法の比較 (計算の手間と能率化)
- MIMD型並列計算機HYPHEN C-16における性能評価用プログラミングシステム
- DOループに関するコンパイル技法のテスト
- 日本語文章推敲支援ツール『推敲』における助詞「が」の抽出について
- 字面解析による助詞「が」の抽出
- 日本語文章推敲支援ツール『推敲』における助詞「が」の抽出について
- 字面解析手法を用いた否定表現抽出法の評価 : 朝日新聞記事データへの適用
- 日本語文章推敲支援ツール『推敲』における連用中止法の抽出について
- 相関論理Rcにおける強相関性原理について
- 相関論理への時間演算子の導入について
- 日本語文章推敲支援ツール『推敲』のパソコン上での実用化
- ハードウェアの特徴を活かしつつ移植性のよい応用ソフトウェアを開発するための一方法 : 日本語文章推敲支援ツール『推敲』の移植経験から
- 入れ子構造を許す言語処理で用いる名前表の一構成法とその解析
- 日本語文章推敲支援ツールにおける受身形の抽出法
- 分散環境における静的な処理分散法の実現と評価
- 日本語文における並列構造の簡便な推定法および推敲支援への適用
- 双方向学習支援システムMICE
- 文章推敲における並列構造の指摘
- 計算機マニュアルの分かりやすさの定量的評価方法
- 注釈付き論理プログラミングへの含意の入れ子表現の導入について
- Annotated Logic Programmingにおける矛盾の処理について
- 並行処理プログラムにおける共有変数のデータフローテスト基準
- 並行プログラムにおける広域データフローテスト基準の拡張
- 並行プログラムにおける広域データフローを用いたテスト基準の提案
- 並行プログラムからその拡張ペトリネットモデルへの変換
- PostScriptのフォント定義機能を用いた漢字の出力実験
- Fortranプログラム実行モニター : 数学的ソフトウエア作成支援ツール (数学的ソフトウェアの評価)
- 手続き間情報の解析と整理のツールAUDIEについて
- 命題帰結論理C_mと名辞帰結論理C_nの代数的モデル