日本語文書校正支援システムCRITACのテキスト・コンパイラ
スポンサーリンク
概要
- 論文の詳細を見る
ワードプロセッサ等により作成された計算機上の日本語文書の校正は、最近になって多数の研究が報告されはじめた分野であり、今後の知的ワードプロセッサあるいはオフィス・システムにとり最も重要な機能であるといえる。これらの研究には対話的校正処理を中心とした校正環境の実現と、いわゆるWriter's Workbenchのような各種の文書解析ツールの実現とが含まれる。前者の例としては、EPISTLEシステムのように、実時間の文章解析モジュールと高機能のエディタ(日本語の場合はワードプロセッサ・ソフトウェア)とを結合したものとなり、後者は目的に応じた解析を実行し、結果をファイルに出力するプログラム群からなる。校正処理を文書作成者の立場から考えると、タイプミス、誤変換等の局所的で自明な誤りはできるだけ文書の作成時に検出されることが望ましく、将来的には仮名漢字変換等の文書入力インターフェイスを改良してこれらを扱うことが予想される。これに反して、文書のスタイルに関するものは、文書入力のリズムを乱すことや、チェックに要するオーバーヘッドを考慮すると、一旦文書作成が済んだ後で一括して処理するほうが好ましい。特に、あるパラグラフ中の文の数が多いとか、同種の語尾が固まって現れるといった大域的な警告をうけても、文書作成者は、かなり前後の文脈を把握してからでないと校正が容易ではない。従って、文書校正処理は、入力時検出と作成時一括検出の2段階で行うのが最適であると判断される。本報告では、この2段階の文書校正を可能とするために、対話型の文書校正支機システムとテキスト・コンパイラという構成を提案する。テキスト・コンパイラとは、与えられた文書を入力として、校正メッセージと構造化文書を出力するソフトウェア・ツールであり、プログラムのコンパイラが、入力となるプログラムから、エラー・メッセージとオプジェクト・コードを出力することのアナロジにより、このように呼んでいる。我々は対話型の文書校正支援システムCRITACを既に試作しており、テキスト・コンパイラはCRITACの文書処理ツールを共有する形で開発中である。以後テキスト・コンパイラをBCRITAC(Batch CRITAC)と呼ぶ。
- 一般社団法人情報処理学会の論文
- 1986-10-01
著者
-
藤崎 哲之助
日本アイ・ビー・エム(株)東京サイエンティフィック・センター
-
武田 浩一
日本アイ・ビー・エム(株)東京基礎研究所
-
鈴木 恵美子
日本アイ・ビー・エム(株)東京基礎研究所
-
藤崎 哲之助
日本アイ・ピー・エム(株)東京基礎研究所
-
武田 浩一
日本アイ・ビー・エム(株) 東京基礎研究所
関連論文
- テキストマイニング・類似文書検索システムによるEBMに基づく診療ガイドライン作成支援の有効性
- データベース照会システム「ヤチマタ」と名詞句データ模型
- 大規模生物医学文献データベースのテキストマイニング・ツール (テキストマイニング(Part2))
- ライフサイエンス向けテキストマイニングツールMedTAKMI(テキストマイニングの応用(2))
- ライフサイエンス分野におけるテキストマイニング技術適用の動向(テキストマイニングの応用(2))
- 文献データベースからの生医学インフォマティクス (創薬ゲノミクス・創薬プロテオミクス・創薬インフォマティクス) -- (創薬インフォマティクス)
- XMLがもたらす創造的ネットワーク : 動的な情報源と分散エージェント (「創造的ネットワーク化情報環境に向けて」)
- テキスト分析のためのOLAPシステム(情報融合)
- UIMA : 非構造情報処理アーキテクチャ(研究のツールボックス 第6回)
- パターンベース翻訳システムPalmTreeの文脈処理
- SLP・NL合同セッション「ここまでできるぞ音声/言語処理技術」 : 言語編 : 6 パターンベース英日翻訳システムPalmTree
- パターンベース翻訳システム : PalmTree
- 日本語文書校正支援システムの設計と評価
- 統計的手法による漢字複合語の自動分割
- 日本語文書校正支援システムCRITACのテキスト・コンパイラ
- 構造化文書上における校正・推こう手法の検討
- マイニング技術を活用した定量的な診療プロセス分析への挑戦
- 企業における集合知の活用事例「InnovationJam」--全世界のIBM社員、家族、そしてお客様が一体となったオンライン・ディスカッション (特集 Web2.0による企業イノベーション)
- 4.ビジネス・インテリジェンスと人工知能技術(人工知能技術と産業応用)
- S1-6 e-メールのテキストマイニング(特別セッション(S1) : テキストマイニング)(第30回日本行動計量学会大会発表一覧)
- e-メールのテキストマイニング(テキストマイニング)
- サイト・アウトライニング : インターネットからの情報収集と可視化技術
- 海外におけるナレッジマネジメントの実践(「ナレッジマネジメントとその支援技術」)
- テキストマイニングのための情報抽出
- テキストマイニングのための情報抽出
- テキスト情報の可視化を利用した情報検索(「ビジュアルな情報検索」編集にあたって)
- 特集「ビジュアルな情報検索」編集にあたって
- 大量のテキストからの知識マイニング
- 4N-5 知識管理のためのテキストマイニング
- 漢字複合語の確率的構造解析
- テキストマイニング--非構造データからの知見抽出技術
- 知識ベースを利用した機械翻訳システムShalt2 ( 自然言語処理の実動システム)
- 英日機械翻訳システムShalt2の日本語生成文法
- 英日機械翻訳システムShalt2における並列句の取り扱い
- 日本語構文解析における曖昧さの解消について
- 特集「ディジタル図書館」の編集にあたって
- 日本語によるデータベース照会(日本語情報処理)
- 計算機の日本語理解--デ-タベ-ス照会システム「ヤチマタ」
- インターネットでの情報の記述と交換方式の最近の動向(「XML:インターネット上での情報の記述と交換」)
- Watson--クイズ番組に挑戦する質問応答システム
- JSIAIワークステーション(1) : 設計方針と概要
- 日本語における「と」の役割について
- 「ことだま」文書処理システムの文節わかち書き仮名漢字変換
- 異種データに対する統合的情報検索
- 2012年度喜安記念業績賞紹介:知識の蓄積による問題解決に向けた新たな試み