文分割における連用中止表現の扱い
スポンサーリンク
概要
- 論文の詳細を見る
マニュアル文書を対象とした日本文推敲支援システムの研究開発を進めている。これは文章中の推敲すべき表現(不適性表現)を検出するとともに、それに対する書換え候補を提示するシステムである。マニュアルに頻出する不適性表現の1つに長文があり、上記システムにおいては、形態素解析情報に基づく文分割機能の検討を進めている。従来の文分割方式では、基本的に(1)分割する文節(以下、分割点と呼ぶ)の接続形式と分割時に挿入する接続詞を一対一に対応させる、(2)分割点を終止形に変換する、という方式が多い。このとき連用中止表現や接続助詞「て」による接続(以下、本稿では両者を併せて連用中止表現と呼ぶ)は、通常並列接続として扱われるため、上記のような方式では「並列の接続詞の挿入(または接続詞なし)、分割点文節の終止形への書換え」という分割方法を採ると考えられる。しかし、連用中止表現はその前後に特定の意味関係(以下、連用中止表現の意味用法という)を担うことがあることが指摘されている。また実際にマニュアル文中の連用中止表現を収集した結果でも、単なる並列接続とみなし得ないものが比較的多く存在する[figure]1(1)。さらに連用中止表現は、述語に付加される付属表現(時制表現や様相表現)が省略された表現形式であるため、分割点文節を終止形に変換するという方法では有効な分割文候補を生成することができない場合がある[figure]1(2)(3)。本稿では、文分割の観点から連用中止表現の意味用法を整理するとともに、表現の形態的特徴と意味用法、分割時の接続詞、連用中止文節の形態素操作との関係に着目した連用中止表現を分割点とする文の分割方式について述べる。
- 一般社団法人情報処理学会の論文
- 1991-02-25
著者
関連論文
- 音声認識を用いたマルチメディアコンテンツのインデクシング
- 機械翻訳システムに対する利用者適応の分析 : 異文化コラボレーションを目指して(一般 : データマイニングI)
- D-14-11 音声認識結果の単語系列の言語的妥当性に基づく正誤判定(D-14. 音声・聴覚)
- グラフモデルの提案とテキスト検索システムへの適用による評価
- 2000-DBS-122-47 構造化文書をランキング可能な全文検索システム
- DE2000-69 構造化文書をランキング可能な全文検索システム
- 多言語分散情報検索アーキテクチャに関する検討
- 多言語分散情報検索アーキテクチャに関する検討
- SLP・NL合同セッション「ここまでできるぞ音声/言語処理技術」 : 言語編 : 5 クロスリンガルWWWサ-チエンジンTITAN
- 検索結果の再構成によるナビゲーション支援
- インターネット情報探索システムTITANとその可視化手法
- WWW 情報空間における Resource Discovery と Navigation 支援
- 日本文推破支援システムにおける書換え支援機能の実現方式
- 説明的テキストにおける文の連接関係の解析手法
- 大語彙連続音声認識を用いた音声・映像コンテンツのインデクシング
- 日本語文章読み上げ技術 : AUDIOTEX
- 形態素情報共起性による同形異義語認定方式の検討
- D-14-19 ニュースコンテンツにおける音響信号自動判別の検討
- F-4 概念ベクトルによるトピックセグメンテーションのニュース音声への適用(音声・音声言語情報処理,F.音声・音楽)
- 個人の意図を反映させたスケジュール調整法の考察
- モバイル環境に着目した分散個人情報管理方式
- 出会い支援コミュニケーションシステムの検討
- WWW上の検索サービスの技術動向
- 探索ロボットに基づくWWWサーチエンジン : TITANを中心に
- 技術文章向けの日本文推敲支援システムの実現と評価
- 92-39 自然言語テキストのロバストな処理
- 日本語受動文の能動化可否判定アルゴリズムの検討
- 接続構造解析に基づく日本語複文の分割
- 91-31 語彙的結合関係による構文多義の解消
- 文分割における連用中止表現の扱い
- 日本語受動文の能動化可否判定アルゴリズムの検討
- 日本語不適性表現の検出機構
- 89-9 テキストからの語彙知識の獲得
- 言語における話者の認識と多段翻訳方式
- 日英翻訳システムALT-J/Eにおける日本語解析技術
- 解析事例を用いた係り受け曖昧性の解消
- インターネットサーチエンジン