日本語定型表現のパターン記述規則と効率的な照合アルゴリズム
スポンサーリンク
概要
- 論文の詳細を見る
日本語の定型表現は, 機械翻訳における正しい訳語の決定などに有用であり, その抽出や利用方法が研究されている. また, 重要語の決定, 文書校正, 文書検索などにも, より広い意味での定型表現が利用されており, 自然言語処理システムに対する定型表現の分析と統一的な利用方法の実現は必要不可欠である. 本論文では, 各応用分野で必要とされる定型表現を広くとらえて分析し, 多属性(表記, 品詞, 意味などの複数属性による指定), 分離("さほど〜ない"のように離れたパターンの指定), 排他("決して〜ない"の呼応関係で"ない"が欠落する場合の排他的パターンの指定)情報が記述できる規則を形式的に定義し, これら規則の効率的な照合アルゴリズムを提案する. 特に, 本手法では自然言語解析と照合エンジンの汎用性を維持するために, 定型表現に独自な情報を照合処理中に獲得する方式を提案する. また, 文書校正, 文短縮などの定型表現規則を構築し, 提案した規則記述の有効性を確認した. そして, 照合アルゴリズムは理論的解析と具体的照合実験により有効性を評価した. 特に, 1文当りの最大(平均)照合時間は, 約35〜340ms(約8〜76ms)となり, 実用的値となった.
- 社団法人電子情報通信学会の論文
- 1997-07-25
著者
関連論文
- 検索エンジンを利用した9ヶ国語作文支援ツール(ユビキタス・モバイル学習環境/一般)
- 複合語の分野連想語の効率的決定法
- 日本語定型表現のパターン記述規則と効率的な照合アルゴリズム
- 意味変化率を考慮した文書短縮方法
- 日本語定型表現の分析と効率的照合アルゴリズム
- 活用語を含む助詞的定型表現の分析
- ダブル配列におけるキー削除の効率化手法
- 探索木法とその応用 ( キー検索技法 3)
- 食品の履歴情報とブログ上の評判情報の統合検索システムの開発(セッション2:履歴,状況・行動推定II)
- 大規模文書データに対する用例文の効率的検索アルゴリズム
- 検索エンジンを用いた英作文支援ツール(新しいインターネット技術の教育環境への利用/一般)
- Google Web APIsを利用した英文作成支援ツール(遠隔教育/一般)
- コンテスト形式による初級Cプログラミングの演習支援
- 接頭辞ダブル配列における空間効率を低下させないキー削除法(情報検索)
- ダブル配列におけるキー削除の効率化手法
- ダブル配列における動的更新の効率化アルゴリズム
- 複合語生成規則を用いたキーワード導出手法
- ET2009-125 Web検索を利用した9ヶ国語作文支援の改良(障害者教育・特別支援教育/一般)
- 書き方を練習する日本語CAIシステム
- 検索エンジンを利用した多言語作文支援ツール (生涯学習につながる初等中等教育機関へのICT学習支援/その他--理科離れ、物作り離れを防ぐICT)
- 履歴情報とブログ情報を用いたワイン検索システムの開発(セッション5 ことば)
- E-035 係り受け関係を利用した一般新聞記事を子供向けに言い換える知識の抽出(E分野:自然言語・音声・音楽,一般論文)
- パターンマッチングマシンの効率的記憶検索法
- J-039 検索エンジンを利用した9ヶ国語作文支援の拡張(J分野:ヒューマンコミュニケーション&インタラクション,一般論文)
- 検索エンジンを利用した多言語作文支援(ユビキタス学習環境/一般)
- D-15-16 検索エンジンと複数の言語資源を活用した英作文支援ツール(D-15.教育工学,一般講演)
- 北研二・津田和彦・獅々堀正幹(著), 情報検索アルゴリズム ,共立出版, 212p., 3,300円(税別) ISBN4-320-12036-1
- 多属性項目の履歴情報に基づく電子メイル文書のフィルタリング手法
- 多属性項目の履歴情報に基づく電子メイル文書のフィルタリング手法
- 各個人のプロファイルを用いたメイル文書のフィルタリング手法
- 履歴情報を考慮したメイル文書のフィルタリング手法
- 行置換によるスパース行列の効率的縮小アルゴリズム
- 分野連想語を用いたパッセージ特定手法
- RD-002 重複レコードの多い大規模トライ辞書の圧縮(データベース,査読付き論文)
- 転置ファイルによる大規模 n-gram データの検索システム
- 転置ファイルによる大規模 n-gram データの検索システム
- パトリシアトライに対する簡潔な配列表現
- LD_008 ダブル配列におけるキャッシュの効率化(D分野:データベース)
- 2次記憶上のダブル配列の効率的検索法
- キーワードの遅延抽出を考慮した文書検索構造の効率的構成法
- トライ構造を用いた共起情報の効率的検索アルゴリズム
- 特徴ベクトルによる全文検索の一改善法
- 拡張ハッシュ法における部分文字列検索の設計と実現
- トライ構造を用いた共起情報の効率的検索アルゴリズム
- グラフ構造に対する効率的記憶検索法
- 文書レイアウトにおける自動図表配置手法
- 特徴ベクトルを用いた全文検索における高速化手法
- ストリングパターンマッチングマシンの文字列置換への拡張法
- ストリングパターンマッチングマシンの動的構成法
- 片仮名異表記の生成および統一手法
- ストリングパターンマッチングマシンにおける検索キー追加方法
- LRパーサを用いた文字列置換アルゴリズム
- 形態素置換による文書短縮法
- 階層化による2進ディジタル探索(BDS)木の改善
- 拡張ハッシュ法による検索技法の拡張 : 部分文字列検索と順検索への拡張
- 時間推移を考慮した単語の重要度決定手法
- 格構造解析における概念階層の効率的判定アルゴリズム
- キーワード抽出を用いた文書自動分類手法
- パトリシアトライ構造の効率的な圧縮アルゴリズム
- 知識表現モデルMERMにおける定量化の一表現法
- 食品の履歴情報とブログ上の評判情報の統合検索システムの開発(セッション2:履歴,状況・行動推定II)
- 2進木トライ構造の効率的な圧縮手法
- K_047 WWW言語資源を利用した英文作成支援ツール : ユーザの語彙レベルに基づく適応型用例提示(K分野:ヒューマンコミュニケーション&インタラクション)
- F-013 暦に基づく時間指示表現に対する意味表現形式(F.人工知能)
- 暦に基づく時間指示表現に対する意味表現形式の提案(意味表現・データマイニング)
- トライ構造による概念階層の高速判定アルゴリズム
- 階層化概念辞書の高速検索アルゴリズム
- D-4-10 Webマイニングのためのトピック主導型クローラの評価(D-4. データ工学,一般セッション)
- 連載講座「キー検索技法」の編集にあたって
- 大学で育成すべき自然言語処理技術者とは?
- 画像,音声,テキストに対するマルチデータ処理技術の統合化とその応用
- HTML形式の表構造に対する一索引化手法
- WWW空間上に存在する表構造の一索引化手法
- Web検索APIを用いた9ヶ国語作文支援ツール
- キーワード構成の分析とその応用
- 接続情報を加味した形態素辞書による形態素解析の高速化
- 定型表現を利用した効率的な形態素解析の実現
- LR(1)構文解析表の動的構成法
- 日本語時間表現の一解釈法
- 日本語文における時間表現の形式化手法
- 携帯電話情報サービスのための新聞記事要約の研究
- 新製品ニュース管理システムのための文と段落のタイプ抽出方法
- 4V-6 技術解説記事データベースのためのXML文書作成ツールの開発
- テキストベースの一提案
- 画像,音声,テキストに対するマルチデータ処理技術の統合化とその応用
- 自然言語インタフェースにおける間接発話文の意図理解法
- 類似用例文の効率的検索手法とその応用
- 二つのトライを用いた辞書検索アルゴリズム
- トライ構造における共通接尾辞の圧縮アルゴリズム
- 自然言語インタフェースにおける間接発話文の意図理解法
- 読みを付与するWeb読解支援システムを利用した授業支援の試み (ネットワークコンピューティングとこれからの教育・学習環境/一般)
- 小学生を対象とした新聞読解支援のための説明語抽出手法
- 小学生向けNIEを対象としたWeb新聞記事の推薦
- 読解支援における言語情報多重提示方式の試作(インタフェース技術と学習支援システム/一般)
- RN-002 ユーザの語彙力に適応した読みを付与するWeb読解支援システム(教育学習支援情報システム(1),N分野:教育・人文科学)
- N-005 調べ学習課題の自動生成に向けた学習課題の分析(コンピュータと教育,N分野:教育・人文科学)
- D-004 被災経験マイニングに向けたBlogフィルタリング(Web,D分野:データベース)
- D-001 テンプレートを用いたWebからの若者言葉の抽出手法の検討(Web,,D分野:データベース)
- D-003 料理レシピ群から代替・追加・省略可能な食材の抽出手法の検討(D分野:データベース)
- D-008 若者言葉の自動抽出に用いたテンプレート改良に関する検討(D分野:データベース)