ロバストな日本語形態素解析 : 辞書依存性の低いハイブリッドアルゴリズムの提案
スポンサーリンク
概要
- 論文の詳細を見る
膠着言語である日本語は単語境界が自明でないため、さまざまなアプリケーションで文章を取り扱う際に、「単語」単位の操作が英語ほどには簡単でなかった。単語の選択・置換・検索といった基本的な操作を可能にし、また更に深い自然言語解析の第一歩とするために、われわれは極めてコンパクトな形態素解析コンポーネント、愛称"T-Hammer"を研究開発した。本稿では、共通コンポーネントとしての T-Hammerの概要、精度、および今後の課題について考察する。現在 T-HammerはWord 97, Encarta, Bookshelf, IISなどの製品に実装されている。
- 一般社団法人情報処理学会の論文
- 1997-03-12
著者
関連論文
- 日本語校正支援における同音語誤り検出 : 警告レベル分けの判定基準
- 日本語校正支援における同音語誤り検出 : 警告レベル分けの提案
- 日本語校正支援システムにおける校正知識 : 同音異義語について
- 誤文中の形態素出現確率を用いる校正支援
- 日本語入力のミスタイプにより発生する形態素連鎖の調査
- 日本語校正支援システムFleCSによる新聞記事校正
- 日本語校正支援システムFleCS : 新聞校正における実力診断
- 日本語校正支援システムFleCS : 校正規則の衝突について
- 日本語校正支援システムFleCS : 新聞社における実用化報告
- 日本語校正支援システムFleCS : 新聞用ルールの獲得と表現
- 4M-5 日本語文章校正ツール"Chanterelle" : 入力ミス及び表記揺らぎについて
- ロバストな日本語形態素解析 : 辞書依存性の低いハイブリッドアルゴリズムの提案
- 日本語校正支援システムFleCS : ミスタイプ検出について
- LOTOSによるCCRサービス定義の形式記述 : データ型部 : INTAP研究開発委貝会プロトコル形式記述WG
- LOTOSによるCCRサービス定義の形式記述 : プロセス部 : INTAP研究開発委員会プロトコル形式記述WG
- LOTOSによるCCRサービス定義の形式記述 : 全体報告 : INTAP研究開発委員会プロトコル形式記述WG
- Formal Approachによるプロトコル変換