医療用語のコード化手法 : 部分文字列のテキスト近似被覆問題(専門用語)

スポンサーリンク

概要

論文の詳細を見る
本研究では, 大量の診療報酬請求書(レセプト)の審査業務を効率化することを目的として, レセプト記載文字列を統制用語にコード化する手法を提案した.文字認識結果をコード化するには, 元レセプトに存在する表記のゆらぎに加え, 誤字脱字の存在を前提としてコード化を行う必要がある.本研究ではこの問題を, 入力テキストを統制用語の部分文字列で適切に被覆する問題と考え, 動的計画法により最小コスト被覆を求める実験を行った.500枚(約18,000行)のサンプルで評価した結果, 正解テキストを用いた場合で84%, 文字認識後の誤読・不読データを用いた場合で65%のコード化率を達成し, 手法の有効性を確認した.
社団法人電子情報通信学会の論文
2005-07-16

著者

関連論文

もっと見る

スポンサーリンク