医療用語のコード化手法 : 部分文字列のテキスト近似被覆問題(専門用語)
スポンサーリンク
概要
- 論文の詳細を見る
本研究では, 大量の診療報酬請求書(レセプト)の審査業務を効率化することを目的として, レセプト記載文字列を統制用語にコード化する手法を提案した.文字認識結果をコード化するには, 元レセプトに存在する表記のゆらぎに加え, 誤字脱字の存在を前提としてコード化を行う必要がある.本研究ではこの問題を, 入力テキストを統制用語の部分文字列で適切に被覆する問題と考え, 動的計画法により最小コスト被覆を求める実験を行った.500枚(約18,000行)のサンプルで評価した結果, 正解テキストを用いた場合で84%, 文字認識後の誤読・不読データを用いた場合で65%のコード化率を達成し, 手法の有効性を確認した.
- 社団法人電子情報通信学会の論文
- 2005-07-16
著者
-
関 峰伸
(株)日立製作所中央研究所
-
関 峰伸
株式会社日立製作所中央研究所
-
藤尾 正和
(株)日立製作所 中央研究所
-
藤尾 正和
(株)日立製作所中央研究所
-
永崎 健
(株)日立製作所中央研究所
-
丹羽 芳樹
(株)日立製作所中央研究所
-
久光 徹
(株)日立製作所中央研究所
-
永崎 健
株式会社日立製作所中央研究所
-
永崎 健
(株)日立製作所 中央研究所
-
関 峰伸
(株)日立製作所 中央研究所
関連論文
- 距離に基づく確信度を利用した文字識別手法(一般セッション(2))(ITS・監視・セキュリティのためのパターン認識・メディア理解)
- 臨床研究を支援する症例検索システムの開発
- 医療用語のコード化手法 : 部分文字列のテキスト近似被覆問題(専門用語)
- 96 テンプレート入力方式の読影レポート作成システムの開発と試用(医療情報管理 RIS・情報支援)
- 対話的文書検索における文書クラスタリングの役割
- OCR誤認識後処理の効率化 : 補単語抽出方法と動詞活用処理を中心に
- 形態素解析プログラムANIMAの設計と評価
- 情報検索支援のためのシソーラス管理システムの提案
- 星座認識による帳票識別方式
- 対話的文書検索における文書クラスタリングの役割
- 一般語との曖昧性を持つタンパク質名の自動検出(情報抽出・単語分類)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- 一般語との曖昧性を持つタンパク質名の自動検出(情報抽出・単語分類)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- 文書画像の輪郭演算によるスタンプ検知手法(テーマセッション,文字・文書の認識・理解)
- 2P-3 タームのrepresentativenessを測るための新指標
- タームのrepresentativenessを測る
- 勾配特徴量のモーメントを用いた文字正規化法(テーマセッション6,複合現実感のためのパターン認識・理解)
- 文書テンプレート再現のためのPDF文書構造化(膨大なデータから学ぶもの)
- 文書テンプレート再現のためのPDF文書構造化(テーマ,膨大なデータから学ぶもの)
- I_047 文書構造要約化による情報提供システム(I分野:画像認識・メディア理解)
- 帳票読取りにおける印字ずれデータと読取り枠の対応付け方式(テーマセッション,文字認識・文書理解)
- 帳票読取りにおける印字ずれデータと読取り枠の対応付け方式(テーマセッション,文字認識・文書理解)
- 医療用語のコード化手法 : 部分文字列のテキスト近似被覆問題(専門用語)
- 4D-3 レイアウト解析による書誌情報の抽出(画像処理・認識(2),一般セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 統計情報と文法制約を統合した統語解析手法
- 係り受け情報を利用したパーザの効率化とロバスト解析への応用
- 連想に基づく情報アクセス技術 : 汎用連想計算エンジンGETAを用いて(最新情報検索技術)
- あいまい検索の技術と応用 (特集 インターネット検索技術と日本語研究)
- TD-1-6 DualNAVIによる連想的テキストアクセス
- 組み合わせ的確率モデルに基づく特徴単語選択方法 : 超幾何分布の応用
- 類似例の存在を否定的な要因として用いる重要バイグラムの収集支援方法
- 書き換え規則と文脈情報を用いた形態素解析後処理
- 書き換え規則と文脈情報を用いた形態素解析後処理
- 統計量とルールを組み合わせて有用な括弧表現を抽出する手法
- WWWホームページからの共起語自動抽出実験
- 括弧表現から統計量を用いて有用情報を抽出する手法
- 辞書と共起情報を用いた新聞記事からの人名獲得
- 動的な共起解析を用いた対話的文書検索支援
- 10.言語および図表データからの生物知識情報の抽出 (「ゲノム情報」)
- 回帰的遷移ネットワークを用いた文字経路探索方式の開発(テーマセッション,文字・文書の認識・理解)
- 適応型画像ベクトル照合に基づく金券識別(テーマセッション,文字認識・文書理解)
- 適応型画像ベクトル照合に基づく金券識別(テーマセッション,文字認識・文書理解)
- 言語情報を利用したオンライン枠なし手書き日本語文認識(スポーツ・運動映像のパターン認識・理解)
- I-027 多重仮説検定を用いた割書・振り分け行に対応した文字行抽出方式(I.画像認識・メディア理解)
- OCRの文字切出し誤りを許容した文書検索システムの開発(文字とドキュメントの認識・理解)
- OCRの文字切出し誤りを許容した文書検索システムの開発(文字とドキュメントの認識・理解)
- D-12-36 印刷活字帳票における低品質文字列読取手法
- D-7-7 遺伝子診断支援システムにおける診断支援知識検索方式(D-7. MEとバイオサイバネティックスA)
- 星座認識による帳票識別方式
- 星座認識による帳票識別方式
- H-012 仮説検証型アプローチを用いた定義レス帳票認識技術(H分野:画像認識・メディア理解,一般論文)
- 7-b) 連想統合による医学・生物学知識の活用ソリューション(企業におけるバイオNLPへの取り組み)(ポストゲノム時代に高まるバイオ自然言語処理への期待 : バイオ自然言語処理最新事情)
- 語の共起確率に基づく係り受け解析とその評価
- コーパスからの日本語従属節係り受け選好情報の抽出およびその評価
- 統計的手法を用いた係り受け解析
- キーワードを利用した帳票識別のための辞書自動作成
- キーワードを利用した帳票識別のための辞書自動作成
- キーワードを利用した帳票識別のための辞書自動作成
- 編集にあたって(ゲノム情報科学 : 観測技術の進展を支えるインフォマティクス)
- 編集にあたって(使いやすくなった自然言語処理のフリーソフト : 知っておきたいツールの中身)
- 条件付き確率最大法を利用した日本語形態素解析
- 編集にあたって(テキスト自動要約 : 知的活動支援の基本技術として)
- 文書走査を用いた複合名詞解析
- 文書走査を用いた複合名詞解析について
- 日本語形態素解析における効率的な動詞活用処理
- 日本語形態素解析における効率的な動詞活用処理
- 接続コスト最小法による日本語形態素解析
- 漢字仮名混じり文形態素解析における非サ変動詞の分割単位設定について
- 正規化協調型の文字線曲率特徴抽出方法と活字文字認識への適用(テーマセッション,文字・文書の認識と理解)
- 単語ベクトルを用いた多義語の意味推定 : 共起ベクトルと定義距離ベクトルの比較
- 動的な共起解析を用いた対話的文書検索支援
- 文書テンプレート再現のためのPDF文書構造化
- 文書テンプレート再現のためのPDF文書構造化
- RD-002 多重仮説文書構造ネットワークを用いたデータ抽出方式の開発(D分野:データベース)