<原著> Bayesian Spam Filterを用いた要約の自動分類の試み
スポンサーリンク
概要
- 論文の詳細を見る
"保健医療分野では,病名や検査データのように構造化されたデータ以外に,インシデントレポート,放射線読影レポート,退院時サマリなど,構造を持たないテキストデータを扱うことが多い.これらのテキストデータを有効に活用するには何らかの方法でコード化して保存や検索を容易にする必要がある.しかしながら,日常の診療において日々大量に発生するテキストデータを人手によって分類し,コード化する作業は容易なことではない.そのような場合,機械学習の分野で培われてきたテキスト分類技術を利用して,分類作業の自動化を行うことに期待が集まる. 本研究では,迷惑メール(Spam)のフィルタとして考案されたBayesian Spam Filterを医学テキストの自動分類に適用し,その可用性を検討した.Bayesian Spam Filterは,Bayes 理論に基づき,分類済みのコーパスからテキストを構成する単語と分類カテゴリの関連性の度合いを学習し,未知のテキストを分類する技術である.医学テキストとしてPubMedからキーワードを指定して収集したabstractを用いた.Bayesian Spam Filterには当初Grahamによって考案され,その後,Robinsonによって改良が加えられたモデルを利用した.予備実験として,これらのモデルが使うパラメタの最適値を求め,それらを用いて各モデルの分類性能を調べた. その結果,最大でRecallが96.0%,Precisionが92.9%という分類性能を得た.これは,Bayesian Spam Filterの本来の目的であるSpamの分類成績には遠く及ばないものの,改善次第では十分に実用に耐えられる成績である.同時に,Robinsonの改良モデルにΧ^2による特徴選択を適用することにより,分類性能が向上することを明らかにした."
著者
関連論文
- Moodleを利用した国家試験対策サイトの構築と運用状況
- 遠隔講義の現状と川崎医療福祉大学のとりくみ
- 情報通信技術(IT)を活用した教育支援システムの開発研究
- Bayesian Spam Filterを用いた要約の自動分類の試み
- 心拍変動のゆらぎ解析II
- 生体リズムにおけるフラクタルと1/f ゆらぎ
- 元気な高齢者の独り暮らし応援システム(マルチメディア・情報ネットワークと医療)
- 遺伝的アルゴリズムによる臨床検査技師日当直勤務割当て問題の解法
- ビジュアライゼーション技法によるパケットフィルタリングの設計 : 保健医療分野におけるネットワークセキュリティの考察
- 病名の電子的交換についての一提案
- 施設間での医療情報の交換と共有を実現するための用語の標準化に対する一提案
- Web技術を用いた電子診療情報システムの構築に関する研究
- UMLSを利用した医学テキストの概念検索
- 医学用語のUMLSへのマッピングの試み
- DICOM画像からJPEG画像への変換による画像の長期保存
- 病診連携支援システムの評価
- 医療機関連携支援システムの開発
- Kawasaki Journal of Medical Welfare のホームページ化について
- 電子カルテの要素技術としてのID Lookup System
- 心拍変動のゆらぎ解析I
- 12a-F-3 複素対数写像の分岐とカオス
- 28a-B-12 複素力学系の臨界現象 II
- 28a-B-11 複素力学系の臨界現象 I
- 複素力学系 Z$_{n+1}$ = 1nZ$_n$+C の分岐とスケーリング則(力学系理論における幾何と解析)
- 12a-F-4 複素力学系Z_=InZ_n+Cの臨界現象
- 複素対数写像Zn+1 = lnZn +Cのスケーリング則
- 在宅高齢者の行動パターン解析システムの構築
- 心拍変動の1/f 解析
- 独居老人の行動パタン解析
- 在宅高齢者の就寝中における心電図の長期・無意識的計測と統計的解析 III
- 在宅高齢者の就寝中における心電図の長期・無意識的計測と統計的解析2
- 在宅高齢者の就寝中における心電図の長期・無意識的計測と統計的解析1