統計的手法による辞書未登録語の獲得法
スポンサーリンク
概要
- 論文の詳細を見る
統計的手法により辞書に未登録な語をテキストデータから獲得する手法を提案する.近年, WWWやネットニュースなどのテキストデータを処理する機会が増えている.ところが日本語の場合分かち書きの習慣がないため, まず形態素解析を行わなければならない.このときの問題に未知語の問題がある.ここでは, 多量のテキストデータから得られる統計情報のみを用いて分かち書きを行い辞書未登録語を獲得する方法について述べる.本手法は, 任意の文字列の頻度を正規化する過程, 得られた正規化頻度を用いて語の境界を決定する過程よりなる.評価実験では形態素解辞書の漢字未登録語の獲得能力を調べた.その結果約43%の辞書未登録語の獲得ができることが確認され, 本手法の有効性が示された.
- 1998-02-25
著者
関連論文
- 聖教書誌情報全文検索システムのスタンドアロン化の試み
- 生活習慣病予防教室における効果傾向抽出のためのデータマイニングシステム
- SPP授業「天体までの距離と年齢の推定」での教材開発
- 思考展開図を用いたSQL文の可視化手法(第17回(2009年度)年次大会(研究報告会&総会))
- 日本語情報検索システム評価用テストコレクションの構築
- 日本語情報検索システム評価用テストコレクション BMIR-J2
- 大規模クラスタリング結果のグラフによるインタラクティブな可視化手法(データ可視化,データ工学論文)
- 発現量データを用いた相関係数によるタンパク質の複合的な相互作用の推定
- 黒毛和種肥育牛の枝肉形質バイオマーカーの探索I : 大規模プロテオーム解析情報と血統・枝肉形質情報の統合情報管理システムの構築
- 5ZJ-7 大規模なクラスタリング結果に対する探検型可視化システムの構築(バイオ情報学,学生セッション,コンピュータと人間社会)
- 5ZJ-4 判別分析を用いた形質への影響たんぱく質を発見するデータマイニング手法(バイオ情報学,学生セッション,コンピュータと人間社会)
- 2T-3 ブランド牛(飛騨牛)の繁殖農家のための種雄牛選択支援システム(データマイニング,学生セッション,データベースとメディア)
- 植物の育種・栽培試験のためのデータ分析支援システム
- 大規模クラスタリング結果のグラフによるインタラクティブな可視化手法
- インターネットを利用した遠隔健康管理システムの試み(第14回(2006年度)年次大会(研究報告会&総会))
- 携帯電話を用いた糖尿病看護支援システム(セッション7: 社会システム・教育支援システム)
- イネのトランスポゾンディスプレイ解析のためのデータベースシステム
- 統計的手法による辞書未登録語の獲得法
- 古典籍書誌情報におけるキーワード抽出手法(創立20周年記念 第16回(2008年度)年次大会(研究報告会&総会))
- 人文研究を支援するデータベースシステム : 聖教検索および系図表示(第15回(2007年度)年次大会(研究報告会&総会))
- 仏典データベースのための画像処理について
- 仏典画像閲覧のためのデータベースシステムの構築(第13回(2005年度)研究報告会講演論文集)
- 平安・鎌倉時代を対象とした僧侶データベースシステム : 概要とその後の展開
- 平安・鎌倉時代を対象とした僧侶データベースシステム
- マウスによる仮想折り紙の対話的操作のための計算モデルとインタフェース(コンピュータグラフィックス,インタラクションの理解とデザイン)
- 聖教書誌情報全文検索システムのスタンドアロン化の試み
- 神経心理学検査法による痴呆症診断システムの試作
- 条件付き確率及び統計的指標を用いた発現量データからの組合せ的なタンパク質相互作用の推定
- 音声認識装置を用いた介護保険業務支援システムの構築(「次世代Web技術とディジタルエンタープライズ」及び一般)
- 聖教書誌情報全文検索システムの構築
- 発現量データからの相関係数によるタンパク質間相互作用の推定手法
- D-7-5 相関係数を用いた遺伝子相関の可現化のための測定値の有意性判定(D-7. MEとバイオサイバネティックスA)
- 情報検索システム評価用ベンチマークVer.1.0(BMIR-J1)について (メディア統合および環境統合のための高機能データベースシステム、および一般)
- 日本語情報検索システムのためのベンチマークの構築
- 情報検索システム評価用データベースの構築の提案
- 検索対象テキストDB自動決定法の検討
- 花園村遠隔看護システムの構築
- 消費者参加型ギフトセット商品開発のビジネスモデル(セッション2: 位置情報・ネットビジネス)
- 消費者参加型ギフトセット商品開発のビジネスモデル(セッション2: 位置情報・ネットビジネス)
- 右側頭葉を重点的に活性化するソフトの試作
- 高次脳機能と痴呆症
- データ項目名等の意味解析による概念モデルの作成法
- 日本語情報検索システム評価用テストコレクションの構築 (『1998年情報学シンポジウム』プログラム--WWW情報検索・電子図書館・セキュリティ・著作権・マルチメディア情報流通・感性情報処理) -- ((セッション7)情報検索と知識獲得)
- 小児在宅医療患者を対象としたコンピュータネットワークによる遠隔看護システムの構築
- 双方向マルチメディア通信可能なWWW上でのCAIシステム
- D-7-9 在宅介護支援のための健康情報管理システム(D-7. MEとバイオサイバネティックス,一般セッション)
- D-4-6 自記式アンケートのためのデータベースおよびデータマイニング(D-4.データ工学,一般講演)
- 統計的手法によるテキストからの重要語抽出メカニズム
- 検索者とサーバーの協調によるWWW情報検索サーバーの性能改善に関する考察
- 正規化頻度による形態素境界の推定
- 正規化頻度による形態素境界の推定
- 統計的手法による分かち書き境界の獲得
- 統計的手法によるテキストからのキーワード抽出法
- スキーマ統合におけるスキーマ要素間の類似性発見手法
- データ項目名等の意味解析による既存のDB中の実体型抽出アルゴリズム
- 仏典データベースのためのテキスト処理について
- データマイニング技法を用いた診断アンケート支援システム
- 産学連携のための教員検索システム
- 産学連携のための教員検索システム
- データマイニング技法を用いたアンケート支援システムの構築(「次世代Web技術とディジタルエンタープライズ」及び一般)
- 平安・鎌倉時代僧侶データベースの構築
- 関係データベースを用いた平安・鎌倉時代僧侶検索システムの構築
- 同業者を集めた電子モールシステムの構築
- 大量な2次元画像に関する検索管理技術
- 3次元画像デザインに対するネットワークコラボレーション支援システムの試作
- 携帯電話を用いた糖尿病看護支援システム(セッション7: 社会システム・教育支援システム)
- D01 六書原理に基づくロゴデザインシステム(グラフィックデザイン、タイポグラフィ, 第54回研究発表大会)
- D18 視覚伝達デザインにおける漢字図形化について(グラフィックデザイン,口頭による研究発表概要,平成18年度 日本デザイン学会 第53回研究発表大会)
- 重要概念抽出に基づく新聞記事からのキーワード作成
- オブジェクトに基づく高速画像検索システム : ExSight
- 自動部分構造化に基づくインデクシングによる大容量画像検索システム
- 生活習慣病予防のための競争意識を利用した歩行継続支援システム
- 感性語による画像検索とその精度評価
- 感性語とカラーパターン対応テーブルを用いた画像の感性検索
- インタラクティブ多方向情報表示システム
- 抽出パターンの階層的照合に基づく日本語テキストからの内容抽出法
- 動的シソーラスを用いた連想検索 : リンク重みの導入
- 日本語テキストデ-タベ-ス検索分類技術 (自然言語処理技術の研究)
- 日本語新聞記事からのキ-ワ-ド自動抽出と重要度評価 (新しいデ-タベ-ス技術論文特集)
- 若手研究者向けの耳寄りな話(情報知識学会創立20周年記念特別号)
- コンピューターネットワークを用いた新観光サービスの提案と情報危機管理 : 技術者の実践的な育成法について
- 概念設計のためのCAIシステムの試作
- 3次元画像デザインに対するネットワークコラボレーション支援システムの試作
- 全文検索エンジン選定支援システムの構築
- 小学校低学年を対象とした道徳教育支援システム
- 生活習慣病予防のための競争意識を利用した歩行継続支援システム
- 全文検索エンジン選定支援システムの構築
- D-9-42 光ディスク作成支援のためのコンテンツデータベースシステムの構築(D-9.ライフインテリジェンスとオフィス情報システム,一般セッション)
- D-13-2 NoSQLプログラミングを支援するラッパーの構築(D-13.知能ソフトウェア工学,一般セッション)
- 第20回年次大会予稿 Automatic Conversion of SQL statements into NoSQL queries (特集 第20回(2012年度)年次大会(研究報告会&総会))
- 黒毛和種肥育牛の枝肉形質バイオマーカーの探索II : 個体の性差と種雄牛の遺伝的背景が白色脂肪組織のタンパク質発現に及ぼす影響
- SQL-NoSQL自動変換の試み
- 自然画像から抽出したオブジェクト画像を利用した感性語による画像検索システム(画像デザイン)
- Large-scale proteomic analysis of Japanese Black cattle:Part II. Assessment of gender and genetic background effects
- 小学校低学年を対象とした基本的な生活習慣の教育を支援する情報システム