確率的LSAを用いた日本語同音異義語誤りの検出・訂正(自然言語)
スポンサーリンク
概要
- 論文の詳細を見る
本論文ではかな漢字変換誤り,特に同音異義語の選択誤りを対象とした日本語スペルチェックの方法を報告する.同音異義語誤りの判定には局所的な情報と大域的な情報の両者が必要であるが,本論文では大域的な情報をモデル化するために確率的LSAを用いることを提案・検討する.評価実験として,人為的に誤りを混入させたテストデータを用いた誤り検出訂正正実験を行った.局所的な情報のモデル化に従来からよく使われているngramモデルのみを利用した手法をベースラインとして比較した.ベースラインシステムでは再現率93.8%,適合率79.0%(F値85.8%)であった性能が,確率的LSAと組み合わせることにより再現率95.5%,適合率83.6%(F値89.2%)と改善された.
- 一般社団法人情報処理学会の論文
- 2004-09-15
著者
-
貞光 九月
筑波大学システム情報工学研究科
-
山本 幹雄
筑波大学大学院システム情報工学研究科
-
山本 幹雄
筑波大学電子・情報工学系
-
山本 幹雄
沖テクノシステムズラボラトリ(株)
-
三品 拓也
日本アイ・ビー・エム株式会社東京基礎研究所
-
三品 拓也
筑波大学大学院理工学研究科
-
貞光 九月
筑波大学情報学類
-
山本 幹雄
豊橋技術科学大学情報工学系中川研究室
関連論文
- トピック教師なしデータからのトピック依存評価表現モデルの獲得(「主観表現処理の最前線」シンポジウム)
- フレーズテーブル及び既存対訳辞書を用いた専門用語の訳語推定
- フレーズテーブル及び既存対訳辞書を用いた専門用語の訳語推定(自然言語処理)
- 特許情報処理を指向したテストコレクションの構築 : 情報検索と自然言語処理の融合を目指して(NTCIR特別セッション)
- 特許情報処理を指向したテストコレクションの構築 : 情報検索と自然言語処理の融合を目指して(NTCIR特別セッション)
- 統計的機械翻訳におけるフレーズ対応最適化を利用したN-best翻訳候補のリランキング
- 確立・統計的言語モデル (特集 脳とことばとコンピュータ--脳の高次機能の解明に向けて)
- 確率・統計情報を用いた文法研究 (新・文法用語入門) -- (新しい文法研究)
- 日本語音声コ-パスの比較・選択の方法
- 6U-2 特許文に対するクロストリガーモデルを用いた統計的機械翻訳システム(自然言語処理,学生セッション,人工知能と認知科学)
- 特許情報を対象とした機械翻訳 : 共通基盤による評価タスクを目指して
- 特許情報を対象とした機械翻訳 : 共通基盤による評価タスクを目指して(文書分類・翻訳)
- 音声認識セミナー : 基礎からディクテーションまで
- コーパスから抽出された辞書を用いた表記誤り検出法
- 声帯振動の非線形効果パラメータのパタン化とその評価
- 声帯振動の非線形効果パラメータのパタン化
- 声帯振動の非線形効果を考慮した合成音声とその評価
- 音声対話データベース構築の現状(音声対話システムの実力と課題)
- ブログ記事集合を用いたポストとコメントとの自動分離抽出手法の提案
- 方言音声コーパスの設計・構築と分析
- 日本語方言音声コーパスの構築と分析
- Integer programming for a phrase alignment problem on statistical machine translation (21世紀の数理計画--最適化モデルとアルゴリズム--RIMS研究集会報告集)
- SIG-SLP/SIG-NL合同セッションここまでできるぞ音声/言語処理技術 : 音声編
- ここまでできるぞ音声/言語処理技術 : 音声編
- 日本語ディクテーションのための言語資源・ツールの整備
- 日本語ディクテーションのための言語資源・ツールの整備
- 2000-FI-59-2 / 2000-DD-24-2 情報検索性能と表記の揺れへの寛容性を持つ類似度
- 2000-FI-59-2 / 2000-DD-24-2 情報検索性能と表記の揺れへの寛容性を持つ類似度
- 2000-NL-138-9 ダイナミックプログラミングでの検索方法
- NLC2000-18 ダイナミックプログラミングでの検索方法
- 日本語ディクテーション基本ソフトウェア(99年度版)
- 2000-NL-137-7 / 2000-SLP-31-2 日本語ディクテーション基本ソフトウェア(99年度版)の性能評価
- 2000-NL-137-7 / 2000-SLP-31-2 日本語ディクテーション基本ソフトウェア(99年度版)の性能評価
- 日本語ディクテーション基本ソフトウェア : 98年度版
- 日本語ディクテーション基本ソフトウェア(98年度版)の性能評価
- 日本語ディクテーション基本ソフトウェア(98年度版)の性能評価
- 日本語ディクテーション基本ソフトウェア : 97年度版
- 日本語ディクテーション基本ソフトウェア(97年度版)
- 日本語ディクテーション基本ソフトウェア(97年度版)の性能評価
- 対訳特許文書からの専門用語対訳辞書半自動獲得におけるフレーズテーブルと既存対訳辞書の併用(機械翻訳・要約・評判分析)
- 3D-5 フレーズテーブルと要素合成法を用いた対訳特許文書からの専門用語対訳辞書生成(自然言語処理,一般セッション,人工知能と認知科学)
- 語学会話教育用ICAIシステムの構成
- 大語彙日本語連続音声認識研究基盤の整備 : 汎用音素モデルの作成
- 大語彙日本語連続音声認識研究基盤の整備 : 学習・評価テキストコーパスの作成
- 大語彙日本語連続音声認識研究基盤の整備 : 評価用連続音声認識プログラムの開発
- 日本語音声コーパスの比較・選択の方法
- 日本音響学会新聞記事読み上げ音声コーパスからの評価用発話セットの作成
- 人間の理解手法を用いたロバストな音声対話システム
- ロバストな対話システム構築に関する一考察
- 音声対話システムにおける自然発話の頑健な一理解法
- 事前説明によるシステムへの入力発話の変化と誤認識結果の人間による復元
- 事前説明によるシステムへの入力発話の変化と誤認識結果の人間による復元
- 自然発話の意味理解と対話システム
- 日本語ディクテーション基本ソフトウェア(97年度版)の性能評価
- 音声対話文における助詞落ち・倒置の分析と解析手法
- 音声対話とキーボード対話における発話文の統語的特徴の比較
- 混合ディリクレ分布を用いたトピックに基づく言語モデル(音声, 聴覚)
- 確率的LSAを用いた日本語同音異義語誤りの検出・訂正(自然言語)
- 確率的LSAに基づくngramモデルの変分ベイズ学習を利用した文脈適応化(音声,聴覚)
- 混合ディレクレ分布を用いた文脈のモデル化と言語モデルへの応用
- 確率的LSAに基づくngramモデルの変分ベイズ学習を利用した文脈適応化
- 確率的LSAに基づくngramモデルの変分ベイズ学習を利用した文脈適応化
- 確率的LSAに基づくngramモデルの変分ベイズ学習を利用した文脈適応化
- 生成文書モデルを用いた文書読み上げ音声認識(認識, 信頼度)
- GMMによる多言語音声系統樹の構成
- 文書確率を用いた文書読み上げ音声認識
- F_0モデルパラメータ自動抽出方法の改良(聴覚・音声・言語とその障害, 一般)
- 混合ガウス分布による多言語音声系統樹の構成(音声言語応用)(第6回音声言語シンポジウム)
- 混合ガウス分布による多言語音声系統樹の構成(音声言語応用)(第6回音声言語シンポジウム)
- 混合ガウス分布による多言語音声系統樹の構成(音声言語応用)(第6回音声言語シンポジウム)
- F_0モデル・パラメーターの自動決定方法についての考察(ポスターセッション)(第5回音声言語シンポジウム)
- F_0モデル・パラメーターの自動決定方法についての考察(第5回音声言語シンポジウム : ポスターセッション)
- F_0モデル・パラメーターの自動決定方法についての考察(第5回音声言語シンポジウム : ポスターセッション)
- F_0モデル・パラメーターの自動決定方法についての考察
- F_0モデルパラメータ自動決定の一方法
- 国内における音声データベースの現状 : 開発,管理及び音声研究への利用
- F_0モデルパラメータ自動抽出の一方法
- F_0モデルパラメータ自動抽出の一方法
- 音声による対話システムの評価法における一考察
- 多言語音声コーパスの構築と分析
- 韻律情報を考慮した音声要約の一方法
- 混合ディリクレ分布パラメータの階層ベイズモデルを用いたスムージング法(音声言語情報処理一般)(テーマ:音声対話システム、音声言語情報処理、一般)
- 英日統計的機械翻訳における語順優先探索デコーダ(自然言語)
- 教師情報を必要としないニュースページ群からのコンテンツ自動抽出
- 大語彙連続音勢認識研究用日本語コーパス : JNAS
- メニューによりガイドされた文節単位発声による音声対話システム
- メニューに基づく音声対話システムとその評価
- 文献検索タスクを用いた音声対話データの収録と分析
- 文献検索をタスクとした音声対話コーパスの構築と分析
- 文献検索をタスクとした音声対話データの収録と分析 (テーマ:コーパスを利用した談話・対話研究)
- フレーズテーブル及び既存対訳辞書を用いた専門用語の訳語推定
- 韻律情報を用いた相槌の挿入 (ヒューマンインタフェースとインタラクション)
- 韻律パターンの認識を用いた相槌挿入とその評価
- 曖昧観測シンボル列からのHMMパラメータ推定法とその形態素解析への応用
- 曖昧観測シンボル列からのHMMパラメータ推定法とその形態素解析への応用
- 評価表現と文脈一貫性を利用した教師データ自動獲得によるクレーム文検知(第3回集合知シンポジウム)
- メニュー入力を用いた日本語作文学習システム
- 日本語学習者向け日本語スペルチェッカ
- E-034 レビュー集合要約における特徴的評価視点セレクション(感情・評判,E分野:自然言語・音声・音楽)
- ブログページ集合からのポストおよびコメント自動分離抽出手法