機械学習を用いた日本語複合辞のチャンキング(抽出, 言い換え)
スポンサーリンク
概要
- 論文の詳細を見る
本稿では, Support Vector Machine(SVM)を用いたチャンカーYamChaを利用して, 日本語複合辞の検出器を学習し, その性能評価を行った.SVMは従来からある学習モデルと比較して, 入力次元数に依存しない高い汎化能力を持ち, Kernel関数を導入することで効率良く素性の組合わせを考慮しながら分類問題を学習することが可能である.SVMを日本語複合辞の検出に適用し, 実際のタグ付きデータを用いて解析を行った結果, 日本語複合辞を構成している形態素の数の情報, 形態素の日本語複合辞における位置情報を考慮した場合, 交差検定によりF値で約94という高精度の結果が得られた.
- 一般社団法人情報処理学会の論文
- 2005-11-21
著者
-
佐藤 理史
名古屋大学大学院工学研究科
-
佐藤 理史
北陸先端科学技術大学院大学情報科学研究科
-
宇津呂 武仁
京大
-
土屋 雅稔
豊橋技術科学大学情報メディア基盤センター
-
内元 清貴
情報通信研究機構
-
井佐原 均
情報通信研究機構
-
宇津呂 武仁
筑波大学大学院システム情報工学研究科
-
佐藤 理史
名古屋大 大学院工学研究科
-
井佐原 均
独立行政法人 情報通信研究機構
-
佐藤 理史
京都大学大学院情報学研究科知能情報学専攻:科学技術振興事業団さきがけ研究21「情報と知」領域グループ
-
佐藤 理史
京都大学
-
注連 隆夫
京都大学大学院 情報学研究科
-
高木 俊宏
京都大学大学院情報学研究科
-
佐藤 理史
名古屋大学大学院工学研究科電子情報システム専攻
-
宇津呂 武仁
筑波大 大学院システム情報工学研究科
-
高木 俊宏
京都大学工学部
-
宇津呂 武仁
京都大学大学院情報学研究科
-
注連 隆夫
京都大学大学院情報学研究科
-
土屋 雅稔
豊橋技術科学大学 情報メディア基盤センター
-
佐藤 理史
名古屋大学大学院 工学研究科 電子情報システム専攻
関連論文
- 「サ変名詞+する」から動詞相当句への言い換え
- 「サ変名詞+する」の動詞への言い換え
- 後続ひらがな列に基づく語の活用型推定(語彙知識)
- 述語句統語的異形間の言い換えらしさの計算手法(述語/動詞の言い換えとクラスタリング・分析)
- 機械学習を用いた複数の大語彙連続音声認識モデルの出力の混合 : 旅行会話音声における評価
- 日本語機能表現の自動検出と統計的係り受け解析への応用
- 機能表現を考慮した統計的日本語係り受け解析(解析・対話)
- 機能表現を考慮した統計的日本語係り受け解析
- 機械学習を用いた日本語機能表現のチャンキング
- 日本語複合辞用例データベースの作成と分析(自然言語,情報処理技術のフロンティア)
- Common language acquisition by multi-agents
- 免疫システムのメカニズムを用いた感情の計算モデル
- 免疫システムに基づく感情の計算モデル
- 後続ひらがな列に基づく語の活用型推定(語彙知識)
- 現代日本語書き言葉均衡コーパスに対する難易度付与(テキスト評価とリーダビリティ)
- 基本慣用句五種対照表の作成(言語資源・文書分析)
- エッセイコーパスを用いた日本語テキストの著者推定
- 文体と難易度を制御可能な日本語機能表現の言い換え
- 日本語機能表現辞書の編纂
- 機能表現「なら」の機械翻訳のための言い換え(言い換え,文法)
- 機械学習を用いた日本語複合辞のチャンキング(抽出, 言い換え)
- 関連用語収集問題とその解法
- ウェブを利用した関連用語の自動収集
- ワールドワイドウェブからの人物情報の自動収集
- ワールドワイドウェブからの人物情報の自動収集
- 4P-8 WWW上の職業別人名リストを利用した人名の収集
- ウェブから収集した専門分野コーパスと要素合成法を用いた専門用語訳語推定
- ウェブを利用した専門用語の分野判定(自然言語処理)
- 自動検出のための慣用句の分類と語彙的情報(語と慣用句)
- 音韻論的・形態論的制約を用いたモンゴル語句生成・形態素解析
- 質問文中のキーワードと解候補の連想の強さを用いた解の決定
- 音韻論的・形態論的制約を用いたモンゴル語形態素解析(解析)
- 音韻論的・形態論的制約を用いたモンゴル語形態素解析(解析)
- 音韻論的・形態論的制約を用いたモンゴル語句生成(機械翻訳)
- 日英二言語文書を用いた訳語対応推定 : ウェブ上の非対訳文書を用いた訳語候補順位付け(情報抽出・翻訳知識獲得)
- 用例ベース翻訳のための対訳文の句アライメント
- 用例ベース翻訳のためのパラレルコーパスからの対訳対発見
- 用例ベース翻訳のためのパラレルコーパスからの対訳対発見
- ワールドワイドウェブを利用した角語説明の自動生成(システムLSIの設計技術と設計自動化)
- 2000-NL-137-4 ワールドワイドウェブを利用した用語検索の実現
- 格変換による単文の言い換え
- 自然言語処理 特集号「言い換え」
- 地域情報ウェブディレクトリの自動編集
- ワールドワイドウェブを知識源とした地域情報の自動編集
- ワールドワイドウェブを知識源とした地域情報の自動編集
- RE-003 「意外や意外」回文だ : 文章中に知られざる回文はあるか(E分野:自然言語・音声・音楽,査読付き論文)
- とれないeqをどうとるか(編集委員2007年の抱負)
- 4択クイズを連想問題として解く(検索・多義性解消)
- 境界認定の提案 : (2)背景と思想(解析)
- 境界認定の提案 : (1)コンセプトと実現法(解析)
- 境界認定の提案 : (2)背景と思想(解析)
- 境界認定の提案 : (1)コンセプトと実現法(解析)
- 異表記同語認定のための辞書編纂(解析)
- 格フレームの対応付けに基づく用言の言い換え
- 日本語文の規格化
- 辞書定義文の圧縮による定義表現パターンの発見
- 日本語クロスワードパズルを解く
- 国語辞典に基づく平易文へのパラフレーズ
- 国語辞典に基づく平易文へのパラフレーズ
- 論文表題を言い換える
- 4T-1 教官公募情報のダイジェスト自動生成
- 電脳文章要約術 : 計算機はいかにしてテキストを要約するか
- 論文表題を言い換える
- ネットニュース記事群の自動パッケージ化
- ネットニュースとニュースダイジェスト自動生成
- 新しいAI研究を目指して
- ネットニュースグループfj.wantedのダイジェスト自動生成
- 翻訳例へのカテゴリ付加による実例型翻訳の高速化
- 対話リーグ戦'95に対する基本戦略
- 電子ニュースのダイジェスト自動生成
- 対話リーグ戦'95用プログラムの作成 : 対話からの知識獲得
- 実例に基づく翻訳
- 電子ニュースにおけるダイジェスト機構の実現
- Automatic generation of digests for meeting announcements in the NetNews
- 北陸先端科学技術大学院大学情報科学研究科佐藤研究室
- A high-speed best match retrieval method for Japanese text
- 超並列計算機を用いた全文検索の高速化
- 多様なエージェント集団における創発的分業モデル
- 超並列計算機を用いた実例型翻訳の実現
- 6. 人工知能と類推 (<特集> アナロジー)
- CTM2マニュアル
- 用例検索による日英翻訳支援システムCTM2 : 部分列インデックスを用いた最適照合検索
- MIMD implementation of MBT3
- Example-based translation of technical terms
- 実例に基づく翻訳
- 用例検索による韓日・日韓翻訳支援システム
- 検索連動型広告の自動生成と集客効果の測定-飲食店ドメインを例題に
- 均衡コーパスを規範とするテキスト難易度測定
- いま日本語に起こっていること
- 音声対話システムにおける発話区間検出結果の音声認識性能への影響の調査 (第二回対話システムシンポジウム 一般セッションと対話システム)
- 大規模コーパスへのクラス付与に基づく音声対話システム用言語モデルの構築
- JAISTにおける超並列関連研究(1997年度)
- JAISTにおける超並列関連研究 (1994年度-1996年度)
- JAISTにおける超並列関連研究 : 1992年度-1993年度
- 複数人会話におけるロボットによる視聴覚情報に基づくアクティブユーザの推定
- 複数人会話におけるロボットによる視聴覚情報に基づくアクティブユーザの推定
- 音声対話システム用クラスN-gramモデルによるドメイン固有語の認識率向上
- 音声対話システム用クラスN-gramモデルによるドメイン固有語の認識率向上
- 検索連動型広告の自動生成と集客効果の測定 : 飲食店ドメインを例題に
- RF-009 文節データベースを用いた日本語アナグラムの自動生成(複雑系及び一般,F分野:人工知能・ゲーム)