後続ひらがな列に基づく語の活用型推定(語彙知識)
スポンサーリンク
概要
- 論文の詳細を見る
新語や転用・派生語を収集して辞書を作成する場合,その語の品詞と活用型を認定する必要がある.動詞や形容詞は活用型ごとに異なる活用語尾を持つとともに,名詞の直後には格助詞が現れやすい.このような理由により,品詞や活用型の推定には,語幹に後続するひらがな列が強力な手がかりとなる.本稿では,このことを利用し,与えられた語幹の活用型を自動的に推定する手法を提案する.本手法では,あらかじめ,活用型ごとに特徴的な後続最長ひらがな列の出現傾向をコーパスから学習しておく.活用型の推定時には,その活用型の用例の出現回数を仮定する.そして,出現が期待される特徴的な後続最長ひらがな列がどの程度観察されるかに基づいて,当該活用型をとるか否かを認定する.本稿では,既知語を用いた本手法の性能評価,およびカタカナ文字列に対する活用型の推定実験の結果について報告する.
- 2008-07-10
著者
-
藤田 篤
名古屋大学 大学院工学研究科
-
藤田 篤
名古屋大学大学院工学研究科
-
桑江 常則
名古屋大学大学院工学研究科
-
佐藤 理史
名古屋大学大学院工学研究科
-
藤田 篤
公立はこだて未来大学
-
佐藤 理史
名古屋大学大学院 工学研究科 電子情報システム専攻
関連論文
- Webサイトへのアクセシビリティ向上を目的とした難語の平易化(高齢者支援/肢体不自由者支援/一般)
- 含意関係計算のための事態オントロジーの開発に向けて(言語理解とオントロジーシンポジウム)
- クラス指向事例収集手法による言い換えコーパスの構築
- 動詞項構造辞書への大規模用例付与
- 語彙概念構造に基づく言い換え生成 : 機能動詞構文の言い換えを例題に(自然言語)
- 語彙概念構造に基づく日本語動詞の統語・意味特性の記述 (まえがき)
- 言い換え計算モデルの工学的実現への語彙意味論的アプローチ (まえがき)
- 形態・構文的パターンを用いた言い換えコーパスの構築(抽出, 言い換え)
- 分類の根拠を明示した動詞語彙概念構造辞書の構築(辞書と辞典)
- 言い換え技術に関する研究動向
- Web文書集合からの意見情報抽出と着眼点に基づく要約生成(Webマイニング)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- Web文書集合からの意見情報抽出と着眼点に基づく要約生成(Webマイニング)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- 自動生成された言い換え文における不適格な動詞格構造の検出(自然言語)
- 語彙・構文的言い換えにおける変換誤りの分析(自然言語)(「インタラクション:理論,技術,応用,評価」)
- 自動生成した言い換え文における動詞結合価誤りの自動検出手法(言語知識・解析・言い換え)
- 語彙的言い換えに必要な知識の部品化
- 名詞言い換えコーパスの作成環境
- 聾者向け文章読解支援のための文可読性基準の調査
- 後続ひらがな列に基づく語の活用型推定(語彙知識)
- 述語句統語的異形間の言い換えらしさの計算手法(述語/動詞の言い換えとクラスタリング・分析)
- MMORPGログデータを活用したRMT被疑者の効率的な検出
- 日本語機能表現の自動検出と統計的係り受け解析への応用
- 機能表現を考慮した統計的日本語係り受け解析(解析・対話)
- 機能表現を考慮した統計的日本語係り受け解析
- 機械学習を用いた日本語機能表現のチャンキング
- 日本語複合辞用例データベースの作成と分析(自然言語,情報処理技術のフロンティア)
- 後続ひらがな列に基づく語の活用型推定(語彙知識)
- 現代日本語書き言葉均衡コーパスに対する難易度付与(テキスト評価とリーダビリティ)
- 基本慣用句五種対照表の作成(言語資源・文書分析)
- RMTに立ち向かうMMORPG運営者の支援 (特集 オンラインゲームと知能情報処理)
- エッセイコーパスを用いた日本語テキストの著者推定
- 文体と難易度を制御可能な日本語機能表現の言い換え
- 日本語機能表現辞書の編纂
- 機能表現「なら」の機械翻訳のための言い換え(言い換え,文法)
- 機械学習を用いた日本語複合辞のチャンキング(抽出, 言い換え)
- 関連用語収集問題とその解法
- ウェブを利用した関連用語の自動収集
- ウェブから収集した専門分野コーパスと要素合成法を用いた専門用語訳語推定
- ウェブを利用した専門用語の分野判定(自然言語処理)
- 自動検出のための慣用句の分類と語彙的情報(語と慣用句)
- 音韻論的・形態論的制約を用いたモンゴル語句生成・形態素解析
- 質問文中のキーワードと解候補の連想の強さを用いた解の決定
- 音韻論的・形態論的制約を用いたモンゴル語形態素解析(解析)
- 音韻論的・形態論的制約を用いたモンゴル語形態素解析(解析)
- 音韻論的・形態論的制約を用いたモンゴル語句生成(機械翻訳)
- 日英二言語文書を用いた訳語対応推定 : ウェブ上の非対訳文書を用いた訳語候補順位付け(情報抽出・翻訳知識獲得)
- 用例ベース翻訳のための対訳文の句アライメント
- 用例ベース翻訳のためのパラレルコーパスからの対訳対発見
- ワールドワイドウェブを利用した角語説明の自動生成(システムLSIの設計技術と設計自動化)
- 自然言語処理 特集号「言い換え」
- 地域情報ウェブディレクトリの自動編集
- RE-003 「意外や意外」回文だ : 文章中に知られざる回文はあるか(E分野:自然言語・音声・音楽,査読付き論文)
- とれないeqをどうとるか(編集委員2007年の抱負)
- 4択クイズを連想問題として解く(検索・多義性解消)
- 境界認定の提案 : (2)背景と思想(解析)
- 境界認定の提案 : (1)コンセプトと実現法(解析)
- 境界認定の提案 : (2)背景と思想(解析)
- 境界認定の提案 : (1)コンセプトと実現法(解析)
- 異表記同語認定のための辞書編纂(解析)
- 格フレームの対応付けに基づく用言の言い換え
- 日本語文の規格化
- 辞書定義文の圧縮による定義表現パターンの発見
- 日本語クロスワードパズルを解く
- 国語辞典に基づく平易文へのパラフレーズ
- RMTに立ち向かうMMORPG運営者の支援
- 検索連動型広告の自動生成と集客効果の測定-飲食店ドメインを例題に
- 均衡コーパスを規範とするテキスト難易度測定
- いま日本語に起こっていること
- 言語グリッドを用いた多言語函館観光情報サービスの構築(言語グリッドと異文化コラボレーション)
- 音声対話システムにおける発話区間検出結果の音声認識性能への影響の調査 (第二回対話システムシンポジウム 一般セッションと対話システム)
- 大規模コーパスへのクラス付与に基づく音声対話システム用言語モデルの構築
- 複数人会話におけるロボットによる視聴覚情報に基づくアクティブユーザの推定
- 複数人会話におけるロボットによる視聴覚情報に基づくアクティブユーザの推定
- 音声対話システム用クラスN-gramモデルによるドメイン固有語の認識率向上
- 音声対話システム用クラスN-gramモデルによるドメイン固有語の認識率向上
- 検索連動型広告の自動生成と集客効果の測定 : 飲食店ドメインを例題に
- センター試験『国語』現代文の傍線部問題を解くベースライン法
- テキストの難易度と語の分布
- Building Model to Predict How Likely User is to Talk to Humanoid Robot
- RF-009 文節データベースを用いた日本語アナグラムの自動生成(複雑系及び一般,F分野:人工知能・ゲーム)
- 代ゼミ模試に挑戦2013-『国語』現代文
- ロボットへの話しかけやすさモデルの評価と個人差や教示による変動への対応
- 多段階戦略に基づくテキスト間の意味関係認識:RITE2タスクへの適用
- 表層類似度に基づくセンター試験『国語』現代文傍線部問題ソルバー