代表・派生関係を利用した日本語機能表現の解析
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,「機能表現一覧」 の階層性を利用し,階層において下位に位置する派生的表現について,用法が類似するより上位の代表的表現の用例を参照して,用法判定を行う手法について述べる.特に,前後の形態素の品詞が代表・派生間において不変の場合には,代表的表現と派生的表現の間で用法の傾向に相関がある,という特徴を利用する方式を提案する.提案方式に基づいて,派生的表現の用法の分析を行った結果,代表的表現の表記の用法判定済み用例集合 (約38,000 例) を参照して,派生的表現の表記の用法判定を行うことにより,80% 以上の用例の用法を正しく判定できることを示す.
- 2010-11-11
著者
-
松吉 俊
奈良先端科学技術大学院大学情報科学研究科
-
宇津呂 武仁
京大
-
土屋 雅稔
豊橋技術科学大学情報メディア基盤センター
-
宇津呂 武仁
筑波大学大学院システム情報工学研究科
-
鈴木 敬文
筑波大学大学院システム情報工学研究科
-
宇津呂 武仁
筑波大 大学院システム情報工学研究科
-
松吉 俊
奈良先端科学技術大学院大学
-
土屋 雅稔
豊橋技術科学大学 情報メディア基盤センター
関連論文
- テキスト情報分析のための判断情報アノテーション(自然言語処理,意味解析,情報爆発論文)
- 中間言語を用いたインドネシア語-日本語対訳辞書の拡充
- 非頻出語に対して頑健な日本語固有表現の抽出(語彙・固有表現・同義語)
- 複数文書から抽出した言明間の意味的関係の整理と関係付与(コーパス)
- 事象間関係知識の整備と類似・対立認識への応用(単語・事象・オントロジー)
- E-053 言論マップ生成のための事象間類似・対立関係の認識(自然言語・音声・音楽,一般論文)
- E-052 テキスト情報の事実性解析(自然言語・音声・音楽,一般論文)
- E-040 含意・矛盾認識のための事象間関係知識の整備(自然言語・音声・音楽,一般論文)
- 言論マップ生成課題 : 言説間の類似・対立の構造を捉えるために(情報分析・要約(テーマセッション1))
- フレーズテーブル及び既存対訳辞書を用いた専門用語の訳語推定
- 機械学習を用いた複数の大語彙連続音声認識モデルの出力の混合 : 旅行会話音声における評価
- テキスト情報分析のための判断情報アノテーション
- フレーズテーブル及び既存対訳辞書を用いた専門用語の訳語推定(自然言語処理)
- 特許情報処理を指向したテストコレクションの構築 : 情報検索と自然言語処理の融合を目指して(NTCIR特別セッション)
- 特許情報処理を指向したテストコレクションの構築 : 情報検索と自然言語処理の融合を目指して(NTCIR特別セッション)
- 特許情報を対象とした機械翻訳 : 共通基盤による評価タスクを目指して
- 特許情報を対象とした機械翻訳 : 共通基盤による評価タスクを目指して(文書分類・翻訳)
- 代表・派生関係を利用した日本語機能表現の解析
- 文間の弱い対立関係の認識
- 音声に含まれるプライバシ情報の保護(センシングウェブ)
- フィラー予測モデルに基づく話し言葉言語モデルの構築
- 日本語講義音声コンテンツコーパスの作成と分析
- 音声認識用言語モデルにおけるポーズ情報の扱いに関する検討
- 認証基盤と連携した学内メールホスティング環境の構築
- 非頻出語に対して頑健な日本語固有表現の抽出(語彙・固有表現・同義語)
- 日本語講義音声コンテンツコーパスの構築と講義音声認識手法の検討
- フィラー予測モデルを用いた話し言葉言語モデルの音声認識による評価
- 日本語機能表現の自動検出と統計的係り受け解析への応用
- E-063 Context Dependent Class Language Model Based on LSA
- フィラーの書き起こしのないコーパスからのフィラー付き言語モデルの構築(話し言葉処理)
- 機能表現を考慮した統計的日本語係り受け解析(解析・対話)
- 機能表現を考慮した統計的日本語係り受け解析
- 機械学習を用いた日本語機能表現のチャンキング
- フィラー予測モデルに基づくフィラー付き言語モデルの構築
- 講義コンテンツの収集・分析および講義音声の認識手法に関する検討
- 日本語複合辞用例データベースの作成と分析(自然言語,情報処理技術のフロンティア)
- Wikipediaを介した関連ニュース・ブログの対応付け? Wikipediaエントリの分析?
- 特定トピックの日英ブログ収集・分析・類型化:事例研究
- 日本語文章の事象に対する判断情報アノテーション
- 言論マップ生成課題 : 言説間の類似・対立の構造を捉えるために(情報分析・要約(テーマセッション1))
- 大規模コーパスを用いた日本語機能表現呼応可能性規則の作成および日本語学習支援での利用
- カスタマイズ性を考慮した擬人化音声対話ソフトウェアツールキットの設計(音声言語情報処理とその応用)
- 日本語ディクテーションのための言語資源・ツールの整備
- 日本語ディクテーションのための言語資源・ツールの整備
- 擬人化音声対話エージェント基本ソフトウェアの開発プロジェクト報告(プロジェクト紹介(2))(第5回音声言語シンポジウム)
- 擬人化音声対話エージェント基本ソフトウェアの開発プロジェクト報告(第5回音声言語シンポジウム : プロジェクト紹介(2))
- 擬人化音声対話エージェント基本ソフトウェアの開発プロジェクト報告(第5回音声言語シンポジウム : プロジェクト紹介(2))
- 擬人化音声対話エージェントツールキットGalatea
- 擬人化音声対話エージェント開発プロジェクト
- 擬人化音声対話エージェントツールキットの基本設計
- 擬人化音声対話エージェントツールキットの基本設計
- 日本語ディクテーション基本ソフトウェア(99年度版)
- 2000-NL-137-7 / 2000-SLP-31-2 日本語ディクテーション基本ソフトウェア(99年度版)の性能評価
- 2000-NL-137-7 / 2000-SLP-31-2 日本語ディクテーション基本ソフトウェア(99年度版)の性能評価
- 日本語ディクテーション基本ソフトウェア : 98年度版
- 日本語ディクテーション基本ソフトウェア(98年度版)の性能評価
- 日本語ディクテーション基本ソフトウェア(98年度版)の性能評価
- 日本語ディクテーション基本ソフトウェア : 97年度版
- 日本語ディクテーション基本ソフトウェア(97年度版)
- ディクテーションにおける形態素辞書エントリと読みの整備の効果
- 日本語ディクテーション基本ソフトウェア(97年度版)の性能評価
- 文体と難易度を制御可能な日本語機能表現の言い換え
- 日本語機能表現辞書の編纂
- 機能表現「なら」の機械翻訳のための言い換え(言い換え,文法)
- 機械学習を用いた日本語複合辞のチャンキング(抽出, 言い換え)
- Wikipediaエントリとブログサイトの対応付けによる日本語ブログ空間のトピック分布推定(トピック)
- 関連用語収集問題とその解法
- 対訳特許文書からの専門用語対訳辞書半自動獲得におけるフレーズテーブルと既存対訳辞書の併用(機械翻訳・要約・評判分析)
- 3D-5 フレーズテーブルと要素合成法を用いた対訳特許文書からの専門用語対訳辞書生成(自然言語処理,一般セッション,人工知能と認知科学)
- ウェブから収集した専門分野コーパスと要素合成法を用いた専門用語訳語推定
- ウェブを利用した専門用語の分野判定(自然言語処理)
- 自動検出のための慣用句の分類と語彙的情報(語と慣用句)
- 音韻論的・形態論的制約を用いたモンゴル語句生成・形態素解析
- 日英関連報道記事を用いた訳語対応推定
- 質問文中のキーワードと解候補の連想の強さを用いた解の決定
- 音韻論的・形態論的制約を用いたモンゴル語形態素解析(解析)
- 音韻論的・形態論的制約を用いたモンゴル語形態素解析(解析)
- 音韻論的・形態論的制約を用いたモンゴル語句生成(機械翻訳)
- 日英二言語文書を用いた訳語対応推定 : ウェブ上の非対訳文書を用いた訳語候補順位付け(情報抽出・翻訳知識獲得)
- 日英報道記事からの訳語対応推定 : ターム頻度と訳語対応推定性能の相関の評価(情報抽出・翻訳知識獲得)
- スプログ検出におけるHTML構造の類似性の有効性の評価
- 5J-6 キーワードのバースト特性を利用したスパムブログデータセットの作成と分析(情報爆発時代におけるWebおよびblogマイニング,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- Wikipedia を介した関連ニュース・ブログの対応付け : Wikipedia エントリの分析
- 5K-5 HTML構造の類似性を利用した大規模スパムブログ収集(情報爆発時代におけるWeb解析,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 5J-3 特定トピックのブログサイト検索 : Wikipediaエントリとブログサイトの対応付けに向けて(情報爆発時代におけるWebおよびblogマイニング,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 日本語文の規格化
- 辞書定義文の圧縮による定義表現パターンの発見
- 機械学習を用いた複数の大語彙連続音声認識モデルの出力の混合(音声,聴覚)
- NTCIR-3音声入力ウェブ検索タスクにおける複数音声認識モデル混合の評価
- SVMを用いた複数の大語彙連続音声認識モデルの出力の混合
- フレーズテーブル及び既存対訳辞書を用いた専門用語の訳語推定
- ニュースにおけるトピックのバースト特性の分析
- Wikipediaを知識源とする日英ブログ記事集合の観点分類と言語間対照分析
- 認証基盤と連携したメールホスティング環境の構築
- ニュースにおけるトピックのバースト特性の分析
- ポーズを考慮した話し言葉言語モデルの構築
- Wikipediaを多言語知識源とするブログ集合の話題分析(意見抽出/文書分類,第1回テキストマイニング・シンポジウム)
- Shibboleth・CAS連携による東海アカデミッククラウド認証基盤の構築(学生セッション,一般)
- Shibboleth・CAS連携による東海アカデミッククラウド認証基盤の構築
- HPCクラスタシステム上で動作する仮想マシンを用いたHadoopクラスタの構築