日本語文生成における語彙選択に必要な要因とその性質
スポンサーリンク
概要
- 論文の詳細を見る
文脈や状況を考慮した日本語文生成システムを構築するために、語彙選択の過程は必要不可欠である。本稿では、計算機上で柔軟な語彙選択を実現するために語彙選択を決定する様々な要因を具体的なパラメータとして取り出し、選択の手がかりとして用いる。本稿で提案する語彙選択の枠粗には、次のような利点がある。1. 本枠粗では、概念と表層の単語が一対多に対応すると考えるため、一つの概念から様々な要因に応じて語彙を選択できる。例えば、「言われる」と「仰る」の違いのように単語そのものが異なる場合の語彙選択も扱える。これは従来の枠粗では扱えなかった。2. 要因の性質を利用することによって、ある単語の選択が同じ文内の他の単語の選択に影響を及す現象も扱える。
- 社団法人情報処理学会の論文
- 1996-11-18
著者
-
黒橋 禎夫
京都大学大学院情報学研究科知能情報学専攻
-
長尾 眞
京都大学大学院工学研究科電子通信工学専攻
-
内元 清貴
情報通信研究機構
-
内元 清貴
郵政省通信総合研究所
-
長尾 眞
京都大学大学院工学研究科 電子通信工学専攻
-
黒橋 禎夫
京都大学大学院情報学研究科
関連論文
- 同一文抽出に基づく類似ページの検出と分類
- 大規模テキストコーパスからの知識獲得
- 情報爆発時代における情報管理・融合・活用基盤(情報爆発時代に向けた新しいIT基盤技術の研究)
- 表層・語彙的特徴量に基づくブログの面白さ分析(学生セッション I)
- 単語の共起頻度と出現位置による新聞の関連記事の検索手法
- 形態素の共起頻度と出現位置による新聞関連記事の検索手法
- 話し言葉の整形作業における削除箇所の自動同定(音声言語処理)
- 言語資源の用途情報の抽出と利用(情報抽出・評判分析)
- 日本語文生成における語彙選択に必要な要因とその性質
- 3D-1 言語資源メタデータデータベースSHACHIの構築と利用(自然言語処理,一般セッション,人工知能と認知科学)
- 日本語話し言葉の係り受け解析と文境界推定の相互作用による高精度化
- 『日本語話し言葉コーパス』における自己修復部(Dタグ)の自動検出および修正に関する検討(合同セッション「対話」)
- 名詞句「AのB」「AB」の用例を利用した換喩解析
- 構文情報を利用した電子ニュース記事のクラスタリングシステムの作成と評価
- nグラム統計によるコーパスからの未知語抽出
- 構文情報を利用した電子ニュース記事のクラスタリングシステムの作成と評価
- 意味ネットワークからの文章生成
- SOMを用いた日本語意味マップの自己組織化
- 意味ソートmsort : 意味的並べかえ手法による辞書の構築例とタグつきコーパスの作成例と情報提示システム例
- 小規模タグ付きコーパスと自動獲得した大規模語彙知識を用いた識別モデルに基づくゼロ照応解析
- 文脈に依存した述語の同義関係獲得
- 機械学習を用いた日本語機能表現のチャンキング
- 日本語名詞における間接照応
- 1.キーワードサーチを超える情報爆発サーチ : 自然言語処理で価値ある未知をマイニング(パートI:情報爆発時代における新しい基盤技術,情報爆発時代におけるわくわくするITの創出を目指して)
- 用例ベース翻訳の確率的モデル化
- 機械翻訳最新事情 : (下)評価型ワークショップの動向と日本からの貢献
- 帰属文書数に基づくWebページ情報発信者の専門性分析
- 帰属文書数に基づくWebページ情報発信者の専門性分析
- メッセージの背後に潜む「問い」の抽出
- 多言語コミュニティヘの用例ベース翻訳の適用(言語グリッドと異文化コラボレーション)
- MDL原理に基づく辞書定義文の圧縮と共通性の発見
- 事例の重み付けに基づく自動獲得されたコーパスの効果的な利用法と評価極性分類への応用(「ユニバーサルコミュニケーションを実現するための言語処理技術」シンポジウム)
- 1.機械翻訳を用いた異文化コラボレーション(異文化コラボレーション)
- 形態素クラスタリングによる形態素解析精度の向上
- タグ付きコーパスからの統語規則の獲得
- 機械学習を用いた日本語複合辞のチャンキング(抽出, 言い換え)
- 『日本語話し言葉コーパス』における自己修復部(Dタグ)の自動検出および修正に関する検討(合同セッション「対話」)
- 最大エントロピーモデルに基づく形態素解析 : 未知語の問題の解決策
- 最大エントロピー法に基づくモデルを用いた日本語係り受け解析
- 文末から解析する統計的係り受け解析アルゴリズム
- MEによる日本語係り受け解析
- 日英単言語Webコーパスからの対訳treebank自動獲得
- マルチエージェントシステムに対する期待
- AIマップ : 自然言語へのアプローチ
- 京都大学統合情報通信システムKUINSの基本概念とシステム設計
- 日英単言語 Web コーパスからの対訳 treebank 自動獲得
- 文末表現に着目した自由回答アンケートの分類
- 16. 自然言語の一般理論の試み
- RE-002 二段階の機械学習を用いたボトムアップ型の固有表現認識(自然言語・音声・音楽,査読付き論文)
- 言語の理解へ
- キーワード蒸留型クラスタリングによる大規模ウェブ情報の俯瞰
- クエリの語句の重要度と係り受けを考慮した自然文検索(検索・対話)
- クエリの語句の重要度と係り受けを考慮した自然文検索(検索・対話)
- モノの用途表現を手がかりとした Web からのノウハウの獲得
- モノの用途表現を手がかりとしたWebからのノウハウの獲得
- モノの用途表現を手がかりとしたWebからのノウハウの獲得
- 図解辞書とLDOCEの分野コードに基づく場面知識による英語名詞の多義性解消
- 話し言葉の整形作業における削除箇所の自動同定(音声言語処理)
- 3. 座談会 : 未来に向けての技術展望(あの技術は今… : 技術の変遷と21世紀への展望)
- 坂井利之先生の文化功労者顕彰を祝して
- 高等教育における教育改革と経営改善(挨拶)
- 大学教育評価をどうするか : 評価からFDへ(挨拶)
- 大学教員の教育能力をどう開発するか(挨拶)
- 21世紀社会を支える情報処理学会になるために : 会長就任にあたって
- 異分野の人との対話
- 大域的情報を用いた日本語固有表現認識
- 自然言語入力と目次との柔軟な照合による図書検索システム
- 出現密度分布を用いた語の重要説明箇所の特定
- 出現密度分布を用いた語の重要説明箇所の特定
- 目次情報を利用した図書検索システム
- 表層・語彙的特徴量に基づくブログの面白さ分析(学生セッション I)
- 国語辞典を用いた名詞句「AのB」の意味解析
- 依存関係確率モデルを用いた統計的句アライメント
- 形態論的制約を用いたオンライン未知語獲得
- E-009 長い複合名詞の構造的な固有表現認識(自然言語・音声・音楽,一般論文)
- 基調講演「電子図書館の構築」 (電子図書館時代の大学図書館の生産性(平成9年11月13日〜14日、会場:京都産業大学))
- 雑誌「自然言語処理」の発刊にあたって
- B33 科学技術文献を対象とする日中・中日機械翻訳 : 日中・中日言語処理技術の研究開発 その1(セッションB3情報システム構築2,一般発表概要,第7回情報プロフェッショナルシンポジウム)
- 講演音声認識のための言語モデルの教師なし適応
- 4ZK-10 検索結果クラスタリングのためのページタイプの自動識別(情報爆発時代におけるテキストデータ処理,学生セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 同位語を利用した不在インデックス
- 同位語を利用した不在インデックス
- 基本語ドメイン辞書の構築と未知語ドメイン推定を用いたブログ自動分類法への応用
- 述語項構造の共起情報と格フレームを用いた事態間知識の自動獲得
- Web時代の音声・言語技術
- 3.情報爆発時代のWebのサーチ・分析技術(情報爆発が創り出すサイバーフィジカルな情報処理)
- 構文・照応・評価情報つきブログコーパスの構築
- 言語横断共訓練による単語間の上位下位関係の獲得
- 大規模格フレームを用いた識別モデルに基づく日本語ゼロ照応解析
- 構造を持った定型表現の自動獲得と機械翻訳での利用 (機械翻訳技術の向上)
- 日本語未知語のテキストからの自動獲得(知識発見,第1回テキストマイニング・シンポジウム)
- モノの使われ方の情報がノウハウ獲得に与える影響(人工知能、データマイニング,学生論文)
- 大規模語彙的知識に基づく受身形と能動形の表層格の対応付け
- 言語資源の用途情報の獲得と利用(人工知能,電子情報通信分野における萌芽的研究論文)
- テキストの表層情報と潜在情報を利用した適合性フィードバック
- ユニット制約の緩和による柔軟な日本語文圧縮
- ユニット制約の緩和による柔軟な日本語文圧縮
- 日中共通漢字の整理とこれを利用した日中機械翻訳の高度化 (特許情報普及活動功労者表彰 発足記念版) -- (機械翻訳技術の向上)
- 言語資源の用途情報の獲得と利用
- 語彙と文脈情報を用いた反義の詳細クラス分類