タグ付きコーパスからの統語規則の獲得
スポンサーリンク
概要
- 論文の詳細を見る
本論文では, 自然言語を文脈自由文法でモデル化し, 夕グ付コーパスから文法を獲得する方法を提案し, この手法による統語規則の獲得の実験結果を評価する. 我々が提案する手法は以下の3つの仮定に基づいている. 1)統語規則の右辺に現れる記号列は環境から独立して高い頻度で現れる. 2)同じ非終端記号から直接導出される品詞列は類似した環境を持つ. 3)コーパスの大きさを最も減少させる統語規則が適切である. これらの仮定に基づいてひとまとまりとなる品詞列を見つけ, これを新たな記号で置き換える. これを繰り返すことによって, 統語規則の集合(文法)と統語構造を与えられたコーパスが得られる.
- 一般社団法人情報処理学会の論文
- 1996-09-15
著者
-
長尾 眞
京都大学工学部電気工学第二教室
-
長尾 眞
京都大学大学院工学研究科電子通信工学専攻
-
長尾 眞
国立国会図書館
-
長尾 眞
独立行政法人情報通信研究機構
-
長尾 眞
京都大学
-
森 信介
日本アイ・ビー・エム株式会社東京基礎研究所
-
長尾 眞
京都大学工学研究科電子通信工学
-
森 信介
京都大学工学研究科
-
長尾 眞
京都大学工学部
関連論文
- 6.言語・画像のデータ依存情報処理(情報処理技術の未来地図,50周年記念特集号)
- 国立国会図書館 館長対談(第13回)前フランス国立図書館長 ジャン-ノエル・ジャンヌネー氏 文化の多様性と知の伝承
- 国立国会図書館 館長対談(第7回)デジタル時代のスウェーデン国立図書館の挑戦 (デジタル時代のスウェーデン国立図書館の挑戦--スウェーデン国立図書館長 グンナー・サーリン氏)
- 本の森を歩く(特別篇)館長 長尾真が読書週間に選ぶ9冊
- 絵画解説文の対象情報・感性的情報の抽出
- キャプションと記事テキストの文字列照合による報道番組と新聞記事との対応づけの自動化
- キャプションと記事テキストの最長一致文字列照合による報道番組と新聞記事との対応づけの自動化
- IPAL辞書と分類語語彙を用いた単語意味辞書の作成
- 単語の共起頻度と出現位置による新聞の関連記事の検索手法
- 表層的手がかりによる六法全書法律文での要件部・効果部の抽出手法
- 形態素の共起頻度と出現位置による新聞関連記事の検索手法
- 日本語文生成における語彙選択に必要な要因とその性質
- 巻頭対談 国立国会図書館長・長尾真氏 VS.東京理科大学理事長・塚本桓世氏 これからの図書館のあり方と利用について
- 確率的モデルによる仮名漢字変換
- 構文情報を利用した電子ニュース記事のクラスタリングシステムの作成と評価
- nグラム統計によるコーパスからの未知語抽出
- 構文情報を利用した電子ニュース記事のクラスタリングシステムの作成と評価
- 国立国会図書館 館長対談(第12回)児童文学者 松岡享子氏 読書は本とのコミュニケーション
- 国立国会図書館 館長対談(第11回)立命館大学教授、京都大学特任教授 佐和隆光氏 持続可能で豊かな社会を
- 国立国会図書館 館長対談(第10回)慶應義塾学事顧問、慶應義塾大学教授 安西祐一郎氏 知識は力である
- 国立国会図書館 館長対談(第9回)国際図書館連盟会長 クラウディア・ルクス氏 主張する図書館へ
- 国立国会図書館 館長対談(第8回)大阪大学名誉教授 伊井春樹 古典と現代
- 国立国会図書館 館長対談(第6回)文字・活字文化推進機構会長 福原義春氏 読書の力、本の力
- 国立国会図書館 館長対談(第5回)東京大学教授 上野千鶴子氏 本の未来、図書館の未来
- 国立国会図書館 館長対談(第4回)カナダ国立図書館公文書館長 イアン・ウィルソン氏 デジタル情報社会が求める国立図書館の役割
- 確率的モデルによる仮名漢字変換
- 確率的モデルによる仮名漢字変換
- 予測単位の変更によるn-gramモデルの改善
- 予測単位の変更によるn-gramモデルの改善
- 予測単位の変更によるn-gramモデルの改善
- 日本語の情報量の上限の推定
- 連語登録による形態素解析システムJUMANの精度向上
- 日本語名詞における間接照応
- 表層表現を利用した日本語文章における後方照応表現の自動抽出
- 表層表現を利用した日本語文章における後方照応表現の自動抽出
- 日本語表層表現を手がかりとした名詞の指示性と数の推定
- 日本語表層表現を手がかりとした名詞の指示性と数の推定
- キャプションと記事テキストの最長一致文字列照合による報道番組と新聞記事との対応づけの自動化
- 形態素クラスタリングによる形態素解析精度の向上
- タグ付きコーパスからの統語規則の獲得
- 新春対談 彫刻家、東京藝術大学名誉教授・顧問 澄川喜一氏 国立国会図書館長 長尾真 日本の文化力再発見
- 電子出版と国立国会図書館
- 「AIマップ-自然言語へのアプローチ」に対するコメントと回答
- nグラム統計によるコーパスからの未知語抽出
- nグラム統計によるコーパスからの未知語抽出
- 対訳文章を利用した専門用語対訳辞書の自動作成 : 訳語対応における両立不可能性を考慮した手法について
- 談話管理理論を用いた対話処理 : 名詞句の解析と生成について
- マルチエージェントシステムに対する期待
- AIマップ : 自然言語へのアプローチ
- 京都大学統合情報通信システムKUINSの基本概念とシステム設計
- 電子図書館Ariadneの開発 (5) : —電子図書館をめぐる諸問題—
- 単語リストと生コーパスによる確率的言語モデルの分野適応(言語の統計モデル)
- 単語リストと生コーパスによる確率的言語モデルの分野適応(言語の統計モデル)
- 16. 自然言語の一般理論の試み
- 特別対談 新たな文化創造とクラウド化を展望する (特集 クラウド時代における電子ブックと流通問題)
- 図解辞書とLDOCEの分野コードに基づく場面知識による英語名詞の多義性解消
- 3. 座談会 : 未来に向けての技術展望(あの技術は今… : 技術の変遷と21世紀への展望)
- 電子図書館Ariadneの開発 (2) : —データの入力と編集—
- 坂井利之先生の文化功労者顕彰を祝して
- 確率的単語分割コーパスからの単語N-gram確率の計算(音声言語)
- 生コーパスからの単語N-gram確率の推定(仮名漢字変換・形態素構文解析)
- 高等教育における教育改革と経営改善(挨拶)
- 大学教育評価をどうするか : 評価からFDへ(挨拶)
- 大学教員の教育能力をどう開発するか(挨拶)
- 21世紀社会を支える情報処理学会になるために : 会長就任にあたって
- 異分野の人との対話
- 出現密度分布を用いた語の重要説明箇所の特定
- 出現密度分布を用いた語の重要説明箇所の特定
- 情報学の明日を考える (特集 情報学の第4ステージ)
- 漢字対応の利用による日中対訳テキストの文対応付け
- 類似性に基づいた日韓対訳テキストの文対応
- 用例検索による韓日・日韓翻訳支援システム
- 日英対訳文間の構造照合
- 目次情報を利用した図書検索システム
- 日本語構文解析システム「KNP」のハングル化とそれを用いた日本語から韓国語への対照分析
- 部分文字列情報の利用による日本語単語の高速検索
- 大規模日本語テキストのnグラム統計の作り方と語句の自動抽出
- 電子図書館Ariadneの開発 (4) : —読書支援機能—
- 基調講演「電子図書館の構築」 (電子図書館時代の大学図書館の生産性(平成9年11月13日〜14日、会場:京都産業大学))
- 雑誌「自然言語処理」の発刊にあたって
- 新春対談 国立国会図書館蔵書のデジタル化とJIIMAの取組み
- 新春エッセー 国民読書年を迎えて
- ディジタルアーカイブの現状と課題
- 世界電子図書館にようこそ
- 語彙化マルコフモデルによる英語品詞タグ付け
- 形態素bi-gramと品詞bi-gramの重ね合わせによる形態素解析
- 統計によるタグ付きコーパスからの統語規則の獲得
- クラスに基づく可変長記憶マルコフモデル
- 自然言語処理 : 基礎と応用, (社)電子情報通信学会(編), 田中穂積(監修), "自然言語処理 : 基礎と応用", (社)電子情報通信学会(1999-03), A5判, 定価(本体5,400円+税)
- 国立国会図書館の現状と将来[含 質疑応答] (特集 日本図書館研究会第52回(2010年度)研究大会) -- (シンポジウム 次代を切りひらく図書館の挑戦)
- 電子図書館Ariadneの開発 (3) : —検索支援機能—
- 大震災の記録保存に努力しよう
- 類似度からの検索質問生成による効率的類似用例検索
- 国立国会図書館の現状と将来(発表4,シンポジウム「次代を切りひらく図書館の挑戦」,第52回(2010年度)研究大会)
- 科学技術コモンズと情報知識学への期待
- ITUクラブ講演 電子書籍と読書端末
- デジタル・ネット時代の知の基盤を考える
- 新年のごあいさつ : 震災アーカイブの構築と新しいサービス
- 日本的日本語処理
- 人工知能とは(4)(人工知能とは〔第4回〕)