Nグラムモデルによる、日本語単語の並べ換え実験
スポンサーリンク
概要
- 論文の詳細を見る
我々は、日本語の統計的言語モデルについて研究を行なっている。その手始めとして、単語のnグラムモデルが、どのくらい強力であるかを、「ランダムに並べられた単語列からもとの文を推定できるか」という観点で調べた。この実験は、Brownらによって、"bag translation"と呼ばれたものである。彼らは、音声認識用に用意されたtrigramモデルを用いた。100文のテスト文のうち、長さが11語未満の38文について、全く同じ文が再現されたものが24文(63%)、また、語順は異なるが、意味が同じ文に再現されたものが32文(84%)であったという。我々の実験では、長さが10語の文1000文について、2-gramモデルで24%、3-gramモデルで、39.4%の再現率を得た。この結果は、英語で効果力確認された単純な統計的言語モデルが、大方の予想に反して、日本語においても同程度にうまく働くことを示唆している。
- 一般社団法人情報処理学会の論文
- 1994-09-20
著者
関連論文
- 制約伝搬アルゴリズムを用いた日本語文の解析
- 2 Web Servicesによる動的な電子商取引の実現 : SOAP/WSDL/UDDI (グローバルネットワーク社会を構築するXML)
- 平成19年度情報処理学会喜安記念業績賞を受賞して : 受賞業績 Webサービス技術の基盤確立と標準化,ならびに普及への貢献(平成19年度喜安記念業績賞紹介)
- ACM国際大学対抗プログラミングコンテスト世界大会報告
- Global Innovation Outlook : 今後のイノベーションはどこへ向かうか(企業情報システムの過去・現在・未来特集号)
- Webサービスの将来(Webサービス)
- Webサービスの系譜(Webサービス)
- 電子メールを利用したエンドユーザ向けのプログラミング環境
- XML[IV・完] : Webサービス
- XML暗号化とその実装
- e-businessを支える情報技術 : B2BからWebサービスヘ
- 5P-3 ASN.1/XMLトランスレータ
- 事例ベースに基づく自然言語処理
- 情報検索システムにおける効果的なナビゲーション機能の提案
- 電子図書館IV : ナビゲーションシステムプロトタイプ
- 電子図書館III : Information Outlining : 触ってわかる情報の輪郭
- 電子図書館II : 基本設計
- 電子図書館I : 将来像
- Nグラムモデルによる、日本語単語の並べ換え実験
- 「AIマップ-自然言語へのアプローチ」に対するコメントと回答
- 正規文法に基づく日本語形態素解析
- 日本語形態素解析のための後戻りしない辞書アクセス方法
- 自然言語処理技術の最近の動向 自然言語処理における曖昧さとその解消 (<特集>自然言語処理技術の最近の動向)
- OCR入力された日本話文の誤り検出と自動訂正
- RSAチップによるSSLの高速化実験
- Javaにおけるインテグリティモデル
- 主にJava及びActiveXにおけるコード署名の安全性に関する考察(特集・インターネット)
- オブジェクトサイニングについての考察
- PDA上に実装したセキュアトークン
- 最大グラフ・マッチングによる談話理解
- 招待講演:e-Businessを支える情報技術B2BからWebサービスへ (2001年情報学シンポジウム講演論文集--21世紀の情報化社会・ネットビジネスを支える情報学/情報技術) -- (セッション5:情報技術の視点から)
- パネル討論「統計的言語処理/音声言語処理における大規模言語データベースの利用」
- パネル討論「統計的言語処理/音声言語処理における大規模言語データベースの利用」
- 4V-3 XMLを用いたアプリケーションの構築法 : 旅程表作成システムを例に
- 4V-2 XMLを用いたアプリケーションの構築法 : Java Beansによるフレームワーク
- 対話的日本語解析環境 : JAWB
- InfoBus Repeater : A Java-based Publish/Subscribe Middleware
- Java用Publish/SubscribeミドルウエアSecure Distributed Info Busの設計と実装
- Java用Publish/SubscribeミドルウェアSecure Distributed InfoBusにおける鍵配送プロトコル
- 文脈を考慮した自然言語文の入力
- 日本語における文節間係り受け関係の統計的性質
- 制約依存文法とその弱生成力
- 階層的フィルタリング
- 高橋延匡 編, 石綿敏雄, 西村恕彦, 田中穂積, 菊池光昭, 藤崎哲之助 共著, "日本語情報処理", 近代科学社, A5判, 256p., \3,200, 1986