再現性を考慮した文字列に基づく統計的言語モデル
スポンサーリンク
概要
- 論文の詳細を見る
本報告では, 知識に依存しない, 高い曖昧性削減能力を持つ新しい言語モデルを提案する. このモデルはsuperwordと呼ぶ文字列の集合の上のn-gramとして定義され, 従来の単語や文字列のn-gramモデルを包含するものになっている. superwordは訓練テキスト中の文字列の再現性のみに基づいて定義される概念であり, Forward-Backwardアルゴリズムによって学習される. 実験の結果, superwordに基づくモデルと文字のtrigramモデルを複数融合させたモデルの優位性が示され, 形態素解析に基づく方法を上回る性能が得られた.
- 社団法人電子情報通信学会の論文
- 1997-12-12
著者
-
阿曽 弘具
東北大学大学院工学研究科
-
牧野 正三
東北大学大学院工学研究科
-
森 大毅
宇都宮大学工学部
-
牧野 正三
東北大学大型計算機センター:大学院情報科学研究科
-
阿曽 弘具
東北大学大学院工学研究料
-
森 大毅
東北大学大学院工学研究科
関連論文
- 2値化とエッジ抽出による情景画像からの高精度文字列検出(画像認識,コンピュータビジョン)
- ベクトル空間へのグラフの埋め込みによるシルエット画像認識
- 編集距離と多次元尺度構成法によるシルエット画像認識(一般セッション11)
- 編集距離と多次元尺度構成法によるシルエット画像認識(一般セッション4,三次元画像,多視点画像)
- 輪郭の伝搬によるCT画像からの歯の半自動形状復元(研究速報)
- (332)工学教育プログラム基準強化活動(第1報) : コアリッションによる工学教育の相乗効果(セッション97 工学教育の個性化・活性化IX・国際化時代における工学教育V)
- 記憶容量制限下において手続き的知識を獲得する連想記憶モデル
- H-004 手続き的知識を獲得する連想記憶モデル(H.生体情報科学)
- 手続き的知識を獲得する連想記憶モデル
- 重み付き最小共通スーパーグラフを用いたシルエット画像認識