確率文法を用いた文書論理構造の解釈法
スポンサーリンク
概要
- 論文の詳細を見る
文書画像から論理構造を抽出するために確率文法の枠組みを応用したシステムを作成した. このシステムでは, テキスト中に存在する特定の文字列パターンから各行の属性ラベルを判定(複数あってもよい)し, その妥当性に応じてコストを付与する. 属性ラベルの隣接関係は, (属性付き) 3型文法で記述され, ラベルをノード, その遷移をリンクとするコスト付き解析グラフが作成される. このとき, 文書画像理解の結果, フォントサイズ, マージン, 行間隔などの情報が得られる場合には, それらに応じてコストを修正する. この解析グラフを探索し, 文書の論理構造をその妥当性と共に与えることができ, 解釈にあいまいさが生じる場合にも柔軟な対応を可能にする.
- 社団法人電子情報通信学会の論文
- 1996-05-25
著者
関連論文
- 剖検記録の音声認識のための言語モデル作成
- 単語クラスタリングによる確率的言語モデルの分野適応
- 電話音声による列車時刻問合せシステムの評価
- LSAにもとづく電話音声情報検索システム
- 子供音声データベース
- 構造を仮定しない文解釈の一手法
- 自由発話向け言語モデルの現状と課題
- 講義コーパスを用いた自由発話の大語彙連続音声認識(音声情報処理 : 現状と将来技術論文特集)
- 形態素係り受けモデルによる構文解析
- 2000-SLP-32-3 構文構造を反映した確率的言語モデル
- 放送大学コーパスを用いた自由発話の大語彙連続音声認識
- 口語体言語モデルのためのコーパス
- 単語を認識単位とした日本語の大語彙連続音声認識 (音声言語情報処理)
- 音声ワープロ : 過去・現在・未来
- 放送音声の書き起こしに関する検討
- 音声認識・合成によるホームページの閲覧方式
- 単語単位による日本語言語モデルの検討
- ニュース音声書き起こしシステムに関する検討
- 単語を認識単位とした日本語の大語彙連続音声認識
- 代表読み辞書を用いた交ぜ書き漢字変換
- かん字漢字変換の変換率について
- 表記変換つきの形態素解析プログラムとその応用
- 連文節かん字漢字変換
- 電話音声による列車時刻問合せシステムの評価
- 日本語自由発話電話音声からの固有表現抽出
- 音声とテキストを用いた認識単語辞書の自動構築
- 文書を作成するためのツ-ル (知的生産のための新しいツ-ル特集号)
- オンライン文字認識における後処理 : 住所・姓名の文字補完機能
- カナ姓名のペン入力後処理における予測処理について
- 単語を認識単位とした日本語大語彙連続音声認識
- 単語を認識単位とした日本語ディクテーションシステム
- 人の発声単位を考慮した日本語言語モデルの検討 : 日本語における単語とは
- 単語を認識単位とした日本語ディクテーションシステム
- 口述筆記や音声対話,音声自動翻訳に実用化されはじめた 声認識技術の基礎と応用プログラム開発手法 (特集 マルチメディア/インタ-ネット時代の必須技術となる 圧縮/認識/合成を追求する音声処理の徹底研究)
- 音声認識の最新技術--日本語ディクテ-ションプログラム
- N-gramを用いた日本語テキストの単語単位への分割
- クラスに基づく言語モデルのための単語クラスタリング
- 離散単語発生による日本語ディクテーションシステムについて
- 確率文法を用いた文書論理構造の解釈法
- 文書の論理構造を解釈する一手法
- 正規表現を辞書項目とする形態素解析辞書の構成と利用
- オンライン文字認識を用いた漢字住所入力
- Bigramによるオンライン漢字認識の文脈後処理手法
- OCR入力された日本話文の誤り検出と自動訂正
- 文書に論理構造タグを付加するシステム