漸進的学習機能を備えた日本語形態素解析
スポンサーリンク
概要
- 論文の詳細を見る
形態素解析の結果は、一般に一意には定まらず、瞹昧性を持つ。そのため、複数の候補の中から最も確からしい候補を選択する手法が提案されている。しかし、これらの手法を用いても、すべての環境に対し必要な知識を予め得ることが実際的に不可能である以上、すべての入力に対し正確を与えることはできない。このために、ユーザと対話することによって正解を得る手法が提案されている。"自然言語処理システムは完壁ではありえない"という前提においては、対話機能は"逃げ道"ではなく基本的機能であるといえる。さらに、ユーザが局所的情報を与えることで、システムに蓄積されている知識を有効にかつ大局的に利用できるという点で積極的意味合いを持つ。しかし、実用的な観点から見ると、対話のコストは無視できるものではない。対話の効率化を図るためには、ユーザが与えた情報を有効に活かすように学習する機構が必要である。学習することによってシステムがユーザの環境に適応すれば、精度は向上し対話の回数は減少する。学習機構を持たなければ、処理系は同じ間違いに対し常に同じ誤った結果を与えてしまう。つまり、全く同一の誤りに対して解析の都度ユーザは教えることを繰り返さなければならない。
- 一般社団法人情報処理学会の論文
- 1992-02-24
著者
-
野美山 浩
日本アイ・ビー・エム株式会社東京基礎研究所
-
荻野 紫穂
日本アイ・ビー・エム(株)東京基礎研究所
-
荻野 紫穂
日本アイ・ビー・エム株式会社東京基礎研究所
-
荻野 紫穂
日本ibm株式会社東京基礎研究所
-
野美山 浩
日本アイ・ビー・エム 東京基礎研
-
荻野 紫穂
日本アイ・ビー・エム
関連論文
- 大規模日本語テキストからの依存構造の抽出
- 剖検記録の音声認識のための言語モデル作成
- 構造を仮定しない文解釈の一手法
- 形態素係り受けモデルによる構文解析
- 単語単位による日本語言語モデルの検討
- 単語を認識単位とした日本語の大語彙連続音声認識
- 岩波国語辞典を利用した語義タグ付きテキストデータベースの作成
- テキストマイニング技術を用いた企業評価分析 : 倒産企業の実証分析
- 開発者の視点からの機械翻訳システムの技術的評価 : テストセットを用いた晶質評価法
- 情報検索システムにおける効果的なナビゲーション機能の提案
- 電子図書館IV : ナビゲーションシステムプロトタイプ
- 電子図書館III : Information Outlining : 触ってわかる情報の輪郭
- 電子図書館II : 基本設計
- 電子図書館I : 将来像
- 正規文法に基づく日本語形態素解析
- IBM電話音声自動応答システム(音声処理技術のデモの紹介)
- コーパスからの対訳辞書の半自動生成
- 抄録からのキーワードの自動抽出
- 抄録からのキーワードの自動抽出
- 抄録からの主題文の自動抽出
- 構文情報を用いたキーワード抽出
- リストのラベルとして使われる丸括弧とリストの範囲
- 形式的でない表現における"ん""ちゃ""じゃ""きゃ"の接続上の性質
- "「」"で括られた表現の接続と係り受けの性質
- サイト・アウトライニング : インターネットからの情報収集と可視化技術
- テキスト情報の可視化を利用した情報検索(「ビジュアルな情報検索」編集にあたって)
- 翻訳精度評価手法BLEUの日英翻訳への適用
- 重要文と要約の差異に基づく要約手法の調査
- 単語を認識単位とした日本語大語彙連続音声認識
- 単語を認識単位とした日本語ディクテーションシステム
- 人の発声単位を考慮した日本語言語モデルの検討 : 日本語における単語とは
- 表層的な文脈情報を用いた自然な文生成の試み
- 知識ベースを利用した機械翻訳システムShalt2 ( 自然言語処理の実動システム)
- 日本語における付属語の現れ方と規則
- 英日機械翻訳システムShalt2の日本語生成文法
- 英日機械翻訳システムShalt2における並列句の取り扱い
- 日本語形態素解析用文法規則の使用状況
- 個人適応型情報検索システム : 個人の興味を学習する階層記憶モデルとその協調的フィルタリングへの適用
- テキストデータを用いた問題の早期発見手法(意味表現・データマイニング)
- 読点を伴う連体修飾の係り先
- 新聞記事データベースからの話題の抽出II-話題の構造の解析
- 新聞記事データベースからの話題の抽出
- 情報量から見た自然言語処理システムに対する考察
- 漸進的学習機能を備えた日本語形態素解析
- テキストからの知識獲得支援ツール
- 日本語における文節間係り受け関係の統計的性質
- IBMプロフェッショナル論文 コールセンターのログデータを用いた製品等の不具合の早期発見
- 情報獲得のパラダイムとしてのInformation Outlining (「1997年情報学シンポジウム」プログラム--人と情報学の調和をめざして) -- (マルチメディア技術2(情報の高度利用に向けて))
- テキスト分析技術を用いた開発関連文書の文書品質の定量化(テーマセッション)
- 情報科学・工学, 私はこう考える : 自然言語処理, 私はこう考える
- 形態的情報を使った日本語辞書情報の整備
- 事例の一般化による機械翻訳
- ソフトウェア開発における文書成果物の分析技術とその活用