日本語科学技術文における専門用語の自動抽出システム
スポンサーリンク
概要
- 論文の詳細を見る
科学技術文献の機械翻訳に関する研究の進展に伴い, これに用いる専門用語辞書の開発が望まれている. しかし, 専門用語はその数が膨大である上に新しい用語の出現数も多いことから, 人手だけでこれを収集することは困難であり. 収集の機械化が必要である. 本論文では, 日本語の専門用語を自動収集するために作成した, 日本語科学技術文から専門用語を自動抽出するシステムについて報告している. この専門用語の自動抽出システムでは, まず付属語辞書と一部の自立語を収めた小規模な特殊自立語辞書を用いて粗い形態素解析を行ったのち, 文法情報を利用して専門用語の候補を求め, 次に一般用語辞書を参照して専門用語を抽出するという方法を用いている. この方法の有効性については, 日本科学技術情報センターの科学技術文献速報を対象に実験を行い, 入力文中の専門用語の98.3%を, 97.1%の精度で抽出できることを確認した.
- 1986-01-15
著者
-
吉村 賢治
福岡大学工学研究科情報・制御システム工学専攻
-
吉田 将
九州芸術工科大学
-
吉田 将
九州工業大学情報工学部創設準備室
-
日高 達
九州大学工学部電子工学科
-
吉田 将
九州大学工学部
-
吉村 賢治
福岡大学工学部電子情報工学科
-
吉田 将
九州工業大学
-
日高 達
九州大学工学部
-
吉村 賢治
福岡大学工学部電子工学科
関連論文
- 格助詞「に」の深層格推定 : モデル検証と固有名詞対策
- 中間言語方式による日本語述部の英訳について
- 格助詞「に」の深層格に基づく日英機械翻訳について
- 連語データを利用した仮名漢字変換
- 概念の連鎖反応モデル
- 文の解析と合成(その1)
- 共起関係データの今後の研究について
- 表層表現に基づく文章構造解析を利用した論文改訂支援システムの試作と評価
- 逐次変換方式による韓日翻訳ツールの試作
- 信念の翻意を考慮した確率信念システムによる対話モデル
- 表層表現に基づく文章構造解析による論文改訂支援システムの試作
- 場面の情感を考慮したBGMの自動生成システム
- 概念間の外見的な類似性と心理的な評価を利用した比喩表現の生成
- テンス・アスペクトを考慮した物語文章における事象間の時間関係の抽出
- テンス・アスペクトを考慮した物語文章における事象間の時間関係の抽出
- 概念間の情緒的類似性を考慮した比喩表現の生成
- 日本語文生成における親疎表現の取り扱いについて
- 日本語文生成における待遇表現の取り扱いについて
- 視点を考慮した文生成にむけて
- 語義文からの動詞間の上位-下位関係の抽出
- 三つ子の魂百まで : 学際的・複合的教育について
- 語義文における動詞間の上位-下位関係
- 語義文からの動詞の上位-下位関係の抽出
- 語義文における動詞間の上位-下位関係
- 確率文節文法とその応用
- ブラケット文法--句構造言語を特性化する文脈自由文法
- 辞書構築における諸問題 (計算言語学)
- 語義文の表記的特徴に着目した形態素解析用辞書に関す基礎的考察
- 5. 自然言語処理から感性情報処理へ (九州発21世紀へのメッセージ)
- 語義文の機能表現について
- 国語辞典に基づくシソーラスと単語の意味分類に関する一考察
- 国語辞典に基づくシソーラスの構築に関する一考察
- 自然言語の機械処理について-概念の連結構造に関する基礎的考察-
- 日英機械翻訳のための述部処理システム
- 自然言語情報処理データ・ベース : 自然言語の標準化
- 日本語の機械処理--日本語文の標準形分解
- 助述表現の意味的類似度判定
- 機械翻訳システム開発における諸問題
- 1CD-Linuxを用いたグリッド環境の構築と検証
- パネル討論会 : 自然言語処理の現状と課題 : 第57年後期第25回全国大会報告
- Computer Science Unpluggedの教員免許更新講習での活用事例
- 日本語科学技術文における専門用語の自動抽出システム
- 拡張B-treeと日本語単語辞書への応用
- 日本語処理のための機械辞書
- TSS環境におけるPascalの幾つかの教具
- Computer Science Unplugged の教員免許更新講習での活用事例
- 言語処理系の生成系MYLANGによるNBSG/PDプリコンパイラの試作
- ガーベッジコレクションを必要としない文字列処理機構
- 準最適テキスト圧縮符号
- 科学技術論文抄録における単語の統計的性質
- 英文テキスト圧縮についての一考究
- 日本語文末表現の言い換え
- 日本語文末表現の取り扱いについて
- E_038 日本語文末表現の取り扱いについて(E分野:自然言語)
- キーワードの活性度の変化を用いたテキストセグメンテーション (2000年情報学シンポジウム--ネットワーク型情報メディアの活用と情報を活かす新技術) -- (セッション5:情報検索・情報抽出)
- 依存構造に基づく言語表現の意味的類似度
- 単文内での共起情報を用いた同音語処理
- 確率文節文法による形態素解析実験について
- 単語の造語モデルを用いた単語の生起確率の推定
- 自然言語処理
- 機械翻訳のための構文解析手法 (機械翻訳)
- ブラケット文法
- 日本語確率文法とその解析アルゴリズム
- ブラケット文法の構文解析法
- ブラケット文法による句構造言語の特性化
- 文節数最小法を用いたべた書き日本語文の形態素解析
- 格助詞「に」の深層格推定 : 格助詞の意味再考(含意関係認識・解析・語彙)
- 非命題的意味解析のための日本語文末表現意味体系
- 意味構造を介した日本語文末表現の英訳
- 日本語連語候補に対する情報付与について
- 大規模MWEデータベースを組み込んだ形態素解析システム
- 非命題的意味解析のための日本語文末表現意味体系(「主観表現処理の最前線」シンポジウム)
- 日本語連語データの整備
- 日本語述部における日英翻訳システム
- 意味理解のための日本語構文解析 : 係り受け関係の表示
- 日本語文分かち書きのための新しい枠組み
- 日本語文における態の処理について--格変換と補文の抽出
- 名詞間の類似度および述語性表現の一般化
- 課題遂行時の周辺視野における色と動きの検出範囲(日本基礎心理学会第27回東北大会,大会発表要旨)
- 電子掲示板コーパス作成について
- 助述表現とその言い換え
- ジェフ・ホーキンス, サンドラ・ブレイクスリー著, 伊藤文英訳, 考える脳考えるコンピューター, ランダムハウス講談社, (2005), 原著: Hawkins, J. with Blakeslee, S., On Intelligence, Times Books (2004)
- 曖昧な文節区切りに対応したかな漢字変換評価用テキストデータ
- Lebenstein距離算出のための表示プログラム
- 依存構造に基づく言語表現の意味的類似度
- 2漢字語の解析における優先順位の決定について
- 日本語形態素解析のための派生文法
- 古文の形態素解析システム
- 2漢字語の解析
- 未登録語を含む日本語文の形態素解析
- 日本語の構造とその解析 (計算言語学)
- 日本語技術文における並列構造
- 制御機構を有する表方式の形態素解析--基本アルゴリズム
- 日本語の機械処理のための並列構造の調査
- 関係表現,助述表現の類似度を考慮した言語表現間の意味的類似度判定
- 日本語処理のための固定的共起表現辞書
- 深さ優先探索とスタックの利用を学習するCSアンプラグド教材の試作
- 日本語文の係り受け構造表示プログラム
- 漸次的に単語部分木を出力する音声認識システム
- E-034 漸次的な発話理解のための単語部分木を出力する音声認識システム(E分野:自然言語・音声・音楽)