特許抄録に出現する多字種複合語に対する字種に基づく解析part.1- 多字種複合語の抽出と構成字種の解析 -
スポンサーリンク
概要
- 論文の詳細を見る
日本語の科学技術文献のテキストにおいて,主要な概念,テーマは多字種複合語で表現されることが多い.特に学術論文,特許明細書などの専門性の高い文書では,複合語表現が文章中に多々出現する.1993年度の公開特許データベースの抄録から、著者らにより開発された抽出プログラムにより約16万語の多字種複合語を抽出した。さらに人手により非名詞を除去し、約13万語の多字種複合語を得た。Part1では、これらの多字種複合語について字種構成の観点から分析し、さらに辞書見出し語のそれと対比した.結果として,構成字種数2〜4で累積98%に達する,先頭字種が日本語である場合,英数字や記号よりも構成数は少なくなる,対象となる文書によって出現頻度は大きく異なる,といった特性が明らかになった.
- 2011-11-14
著者
関連論文
- 情報科学教育におけるノートPC利用の研究
- 神奈川大学理学部情報科学科におけるノートパソコンを利用した情報教育の試み
- 用語知識ベースのための編集機能の試作
- 意味関係を有する大規模知識ベースに対する仮想3次元表示方法の研究(2004年度神奈川大学総合理学研究所助成共同研究)
- 階層関係自動抽出法の改善に関する検討
- D-38 意味関係に基づく概念構造生成に関する検討 : 階層関係自動抽出法の改善(辞書・シソーラス,D.データベース)
- 概念構造生成のための階層関係自動抽出法に関する検討(情報・知識)
- SS-KWEIC法を用いた用語間の階層関係自動抽出に関する検討
- アミノ酸配列研究用データベースの試作
- 匂い受容体の機能解析を目指したバイオインフォマティクス(2003-2004年度神奈川大学共同研究奨励助成論文)
- 重複を除いた蛋白質データベースにおける3アミノ酸組の出現数の頻度分布
- N. 安全用語を対象とした Java による索引支援ブラウザーの試作
- A-4. 安全用語データベースを対象としたシソーラスブラウザーの試作
- 安全問題に関する重要語の収集・評価のための事例研究 : 高コレステロール血症薬 Lovastatine を事例とした頻度分析による安全用語の評価(II 原報)
- 安全研究に関する重要語の収集・評価のための事例研究 : "Lovastatine"に関する文献を事例とした出現頻度分析による安全用語の評価 ()
- 辞書見出し語の9,10文字漢字熟語を対象とした語基構成の解析(含意関係認識・解析・語彙)
- 辞書見出し語の8文字漢字熟語を対象とした語基構成の解析(単語・事象・オントロジー)
- 辞書見出し語の7文字漢字熟語を対象とした語基構成の解析(単語・語彙(II))
- 辞書見出し語の6文字漢字熟語を対象とした語基構成の解析(単語・語彙(I))
- 情報知識学会 専門用語研究部会主催 : 第13回専門用語研究シンポジウム
- 3次元仮想空間における概念関係の視覚化モデル
- 階層構造をもつ用語データのためのBrowsing Tool
- 大規模複合語データに対する構成字種解析
- 特許抄録に出現する多字種複合語に対する字種に基づく解析part.2- 字種変化パターンの解析 -
- 特許抄録に出現する多字種複合語に対する字種に基づく解析part.1- 多字種複合語の抽出と構成字種の解析 -
- 特許抄録に出現する多字種複合語に対する字種に基づく解析part.1- 多字種複合語の抽出と構成字種の解析 -
- 特許抄録に出現する多字種複合語に対する字種に基づく解析part.2- 字種変化パターンの解析 -
- 階層構造を有する知識構造に対する仮想3次元表示の実行時間の計測
- 用語知識ベースブラウザー機能拡張 : XMLデータベース化、入出力の高速化、編集機能の強化(2002年度共同研究プロジェクト)
- O. 用語知識ベースのための編集機能の試作 : 用語属性・階層構造の編集
- P. 思考支援ツールとしてのアウトラインプロセッサの機能比較
- M. Java によるシソーラスブラウザーの試作
- 辞書見出し語中の複合語を対象とした字種変化特性の分析
- 特許抄録中の複合語を対象とした字種変化特性の分析