The Dynamics of Morphemes in Japanese Terminology
スポンサーリンク
概要
- 論文の詳細を見る
This paper quantitatively analyses the role of morphemes with respect to their types of origin. Static quantitative analysis of a given data set is not sufficient for this aim, as language data in general and terminological data in particular have the specific characteristic of being “incomplete” in the sense that many unseen elements are expected in the theoretical population. Thus, the quantitative structure of morphemes in terminology should be analysed dynamically, by observing the growth pattern of morphemes. In order to allow for that, we use binomial interpolation and extrapolation. Results of analyses of the terminologies of six different domains follow, revealing interesting characteristics of the role of morphemes of different types of origin that do not manifest themselves through static quantitative analysis.
- 言語処理学会,The Association for Natural Language Processing,Human and Social Informatics Division, National Institute of Informaticsの論文
- 2003-07-10
著者
-
高須 淳宏
National Institute of Informatics
-
高須 淳宏
東京大学大学院教育学研究科
-
KAGEURA Kyo
Human and Social Informatics Division, National Institute of Informatics
関連論文
- 知識ベースを用いた人名検索時の曖昧性の解消(言語処理,夏のデータベースワークショップDBWS 2006)
- 知識ベースを用いた人名検索時の曖昧性の解消(言語処理)
- 外部知識を用いて同姓同名の曖昧解消
- 情報リンケージのための統計的文字列類似度
- 高さの制限された無順序木の編集距離問題に対する近似アルゴリズム
- 混合ディリクレ分布を用いた文書分類の精度について(情報融合)
- 語彙概念構造を利用した複合名詞内の係り関係の解析(システムLSIの設計技術と設計自動化)
- 文法的制約を用いた複合語解析モデルの作成
- 語基の詳細な特徴を考慮した複合語解析モデル
- 文書間類似度によるソフトウェアパターン間関連分析と複合関連の導出
- マージン最大化によるメトリック空間分割手法(一般,「ユビキタス,センサ環境におけるデータベース」,及び一般)
- 情報爆発時代の先端情報・通信技術
- 学術情報の統合に向けた大規模リンケージ基盤の構築
- 3.アカデミックリンケージ : 膨大な学術情報へのアクセスを支援するリンケージ基盤(パートII:情報分野研究者のためのオンリーワン共有イノベーションプラットフォーム,情報爆発時代におけるわくわくするITの創出を目指して)
- 6ZK-4 情報爆発時代におけるP2P情報検索向きデータ配置手法(情報爆発時代におけるストリームデータと実世界情報処理,学生セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 6J-4 情報爆発時代のための制約つきクラスタリングを用いた制約つきフィードバック手法の提案(情報爆発時代における情報検索・推薦技術およびWebコミュニティ分析,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 5J-1 Name Disambiguation Using Topics Extracted from Web Directories in Information-explosion Era
- E-014 軽量のテキスト処理による複数文書要約システム(E分野:自然言語・音声・音楽)
- P2P情報検索における索引とファイルの分散配置手法(分散ファイル・システム)
- 検索語の曖昧性解消のためのトピック指向単語抽出および単語クラスタリング
- 効率的能動学習のための能動サポートカーネルマシン(人工知能,認知科学)
- 高さの制限された2個の無順序木に対する最大共通部分木の近似アルゴリズムの改良
- 2J-3 確率モデルに基づく木の類似度のパラメータ学習について(情報爆発時代におけるマルチメディアデータと交通情報システム,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- Statistical learning algorithm for tree similarity (特集「知識発見の諸科学への応用」および一般)
- 木の編集距離の文字列の編集距離による近似
- 文書中のパターン間の文書類似度による関連分析
- 無順序木の編集距離計算のための厳密アルゴリズム
- 言語処理における尤度比の問題点:対訳コーパスからの訳語対抽出を例として
- 大規模学術情報データベースに適した情報検索システムの開発
- 情報検索サービスNACSIS-IRの新たな展開 (情報検索の新潮流)
- P2P情報検索における単語の頻度情報に基づくデータ配置手法
- 司書資格取得者に対する追跡調査 : 仕事・満足度を中心として
- 著者キーワード中での共起に基づく専門用語間の関連度計算法
- 対象の変化とデータの変化--専門用語の語彙成長研究における出来事と構造との接点を巡って
- 専門用語抽出・解析処理を考慮したコーパスの作成
- 専門分野における複合名詞の語構成要素の品詞相当カテゴリーに関する一考察
- 専門用語の語構成要素成長曲線に与える用語内語構成要素結束性の影響について
- 共著関係に基づくグラフを用いた書誌情報における著者同定手法の提案と評価(データマイニング・学習, 夏のデータベースワークショップDBWS2005)
- 共著関係に基づくグラフを用いた書誌情報における著者同定手法の提案と評価(データマイニング・学習, 夏のデータベースワークショップ2005)
- D-12-48 様々な学術論文誌OCRテキストからの書誌要素抽出(D-12.パターン認識・メディア理解A(パターンメディアの認識・理解・生成),一般セッション)
- D-008 類似検索の高速化を目的としたPivot選択手法の実験評価(D分野:データベース,一般論文)
- 2K-2 索引木の均衡を考慮した類似検索索引手法(情報爆発時代におけるアルゴリズム高率化,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 2K-1 高さ制約付き無順序木の高速類似検索アルゴリズムについて(情報爆発時代におけるアルゴリズム高率化,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 6ZC-2 コミュニティベースQ&Aからの類似質問検索手法(情報爆発時代におけるWebパーティカル検索,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 信頼度の高いタイトル情報を利用した固有ページ発見(セッション2 : Web文書の蓄積とアクセス)
- 信頼度の高いタイトル情報を利用した固有ページ発見(セッション2 : Web文書の蓄積とアクセス)
- 検索語の曖昧性を解消するキーワードの提示手法(情報推薦, 夏のデータベースワークショップDBWS2005)
- 検索語の曖昧性を解消するキーワードの提示手法(情報推薦, 夏のデータベースワークショップ2005)
- リンク情報の利用によるWeb検索性能の改善
- レコード同定問題に関する研究の課題と現状(データ工学論文)
- 非構造Peer-to-Peerシステム上でのピアの有用性に基づいた問い合わせ処理(P2P)(夏のデータベースワークショップDBWS2004)
- 検索語の曖昧性を解消するキーワードの提示手法
- 語彙の制約を考慮した複合語解析モデルの構築
- 語彙の制約を考慮した複合語解析モデルの構築
- On Some Implications of Sample-Size Dependency of Statistical Measures in Lotka-type Data to the Interpretation of Bibliometric Phenomena
- 2000-NL-138-7 対訳コーパスにおける低頻度語の性質 : 訳語対自動抽出に向けた基礎研究
- NLC2000-16 対訳コーパスにおける低頻度語の性質 : 訳語対自動抽出に向けた基礎研究
- 日本語専門分野テキストコーパスからの複合語用語の抽出(抽出)
- 文法パターンに基づく用語抽出モデルの構築(言語理解とコミュニケーション一般)
- 語彙概念構造を利用した助詞「に」に関する複合名詞の分析
- 語彙概念構造を利用した助詞「に」に関する複合名詞の分析
- 総理大臣国会演説における基本的文体特徴量の探索的分析
- 総理大臣演説における語彙多様性の変化(セッションN-13(MK301) 一般セッション 言語)
- コミュニケーションメディアの情報伝達性能の包括的比較
- 日本語専門語彙の有契性構造の分析
- 言語の工学--言語実務専門家の実践と言語の科学の間で (特集 言語処理研究の新展開--計算機と言語学の対話に向けて)
- 生きた言葉と図書館の課題 : 粗悪言語を売りつけられる時代に : 2007年11月8日、臨光館204番教室において
- 近代的主体の成立と図書・図書館による近代の存立
- 日本語専門語彙の構成における外来語語基の位置づけ
- いわゆる順位頻度分布と頻度度数分布との関係について : Baayen(2001)からの紹介を中心に(短信)
- 自然言語処理と言語実体化の効用 (特集 空の言語学--言語に実体はあるか)
- 未出現事象の比率を推定する--Good-Turing推定の直感的意味付け
- The Dynamics of Morphemes in Japanese Terminology
- 書評 伊藤雅光著『計量言語学入門』
- 頻度情報を用いた類似文字列検索のための可変長N-gram
- 頻度情報を用いた類似文字列検索のための可変長N-gram
- メモリ上の全文検索システムのためのデータ構造と処理の効率化
- Suffix Array による可変長N-gramを用いた類似文字列検索
- 距離尺度の組み合わせによるTop-k検索の提案
- メトリック空間における最近傍ペア探索アルゴリズムの高速化
- 学会記事 第48回日本図書館情報学会研究大会シンポジウム記録--21世紀に向けての図書館技術の展望と課題
- 名詞の分布特徴量を用いた政治テキスト分析
- 書評 Harald Baayen著Word Frequency Distributions
- 学術文献画像の書誌情報の近似マッチング法
- 荻野の「新出確率推測法の提案」についての追加ノート
- 複合名詞の語構成要素間の結合関係に関する考察 : 文法的特性に基づく品詞相当カテゴリーの評価
- 荻野の「新出確立推測法の提案」について
- 軽量のテキスト処理による部分類似単語列検出手法(「自動化:推論,発見,学習,データマイニング」及び一般)
- 戦後日本における印刷メディア受容量変化の数量的検証
- 戦後日本における印刷メディア受容量変化の数量的検証
- プローブカーデータを用いた自動交通異常検出 (ITS研究会 交通センシング,通信,情報処理,一般)
- プローブカーデータを用いた自動交通異常検出 (ITS)
- CRFによる和英文の参考文献文字列からの自動書誌要素抽出
- 翻訳を通して「言葉」を見ると?