「決定木」分析によるコーパス研究の可能性 : 副詞と共起する接続助詞「から」「ので」「のに」の文中・文末表現を例に
スポンサーリンク
概要
- 論文の詳細を見る
SPSS社のAnswerTree3.0Jに搭載されたCHAIDで決定木を描く統計手法が、コーパスから得られる2つ以上の変数からなる共起頻度を分析するのに有効であるかどうかを検討した。本研究では、3種類の接続助詞「から」「ので」「のに」が、7種類の副詞「何しろ」「何せ」「せっかく」「現に」「どうせ」「実際」「本当に」と共起する場合に、文中と文末の表現でどちらが使われるかを、新潮文庫の100冊を使って解析した。決定木(図1を参照)は、3種類の接続助詞と7種類の副詞の共起頻度によって、接続助詞の位置が文中にくるか文末にくるかを予測するという分析結果を描いたものである。決定木から5つの特徴を読み取ることができる。まず第1に、接続助詞「ので」と「から」が副詞との共起頻度において文中・文末で顕著な違いを示した。「ので」は文末ではほとんどみられず(5回あるいは4.59%)、「から」は頻繁にみられた(220回あるいは31.56%)。第2に、副詞「何しろ」と接続助詞「から」がもっとも典型的な文末表現であることが分かった(この種の組み合わせの合計324回のうち140回あるいは43.21%)。第3に、接続助詞「から」と副詞の「せっかく」の共起は、かなりあるものの、文末では非常に少ないことも分かった(この種の組み合わせの合計67回のうち6回あるいは8.96%)。第4に、接続助詞「から」と副詞「何せ」「現に」「どうせ」「実際」「本当に」はいずれも、文中・文末にほぼ同じようなパターンで共起していることも示された。第5に、接続助詞「のに」は副詞の文中・文末の共起パターン(文中が78.82%、文末が21.18%)が、全体の共起頻度(文中が72.73%、文末が27.27%)と類似していた。以上のように、AnswerTree3.0Jによる決定木の手法は、複数の変数からなる共起頻度データを構造的に分析することができ、今後のコーパス研究において有効な手段の一つとなるであろう。Using 'decision tree' drawn by a statistical algorism CHAID in SPSS AnswerTree3.0J, the present study investigated the collocation frequencies of three conjunctive particles(kara, node and noni) appearing in the middle of at the end of sentences, with seven selected adverbs(nanishiro, nanise, sekkaku, gen'ni, doose, jissai, and hontooni). Collocation frequencies were taken from the corpus of the Shinchoo Bunko Collection of 100 Novels. Analysis results depicted in the decision tree predict two different particle positions(middle and end) of three conjunctive particles appearing with the seven adverbs. Five noteworthy collocation tendencies were observed. First, the conjunctive particles node and kara showed distinctive differences in the middle and ending positions when appearing with the adverbs: node was seldom seen at the end of sentences(5 times, or 4.59%), while kara was often seen at the end (220times, or 31.56%).Second, the combination of the adverb nanishiro and the conjunctive particle kara occurred most frequently at the end of sentences(140 out of 324 times, or 43.21%). Third, although kara occasionally appeared with the adverb sekkaku, this combination was seldom observed at the end of sentences(6 out of 67 times, or 8.96%). fourth, the conjunctive particle kara showed a similar pattern of collocation frequencies in the middle and at the end of sentences when combined with the five adverbs nanise, gen'ni, doose, jissai and hontooni.Fifth, the conjunctive particle noni appeared in the middle and at the end of sentences(78.82 0n the middle and 21.18-0x1.47b00bfff994p-149t the end), similar to the overall percentages of the conjunctive particles(72.73-1073777684n the middle and 27.27 0x0.006c8000006c9p-1022t the end). As such, in structurally depicting the collocation frequencies of conjunctive particles and adverbs, 'decision tree' analysis has considerable potential as a statistical approachi in duture collocation studies.
- 言語処理学会の論文
- 2006-04-10
著者
関連論文
- 国語科教科書を基にした小・中学校の文章難易学年判定式の構築
- 第二言語としての日本語のテンス・アスペクト形態素の「形」の習得に影響する要因
- 韓国語母語話者による和製英語の理解
- アメリカ人は和製英語をどのぐらい理解できるか--英語母語話者の和製英語の知識と意味推測に関する調査
- 日本語の音韻組立処理を検討するための心理実験法
- 書字行動からみた言語の認知・学習過程に関する研究 : 書字行動測定用ソフトウエア開発の試み
- 留学生指導部門:各種オリエンテーションの充実と平成11年度指導部門活動報告
- 第二言語としての「テイル」の習得における語彙・文法能力の役割
- 漢字の読みの習得に関する時系列分析 : 入門期の非漢字圏日本語学習者を対象に
- 名詞句と能動文におけるコロケーション頻度の影響(人間による言語理解・言語処理)
- 文処理における統語的プライミング効果(セッション4)(人間による言語理解・言語処理)
- 語彙指標数値と文章主観評価の関係 : 日本人大学生による2種類の書き言葉コーパスを使った実証研究
- 中国語系および英語系日本語学習者の母語の表記形態が日本語の音韻処理に及ぼす影響
- 日本語母音の声音ハイエラーキ
- 中国語を母語とする日本語学習者によるかき混ぜ語順の文理解--聴解能力で分けた上位・中位・下位群の比較
- 韓国語を母語とする日本語学習者による漢字の書き取りに関する研究--学習者の語彙力と漢字が含まれる単語の使用頻度の影響
- 日本語と韓国語の第三者待遇表現-聞き手の違いが他称詞と述語待遇選択に及ぼす影響-
- 中国語を母語とする日本語学習者の文法知識が敬語習得に及ぼす影響
- かき混ぜ文の処理における格助詞の影響(セッション3)(人間による言語理解・言語処理)
- 韓国語を母語とする日本語学習者の敬語使用における知識と運用
- エントロピーと冗長度で表現の多様性と規則性を表す試み--韓国語系日本語学習者の敬語表現を例に
- 「良妻ぶる」妻は「悪妻」か--接尾辞「ぶる」付加による価値評価の転換と収束
- 「良妻ぶる」妻は「悪妻」か : 接尾辞「ぶる」付加による価値評価の転換と収束
- 上級レベルの中国語系日本語学習者と韓国語系日本語学習者の敬語習得の比較
- 待遇表現の適切性判断における地域差、世代差および男女差の影響
- 外国人が用いた待遇表現に対する中国地方在住の日本人の評価
- ひらがな対カタカナ
- 平仮名と片仮名の処理における感覚弁別および感覚識別機能
- 新聞と小説のコーパスにおけるオノマトペと動詞の共起パターン (特集 コーパスを活用した言語研究(2))
- 第二言語としての「テイル」の習得におけるプロトタイプの形成
- 自然習得の恩恵--日本語の短縮語復元課題における中国と日本の学習環境の比較
- 文解析実験による日本語副詞類の基本語順の判定
- 「文理解の認知メカニズム」編集にあたって
- 「決定木」分析によるコーパス研究の可能性 : 副詞と共起する接続助詞「から」「ので」「のに」の文中・文末表現を例に
- Japanese ESL Student Correctness Decisions for Noun Phrases Exhibiting Short and Long Distance Adjective Disordering
- 2005年度後期留学生支援調査『自由記述』への対応に関する報告 (活動報告 留学生指導部門)
- 2005年前期・後期の2回の留学生支援調査より:広島大学留学生支援調査『満足度指標』の分析結果報告 (活動報告 留学生指導部門)
- 平成17年度広島大学留学生センター指導部門活動報告および広島大学留学生支援調査の結果報告 (活動報告 留学生指導部門)
- フォーラム 日本文の処理におけるスクランブル効果の諸問題--Koizumi and Tamaoka (2004)に対するMiyamoto and Nakamura (2005)のコメントへの回答
- 日本語語彙テストの開発と信頼性--中国語を母語とする日本語学習者のデータによるテスト評価
- 韓国語を母語とする日本語学習者の語彙知識がオノマトペの習得に与える影響
- 韓国の職場での呼称使用の適切性判断に及ぼす属性・対人関係特性・性格特性の影響
- 日本語の学習環境と日本的習慣を表現した熟語の知識との関係
- 命名課題において漢字1字の書字と音韻の単位は一致するか
- 日本語版Can-do Scaleはどれくらい正確に日本語能力を測定しうるか
- サンズイとイトヘンはどのくらい漢字の意味に影響するか
- 中国語を母語とする日本語学習者による正順・かき混ぜ語順の能動文と可能文の理解
- フォーラム 日本語二重目的語構文の認知解析
- Where do statistically-derived indicators and human strategies meet when identifying On- and Kun-reading of Japanese kanji
- 就学前5歳児を対象とした聴覚性文理解テストの作成
- 日本語と韓国語における呼称選択の適切性
- 資料 満足度調査の報告と他目的留学生支援調査の構想 広島大学留学生センター主催 講演・討論会発表資料
- OCP effects on Japanese phonological processing
- 漢字二字熟語の書字行動における語彙使用頻度および書字的複雑性の影響
- 読みの発達における条件づけ・理解・記憶
- 成績不振に影響する認知処理能力--私達は何ができるのか?
- 読みの認知・感情・自動化
- Measuring intelligence of minority children in Canadian multicultural contexts
- Gender differences in learning styles of Cree, Dene and Metis students
- Historical development of learning styles inventories from dichotomous cognitive concepts of field dependence and field independence to multi-dimensional assessment
- 漢字熟語の再認記憶における文脈変動性の効果
- 記述式試験解答に対する答案としての評価と日本語力からの評価 : 語彙力を中心に(日本語リメディアル教育とは)
- P-41 日本語の音韻組立処理における脳機能部位の同定(ポスター発表)
- 韓国の職場での呼称使用の適切性判断に及ぼす属性・対人関係特性・性格特性の影響
- 日本語語彙テストの開発と信頼性 : 中国語を母語とする日本語学習者のデータによるテスト評価