書籍サンプルの文体を分類する
スポンサーリンク
概要
- 論文の詳細を見る
文体研究などへのコーパスの有効活用を図るため,コーパスの書籍サンプルを文体によって特徴づけることを目的に,書籍サンプルの分類指標の設計と付与を行った。対象はBCCWJ図書館サブコーパス収録の全10,551サンプルである。テキスト構造が単純(例:章節構造)なもの(全体の84%)については,内容・表現の文体的特徴により,専門度,客観度,硬度,くだけ度,および語りかけ性度,という5観点による分類指標を定め,主観的評定によって評価値を付与した。また,テキスト構造・紙面形式などの点で上記分類になじまないもの(全体の16%)を見出し,その特徴を表す別の指標を設定した。これらを通じて,図書館サブコーパスに収録される全サンプルの多種多様な形式の類型ごとの分布や,各類型のNDC ごとの頻度が明らかになった。
- 2013-06-00
著者
関連論文
- 「直接的な語り」という表現スタイルをもつ書籍テキストの人手抽出の試み (ことば工学研究会(第35回)製作、表現)
- 現代日本語書き言葉均衡コーパスの設計と検索デモンストレーション(デモンストレーション,日本語学会2007年度秋季大会研究発表会発表要旨)
- 岩波国語辞典を利用した語義タグ付きテキストデータベースの作成
- 国語辞典に「古い」と注記される語の現代書き言葉における使用傾向の調査
- 新聞記事データベースを利用した外来語の出現率の推移調査
- 計算機用日本語生成辞書IPAL (SURFACE/DEEP)の試作
- 情報処理研究とターミノロジーから見た『分類語彙表』 : 分類の体系と専門語の扱い(シソーラス : 領域知識の体系化)
- 現代日本語書き言葉均衡コーパスのサンプリング方法について〔含 質疑応答・意見交換〕 (計量国語学会第五十回大会報告) -- (研究発表会 第二部)
- IPAL名詞辞書における多義構造の記述
- 研究所報告 『分類語彙表』の特徴と位置付け
- 事例の変遷
- 書籍の文章の多様性をとらえる観点付与の設計--『現代日本語書き言葉均衡コーパス』の収録文章を対象に (ことば工学研究会(第30回)ことばのデザイン)
- 新聞でとらえる日本語の姿--記事データベースが明らかにする特徴とは (新聞のことば)
- 国語辞典における多義語の意味区分の比較 (ことば工学研究会(第23回)テーマ:ことばによる表現の可能性)
- 書き言葉コーパスで探る日本語のありさま (特集 新しい日本語)
- 共起情報の辞書記述方法 : 解析と生成の視点を同時にもつ記述方法の提案
- 和語や漢語のカタカナ表記 : 『現代日本語書き言葉均衡コーパス』の書籍における使用実態
- コーパスに基づく辞書づくり : これからの国語辞典はこう変わる
- 多義構造を辞典に書く (特集 辞典の将来像をさぐる)
- 書籍サンプルの文体を分類する
- 総体として印象を与える表現 : 「語りかけ性」を有すると判断する根拠 (ことば工学研究会(第41回)表現)
- 柏野和佳子,平本智弥 著『10分でわかる!四字熟語』 柏野和佳子,市村太郎,平本智弥 著『よんだ100人の気持ちがよくわかる!百人一首』
- 書籍テキストをその形式,内容,表現に関わる特徴によって分類する (ことば工学研究会(第41回)表現)