Various Problems Concerning the Construction of a WWW Japanese-Language Corpus― The Current State and Future Prospects of Japanese-Language Corpus Research ―
スポンサーリンク
概要
- 論文の詳細を見る
The objective of this paper is to discuss various problems that arise when Japanese-language text that is circulating on the World-Wide Web (WWW)is utilized as a corpus. First of all, our review of previous research relating to Japanese-language corpora showed that research into the application of the WWW as a Japanese-language corpus has still not been tackled sufficiently. We then studied all of the research papers that were presented at national conventions over a two-year period for one Japanese academic society relating to information and education. As a result, it became clear that although there have been several research projects into the use of text-mining methods, there has been almost no research relating to WWW Japanese-language corpora. In the light of these findings, we considered the various problems that might arise during research into WWW Japanese-language corpora. In other words, some of the points that we need to consider include: 1) sample bias, 2)the self-images projected by authors, 3)proof of the validity of such contents, 4)the large numbers of submissions by the same people, 5)the fact that data management including the revision and update of such contents is often done at the individual level, and 6)plagiarism of written works and quoting from other sites. Thus, although sample bias does remain, we can say that the Internet gives us the first opportunity in history to accumulate vast quantities of personally-published data. We have become able to utilize the Internet both quantitatively and qualitatively as a modern intellectual resource. Once we have clarified suitable methods for using this intellectual resource as a target of research in analysis, we should be able to engage in research towards structuring a WWW Japanese-language corpus in the future.
- 愛知教育大学教育実践総合センターの論文
著者
関連論文
- 自伝的記憶と意味記憶の関連についての分析 : 言語連想課題を用いた実験的考察(教育科学編)
- 学校でのデジタル写真における児童生徒の存在感を表すメタデータの提案(子どもを守る・育む)
- Study of IT Terms Used in Non-Vocational High School Information Technology Class Textbooks: Toward Corpus-Based Lexical Studies and Sentence Comprehension
- 読み書きが苦手な児童の漢字学習支援--デジタルペンを使用した漢字誤り分析 (e-Learningの実践と学習支援システム/一般)
- 大学生を対象とした携帯電話のメールにおける絵文字使用量についての分析 (ICTを活用した学習支援システムと学習コンテンツ/一般)
- 情報モラル判断の枠組みを学習するゴールベースシナリオ理論に基づく教材の開発と授業実践
- 情報弱者を対象としたWWW上での文章理解支援を目指した予備的調査 ―地方公共団体のサイトを対象としたWebアクセシビリティの調査―
- 掲示板を用いた教師と生徒のコミュニケーションに関する事例研究
- 学校の生徒や保護者専用の Web ページシステムの運営と改良
- 日本人大学生におけるコンピュータ利用の実態調査 : コンピュータ不安に関する国際的比較研究へ向けての予備的調査
- 学校教育における新しいテクノロジーの役割
- かきつばた II : 学習者制御型 CAL システム「かきつばた」 Windows 版の開発と試行
- 留学生のためのプログラミング言語(HSP)学習支援教材の開発 (特集 次世代情報教育の構築に向けて) -- (プログラミング教育)
- メディア接触と日本語の学習ストラテジーに関する調査--中国語および韓国語の母語話者を対象に
- 学校でのデジタル写真における児童生徒の存在感を表すメタデータの提案
- 情報モラルの4つの判断観点とゴールベースシナリオ理論に基づく体験学習教材の開発と実践
- 大学生を対象としたSNSのWeb日記によるコミュニケーションの検討
- 情報モラルの4つの判断観点を用いた体験学習教材の開発と実践 (e-learningの質保証/一般)
- ネット討論による授業実践の報告とその考察 (e-learningの質保証/一般)
- 「教育実習」を核とした日韓交流プログラムの開発と実践--2007年度 愛知教育大学-晋州教育大学校の学生相互訪問を中心に
- 算数文章題の解決過程に着目した外国人・日本人児童のためのマルチメディア教材の開発 (日本語教育と教育工学/一般)
- デジタル写真における児童生徒の存在感を表すメタデータの提案 : 写真群の平等性判定への利用(学習オブジェクト・学習データの活用と集約)
- 学生よる地域連携講座に向けた教材の開発と実践(テーマ研究発表,主題「明日の科学教育を考える」)
- e-Learningシステム「かきつばた」による授業の実践
- 子ども・保護者・教員が相互にBlogを活用して情報を伝え合う力を育成する実践研究
- SNSにおけるWeb日記を介した大学生のコミュニケーションに関する研究 (Webテクノロジー/一般)
- 非対面時の電子掲示板の援用による対面時の教師と生徒間のコミュニケーションに関する事例研究
- 専門家とのコラボレーションによるXMLを用いたマルチメディアオンラインクイズシステムの開発と検討
- 知識メモを活用した研究情報共有方式の提案(21世紀のグループウェア)
- 高速通信回線におけるXMLを活用したオンラインクイズシステムの提案と開発
- XMLを用いた知識管理方式の提案と考察
- 小中学校におけるネットワーク利用課金の分析
- マルチメディア教材としての絵画検索システム活用について
- 実験的手法による類義語係数の算出とその分析
- 創造的思考の覚醒を目指したシミュレーションゲーミング教材の開発 : 宇宙旅行シミュレーションを例として
- 絵画データベースでの利用を目的とする印象語シソーラス
- 力学系における状況認識とその語彙に関する考察 : ニュートン力学による火星旅行シミュレーションを例として
- 算数割合文章題の理解と解決を支援するコンピュータ操作による線分図方略の開発
- J044 学力低下とリメディアル教育の実践と課題(自主シンポジウム)
- Various Problems Concerning the Construction of a WWW Japanese-Language Corpus― The Current State and Future Prospects of Japanese-Language Corpus Research ―
- VODサーバを利用した個別学習について
- VOD サーバを利用した個別学習について
- 美術教材データベースを利用した美術教育支援システム
- 情報科学専攻科目「教育システム開発」における授業実践の報告
- テキストへの自由な書き込み行為が文章理解に及ぼす影響
- 暗号化体験学習教材の開発 ―高校生への情報セキュリティ教育―
- 高等学校普通教科「情報B」におけるアルゴリズム学習教材の開発と評価(教育科学編)
- ET2000-27 感性語の類義語における順序関係について
- 漢字2字熟語の頻度特性に関する分析 : 漢字教材作成時における頻度データの活用
- 漢字2字熟語の頻度特性に関する分析 : 漢字教材作成時における頻度データの活用
- 小中学校におけるネットワーク利用課金の分析
- 大学生における携帯電話利用の実態調査 ―家族とのコミュニケーションに及ぼす影響の分析―
- 本学におけるeラーニングのあり方に関する実践研究
- 自己説明と算数・数学の問題解決
- 大学生におけるパソコンと携帯電話によるインターネット利用の実態調査--パソコンと携帯電話利用者の情報活用能力について
- 日本語 WebIME を搭載した海外向け図書情報提供システムの開発
- 外来語言い換え案に示された語彙の辞書掲載状況の分析 : 電子辞書『大辞林』を用いた調査
- 「外来語」言い換え案に掲載されているカタカナ語の使用頻度の分析
- 高等学校教諭1種免許状(情報)取得希望者を対象とした情報科教育法
- 漢字 2 字熟語の頻度特性に関する分析
- How a Metacognitive Strategy Helps Students Solve Mathematical Word Problems
- Episodic Memory Inhibition and Spreading Activation Duration : Further Evidence of Episodic Inhibition Using the Think/No-Think Task
- インターネット入門講習に関する実践的研究
- 人文系学部生を対象とした統計解析学習用教材の開発 : 授業実践報告とその学習評価
- カタカナ語使用の季節変動に関する分析
- 新聞電子メディアを用いたカタカナ語の使用実態調査 : 朝日新聞における月次変化の分析
- 小学生を対象としたキーボード文字入力指導の試み--ホームポジションの意識化 (ICTを活用した学習支援と教育の質保証/一般)
- 本学におけるeラーニングの活用に関する実践研究
- デジタルポートフォリオの動向とWebにおける内容記述の検討
- 算数文章題の解決過程に着目した外国人・日本人児童のためのマルチメディア教材の開発
- 情報弱者を対象としたWWW上での文章理解支援を目指した予備的調査--地方公共団体のサイトを対象としたWebアクセシビリティの調査
- ラウンドテーブル 生涯学び続ける学士を育てるための授業アプローチを探る
- Webサイトからの情幸馴文集における熟達者と非熟達者の違い (ICTを活用した学習支援と教育の質保証/一般)
- 暗号化体験学習教材の開発--高校生への情報セキュリティ教育
- メディア接触と日本語の学習ストラテジーに関する調査 : 中国語および韓国語の母語話者を対象に
- 大学生における携帯電話利用の実態調査--家族とのコミュニケーションに及ぼす影響の分析
- 学力向上の指標となる言語力育成のために : 日本語力をいかに測るか(日本語リメディアル教育とは)
- P4-33 連想を用いた漢字学習方略と誤答パターンの分析(教授・学習,ポスター発表)
- 児童の算数問題解決とメタ認知方略の評価
- 新聞における「外来語」使用の経年変化の分析(地域研究会(名古屋),1.研究発表)
- 幼稚園・保育園におけるコンピュータ利用教育の現状 : 日本(愛知県)と中国との比較研究
- 普通教科「情報」における情報倫理教育の実践的研究
- 子ども・保護者・教員が相互にBlogを活用して情報を伝え合う力を育成する実践研究
- PA-085 コーパスを用いた新常用漢字に関する分析 : 常用漢字表に追加・削除された漢字の使用実態(教授・学習,ポスター発表)
- JF03 教科学習を支える『学習言語』 : 生活言語から学習言語(自主企画シンポジウム)