既存のツールと結合した話し言葉コーパス利用環境
スポンサーリンク
概要
- 論文の詳細を見る
近年,コーパスアノテーションは多様化し,多層アノテーションを統合利用する仕組みが欠かせない.とくに話し言葉コーパスでは,言語・非言語に関する 10 種類以上もの単位とそれらの相互関係を統合し,複数の単位を組み合わせた複雑な検索を可能にする必要がある.本研究では,このような要請に応えるため,(1) マルチモーダル・マルチチャネルの話し言葉コーパスを表現できる,汎用的なデータベーススキーマを設計し,(2) 既存のアノテーションツールで作成された,種々の書式を持つアノテーションを入力とし,汎用的なデータベーススキーマから具現化されたデータベースを構築するツールを開発する.話し言葉の分野では,広く使われている既存のアノテーションツールを有効に利用することが不可欠であり,本研究は,既存のアノテーションツールやコーパス検索ツールを用いたコーパス利用環境を構築する手法を提案する.提案手法は,開発主体の異なる複数の話し言葉コーパスに適用され,運用に供されている.
- 言語処理学会の論文
言語処理学会 | 論文
- 複合語の分野連想語の効率的決定法
- クラス指向事例収集手法による言い換えコーパスの構築
- 動詞項構造辞書への大規模用例付与
- 言い換え技術に関する研究動向
- Morpho-Syntactic Rules for Detecting Japanese Term Variation: Establishment and Evaluation