ニュース記事マッチングからの二言語コーパス構築に対する局所的適合フィードバック法の応用
スポンサーリンク
概要
- 論文の詳細を見る
本稿では、他言語間情報検索(Cross Language Information Retrieval; CLIR)の技術を、日本語・英語のニュース記事データベースからの二言語コーパス構築に応用した結果について述べる。ここではCLIR の手法を対照可能な他言語コーパスの構築に適用する実験と、CLIR タスクをニュース記事データベース上でシミュレートする実験の結果に対して分析を与える。どちらの実験においても、機械翻訳と辞書に基づく手法によって質問項目を英訳した後、これを拡張・改善するために使用する局所的な適合フィードバックの役割に焦点を置く。これらの実験により、用語の重み付けの改善と拡張が結果にどのように貢献するかが明らかになった。すなわち、元の用語の重み付け改善の結果生じる曖昧性解消の間違いに対する適合フィードバックの効果はわずかで、パフォーマンスにおける多大な効果はいくつかのスコアの高い文書に対する用語の拡張に由来するということを発見した。
- 国立情報学研究所の論文
- 2003-03-05
著者
-
平川 秀樹
東芝研究開発センター
-
コリアー ナイジェル
国立情報学研究所
-
ナイジェル コリアー
国立情報学研究所
-
熊野 明
(株)東芝研究開発センター
-
熊野 明
東芝研究開発センター
-
平川 秀樹
(株)東芝 研究開発センター
関連論文
- 概念体系を用いた概念抽象化手法と語義判定におけるその有効性の評価(自然言語)(コラボレーションアートとネットワークエンターテイメント)
- 入力予測機能を組み込んだ仮名漢字変換システム
- 予測に基づく入力支援機能を備えたかな漢字変換システムの開発
- ネットワークを利用した辞書サービスシステム
- SRLを利用した規則ベースの感染症用語抽出
- 既存目的言語文書からの訳語の自動学習方式
- 対訳文書からの専門用語辞書作成
- 貴重書ディジタルアーカイブにおけるテキスト可読性と異種メディア間共参照アノテーション
- 概念体系作成支援システムのUser-Interface
- 概念体系作成支援システムのbrowsing方式
- 概念体系作成支援システムのデータ構造
- 概念体系作成支援システムの機能
- 産業日本語の構想と特許文の言い換え実験(日本語処理・文法)
- ニュース記事マッチングからの二言語コーパス構築に対する局所的適合フィードバック法の応用
- インターネット翻訳サービスと辞書データ収集
- インターネット翻訳サービスにおけるユーザ辞書構築
- 多言語情報検索技術を用いた二か国語コーパスの自動アラインメント
- 多言語情報検索技術を用いた二か国語コーパスの自動アラインメント
- 対訳特許文書からの機械翻訳辞書自動作成
- 対訳文書からの機械翻訳専門用語辞書作成
- 翻訳パターンによる機械翻訳のカスタマイズの指針とその効果
- 言語情報と統計情報を用いた対訳文書からの機械翻訳辞書作成
- 文書の種類を考慮した機械翻訳システムの構成
- ユーザ協調型日本語生成システム
- 自然な日本語生成のための指針
- キーボード会話文の構文解析文法について
- 情報処理用語における複合語の構成パターンの抽出とその利用について
- 専門用語辞書の試作概要
- ウェブ文書資源からの中日対訳推定における文脈窓幅の役割(機械翻訳)
- 選好依存文法とその圧縮共有データ構造「依存森」について
- 選好意味依存文法(PSDG)とその圧縮共有データ構造について
- 選好意味依存文法(PSDG)とその圧縮共有データ構造について
- COLING '94参加報告
- 対訳文書を用いた訳語の学習
- 生物学文献からの専門用語抽出における機械学習モデルの検討
- 生物学文献からの専門用語抽出における機械学習モデルの検討
- Graph Branch Algotithm : An Optimum Tree Search Method for Scored Dependency Graph with Arc Co-occurrence Constraints
- Graph Branch Algotithm : An Optimum Tree Search Method for Scored Dependency Graph with Arc Co-occurrence Constraints
- 対称モデルに基づく共参照関係アノテーションスキーマ
- 選好依存文法(PDG)における文解析能力の評価方式について(自然言語)
- 選好依存文法(PDG)における文解析能力の評価方式について(解析, QA, 言語調査)
- 最適解探索に基づく日本語意味係り受け解析