2000-NL-138-7 対訳コーパスにおける低頻度語の性質 : 訳語対自動抽出に向けた基礎研究
スポンサーリンク
概要
- 論文の詳細を見る
既に辞書に載っている訳語対を, 対訳コーパスから自動抽出してもメリットは少ない。コーパス中の頻度が高い対は既に辞書に載っているであろう。対訳コーパスから自動抽出すべき訳語対は, 頻度の低い訳語対である。そのような前提から本研究では, これまで研究されてきた統計的な訳語対抽出手法では, 低頻度訳語対の抽出が難しいことを示す。具体的には, 統計的手法では同じ言語の2語が常に同じアラインメントに共起する場合, 訳語が決定できない問題を取り上げる。頻度の低い語同士はこうした決定不能状況に陥りやすい。本研究では, 実際の対訳コーパス中で決定不能状況にある低頻度語の量・質を調べ, 訳語対抽出手法の改善方向を検討した。
- 2000-07-18
著者
-
辻 慶太
筑波大学大学院 図書館情報メディア研究科
-
TSUJI Keita
National Institute of Informatics (NII)
-
高須 淳宏
東京大学大学院教育学研究科
-
影浦 峡
国立情報学研究所人間・社会情報研究系
-
辻 慶太
東京大学大学院教育学研究科
-
芳鐘 冬樹
東京大学大学院教育学研究科
-
辻 慶太
筑波大学図書館情報メディア系
-
芳鐘 冬樹
筑波大学図書館情報メディア系
関連論文
- 異なる学問分野のコーパスを利用した専門用語抽出手法の提案
- 基盤/制度 : 二つの不可視性をめぐって
- 〈原著論文〉司書資格と図書館に関する知識・モチベーションの関係
- 読書という体験 (特集 読書の遠近法(パースペクティブ))
- 語彙概念構造を利用した複合名詞内の係り関係の解析(システムLSIの設計技術と設計自動化)
- 文法的制約を用いた複合語解析モデルの作成
- 語基の詳細な特徴を考慮した複合語解析モデル
- データ分析による『カレントアウェアネス』レビュー
- 研究文献レビュー 日本における図書館情報学分野の計量的研究の動向--計量書誌学研究を中心に
- 論文生産性および研究協力ネットワークに関する指標の相関分析
- 司書資格取得者に対する追跡調査--仕事・満足度を中心として
- ソシュール先生の声を聴く--『ソシュール 一般言語学講義』が生まれるとき
- Morpho-Syntactic Rules for Detecting Japanese Term Variation: Establishment and Evaluation
- 重要な専門用語となる新語の特定・予測(第10回 情報知識学フォーラム「情報の精製と合成」-若手会員が考える新しい情報知識学)
- 4D1 大学における司書教諭資格科目の現状(大学教育 (2), 日本教育情報学会第21回年会)
- 日本語テキストの自動分類のための特徴素抽出手法の比較
- Q&Aサイトと公共図書館レファレンスサービスの正答率比較
- 専門用語の語彙成長に関する研究の理論的枠組みについて
- 言語における共時性と通時性(学術情報分野)
- 言語における共時性と通時性
- ロベルト・フーグマン著 情報・インデクシング研究会 訳 情報システム・データベース構築の基礎理論 : 発行(社)情報科学技術協会 1994.09.01 A5判,355p.
- ストリング・インデクシング・システムの現状 : PRECISを例として
- フィルタリングソフトの性能と公共図書館への導入状況に関する実態調査
- 国立国会図書館における***グラフィの納本状況
- 言語処理における尤度比の問題点:対訳コーパスからの訳語対抽出を例として
- 専門用語における同義語の競合と拍数・語種の関わり
- 水谷の射影関数とウェアリング分布との関係及び射影関数の若干の特性について
- シソ-ラス作成基準が挙げるディスクリプタ・非ディスクリプタ関係の言語学的整理--言語学における関連概念のレビュ-を通じて
- 井上真琴, 『図書館に訊け!』, 筑摩書房, 2004, 253p., (ちくま新書)
- 「専門用語の理論」に関する一考察
- 大規模学術情報データベースに適した情報検索システムの開発
- 情報検索サービスNACSIS-IRの新たな展開 (情報検索の新潮流)
- 司書資格取得者に対する追跡調査 : 仕事・満足度を中心として
- 著者キーワード中での共起に基づく専門用語間の関連度計算法
- 学術文献の和英著者キーワードを用いた類義語クラスタの自動生成
- 対象の変化とデータの変化--専門用語の語彙成長研究における出来事と構造との接点を巡って
- 学術文献の著者キーワードに基づく専門用語間の関連度計算とその応用
- 学術文献の著者キーワードに基づく専門用語間の関連度計算とその応用
- 専門用語抽出・解析処理を考慮したコーパスの作成
- 専門分野における複合名詞の語構成要素の品詞相当カテゴリーに関する一考察
- 専門用語の語構成要素成長曲線に与える用語内語構成要素結束性の影響について
- A-1 専門用語研究における「意味」と「概念」(概念と言語(I))
- 「語」と「専門用語」 : 専門用語に関する理論的研究へ向けての試論
- A-1 複合専門用語の語形成パターン記述における概念の階層レベルの役割について(用語からの接近)
- 複合専門用語の語形成研究を巡って--索引研究の一つの前提として
- 専門用語辞書の「をも見よ」参照に関する調査研究--項目間の意味的関係を手掛かりとして
- 文法パターンに基づく日仏用語抽出モデルの構築
- 情報学と国語学 (特集 日本語研究の将来と国語学会)
- Portfolio 社会と文化 ティモール・ロロサエ一九九九年、回想メモ
- 延べ語数と異なり語数--量的尺度としての問題 (日本語の計量研究法) -- (2章 計量研究法の基礎知識)
- 言葉を学び、異文化に接する?--言語教育の課題と小学校英語教育の陥穽
- ニューヨーク・タイムズ紙が報ずる「読むことの将来」
- PRECISオペレ-タの一貫性--自然言語の意味的役割を検討の基礎として
- 学術雑誌総合目録CD-ROM版誌名・団体名インデクスの作成
- 言語体系としてのPRECIS
- ウィルソン委員会の活動状況
- コンコ-ダンスに求められる要件--欧米におけるコンコ-ダンスを中心に
- ドキュメント・デリバリーのための電子図書館 : リソースシェアリングをめぐる制度的枠組み
- 語彙の制約を考慮した複合語解析モデルの構築
- 語彙の制約を考慮した複合語解析モデルの構築
- On Some Implications of Sample-Size Dependency of Statistical Measures in Lotka-type Data to the Interpretation of Bibliometric Phenomena
- 2000-NL-138-7 対訳コーパスにおける低頻度語の性質 : 訳語対自動抽出に向けた基礎研究
- NLC2000-16 対訳コーパスにおける低頻度語の性質 : 訳語対自動抽出に向けた基礎研究
- 公共図書館デジタルレファレンスサービスの正答率調査 : 対面式及びQ&Aサイトとの比較を通じて
- 日本語専門分野テキストコーパスからの複合語用語の抽出(抽出)
- 文法パターンに基づく用語抽出モデルの構築(言語理解とコミュニケーション一般)
- 語彙概念構造を利用した助詞「に」に関する複合名詞の分析
- 語彙概念構造を利用した助詞「に」に関する複合名詞の分析
- 総理大臣国会演説における基本的文体特徴量の探索的分析
- 総理大臣演説における語彙多様性の変化(セッションN-13(MK301) 一般セッション 言語)
- コミュニケーションメディアの情報伝達性能の包括的比較
- 日本語専門語彙の有契性構造の分析
- 言語の工学--言語実務専門家の実践と言語の科学の間で (特集 言語処理研究の新展開--計算機と言語学の対話に向けて)
- 生きた言葉と図書館の課題 : 粗悪言語を売りつけられる時代に : 2007年11月8日、臨光館204番教室において
- 近代的主体の成立と図書・図書館による近代の存立
- 日本語専門語彙の構成における外来語語基の位置づけ
- いわゆる順位頻度分布と頻度度数分布との関係について : Baayen(2001)からの紹介を中心に(短信)
- 自然言語処理と言語実体化の効用 (特集 空の言語学--言語に実体はあるか)
- 未出現事象の比率を推定する--Good-Turing推定の直感的意味付け
- The Dynamics of Morphemes in Japanese Terminology
- 書評 伊藤雅光著『計量言語学入門』
- 東京大学における外国人留学生の図書館・情報サービス利用の実態 : アンケート調査の結果と分析
- CD-ROMのキーワード作成
- 学会記事 第48回日本図書館情報学会研究大会シンポジウム記録--21世紀に向けての図書館技術の展望と課題
- 名詞の分布特徴量を用いた政治テキスト分析
- 書評 Harald Baayen著Word Frequency Distributions
- 学術文献画像の書誌情報の近似マッチング法
- 荻野の「新出確率推測法の提案」についての追加ノート
- 複合名詞の語構成要素間の結合関係に関する考察 : 文法的特性に基づく品詞相当カテゴリーの評価
- 荻野の「新出確立推測法の提案」について
- 戦後日本における印刷メディア受容量変化の数量的検証
- 座談会 消えた論理の謎 : 原発事故後の言葉の融解 (特集 科学の : 価値の選択と予測)
- 信頼をめぐる状況と語りの配置 (特集 放射能汚染下の信頼)
- 「専門家」と「科学者」 : 科学的知見の限界を前に (特集 リスクの語られ方)
- 計量書誌学的分布における集中度 : 集中度の概念と指標の特徴
- 図書館の貸出履歴を用いた図書推薦システムの有効性検証
- 戦後日本における印刷メディア受容量変化の数量的検証
- 図書館の貸出履歴を用いた図書推薦システムの有効性検証
- 翻訳を通して「言葉」を見ると?
- 図書館の貸出履歴と書誌情報を用いた図書推薦システムの有効性