日米対応特許コーパスを用いた対訳抽出手法
スポンサーリンク
概要
- 論文の詳細を見る
インターネット上の外国語情報を母国語によって活用するためには, 新語に対応して迅速に翻訳辞書を更新する必要がある.本研究は, 同一内容に関して日本語と米国に出願された対応特許をコーパスとして利用し, 複合語単位の日英対訳を抽出する手法を提案する.本手法は, 発明名称や要約などの特許項目から品詞パターンに基づいて日本語と英語の複合語を抽出し, さらに統計的な関連度スコアを計算して適切な対訳を選択する.1995〜1999年に出願された約32, 000件の対応特許を対象に評価実験を行った結果, 本手法によって年間数千件の新語対訳を半自動的に取得できる見通しを得た.
- 2001-09-10
著者
関連論文
- 論文と特許を対象にした技術動向分析 第7回,第8回NTCIRワークショップ 特許マイニングタスク
- 日本語情報検索システム評価用テストコレクション BMIR-J2
- 伝統的モンゴル語と現代モンゴル語を対象とした双方向的な翻字手法(自然言語)
- 栄養素等摂取バランスを考慮した料理レシピ検索システム(コンテンツ技術,Web情報システム)
- 中国語への翻字における確率的な漢字選択手法(自然言語処理)
- 中国語への翻字における漢字選択の手法(意味・応用)
- 中国語への翻字における漢字選択の手法(意味・応用)
- モンゴル語コーパスからの外来語抽出
- 言葉の印象に基づく自動翻字手法
- 伝統的モンゴル語の電子化方式とテキスト検索への応用(自然言語処理)
- E-021 World Wide Webを用いたヘルプデスク指向の質問応答システム(E分野:自然言語)
- D-030 小説テキスト自動分類のためのジャンル推定と人物抽出(D分野:データベース)
- テキスト情報を対象としたハイブリッド型情報推薦システムにおける擬似投票方式(社会人学生論文)
- 検索質問の主題分析に基づく類似文書検索と特許検索への応用(情報検索)
- アイテムの主題分析に基づく協調フィルタリングシステムの推薦予測方式(フィルタリング、文書分類)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- アイテムの主題分析に基づく協調フィルタリングシステムの推薦予測方式(フィルタリング、文書分類)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- Webマイニングによる事典的コンテンツの構築と多様なアクセス手法(インターネット環境のコンテンツ技術及び一般)
- 検索質問文書の主題分析に基づく類似文書検索(セッション4 : 情報検索)
- 検索質問文書の主題分析に基づく類似文書検索(セッション4 : 情報検索)
- ユーザ投票と情報アイテム間類似度を併用した情報推薦システム : 擬似投票方式の提案と評価(セッション4 : コンテンツ配信と情報推薦)
- 複数Webページの要約による用語説明の自動生成(ツール,質問応答,要約)
- アイテムの主題分析に基づく協調フィルタリングシステムの推薦予測方式
- 日英特許公報を用いた対訳辞書および翻訳メモリの構築
- 説明の観点に基づくテキストの分類と要約(文書分類・要約)
- 現代モンゴル語コーパスからの外来語抽出と日蒙対訳辞書の構築
- 特許情報を用いた辞典検索システム(情報検索)
- 特許情報を用いた辞典検索システム(情報検索)
- 4U-4 料理レシピを対象とした関連検索システム(文書の分類と検索,学生セッション,人工知能と認知科学)
- 4ZK-1 時事問題に対する賛否両意見の自動収集手法(情報爆発時代におけるテキストデータ処理,学生セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 時事問題に関する賛否両意見の収集(評判分析・文脈解析)
- Web検索質問の自動分類と質問応答への応用(セッション1:テキストマイニング)
- Web検索質問の自動分類と質問応答への応用(セッション1:テキストマイニング)
- 中国語への翻字における関連語抽出の効果(翻訳・多言語化)
- 中国語への翻字における関連語抽出の効果
- 百科事典としてのWWW(WWW上の情報の知的アクセスのためのテキスト処理)
- 1.キーワードサーチを超える情報爆発サーチ : 自然言語処理で価値ある未知をマイニング(パートI:情報爆発時代における新しい基盤技術,情報爆発時代におけるわくわくするITの創出を目指して)
- 情報検索システム評価用ベンチマークVer.1.0(BMIR-J1)について (メディア統合および環境統合のための高機能データベースシステム、および一般)
- 日本語情報検索システムのためのベンチマークの構築
- 情報検索システム評価用データベースの構築の提案
- 日本十進分類表 : 中国図書館・図書分類表相互参照システムに基づくJapan-MARCおよびChina-MARC検索システム
- WWWは百科事典として使えるか? : 大規模コーパスの構築
- World Wide Webを用いた事典知識情報の抽出と組織化
- 技術文書を対象とした言語横断情報検索のための複合語翻訳
- 日本語複合語の自動分割と日英語基対訳辞書の作成
- 日米対応特許コーパスを用いた対訳抽出手法
- 日米対応特許コーパスを用いた対訳抽出手法
- 『カオスはこうして発見された』共立出版(株), 2002.4., ラルフ・エイブラハム/ヨシスケ・ウエダ編著, 稲垣耕作/赤松則男訳
- 情報処理機器・システムの発展と社会的イベント
- 45言語EUの情報流通
- 日英機械翻訳システムにおける「テイル形」訳し分け機能
- 電子図書館システムとデータ構築 : データ入力工場設置の必要性
- フルテキスト・データ検索機能の検討
- フルテキストの知識データベース化に基づく検索システムの設計
- 放談会 : 「21世紀のペーパーレス化はどこまで可能か」 ( 創立40周年記念技術フォーラム)
- データベース技術者認定試験と大学におけるデータベースに関する研究・教育(現場から見たデータベース技術者その2)
- 図書館業務システム
- ASSIST情報サービスについて : 第16回ドクメンテーション・シンポジウム概要
- User Studyの知識べースの開発 : 第16回ドクメンテーション・シンポジウム概要
- 概念検索 : 知識工学的アプローチ : 第16回ドクメンテーション・シンポジウム概要
- テキストの構造化に基づく検索システム
- 質問応答における常識的な解の選択と期待効用に基づく回答群の決定(質問応答)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- 質問応答における常識的な解の選択と期待効用に基づく回答群の決定(質問応答)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- N-gramの部分的強調による定型表現への言語モデル適応手法(音声,聴覚)
- 講演音声の認識における言語モデルのタスク適応
- 音声入力型情報検索のための自由発話収録
- 単語の共起関係と構文情報を利用した単語階層関係の統計的自動識別
- 電子図書館Ariadneの開発 (5) : —電子図書館をめぐる諸問題—
- 電子図書館Ariadneの開発 (2) : —データの入力と編集—
- 図書館システムの機能(図書館システムと評価)
- 石川徹也研究室
- 図書館変遷の歴史的概観
- 日本語テキストを対象とした自動索引システムの課題: 総論(日本語テキストを対象とした自動索引システム)
- 翻訳における「知識の普遍化」の変遷
- 文意解析処理に基づく主題索引語作成支援システム
- 電子図書館Ariadneの開発 (4) : —読書支援機能—
- 電子図書館Ariadneの開発 (3) : —検索支援機能—
- 音声入力型テキスト検索システムのための音声認識
- 音声入力型文書検索システムの開発とテストコレクションの構築
- 絵本に関する知識データに基づく質疑応答システムの研究
- 確率モデルを用いた日本語ゼロ代名詞の照応解析
- 特許検索における分類手法の比較評価
- E-5 多言語特許検索システムの開発と評価(要約・情報検索,E.自然言語・文書)
- 日米対応特許データに基づく対訳自動抽出
- 日本語形態素・構文解析システムJEMONIの開発と評価について
- 多言語情報検索のための複合語翻訳
- ユーザの情報利用目的に基づく検索システム
- 多言語情報検索のための複合語翻訳
- ユーザの情報利用目的に基づく検索システム
- 地域情報化とデータベース整備の動向 : 第16回ドクメンテーション・シンポジウム概要
- 情報システムの構築とデータベースの生成
- 図書館情報大学の図書館システム : 第13回ドクメンテーション・シンポジウム概要
- 図書館情報大学の情報検索システム : 第13回ドクメンテーション・シンポジウム概要
- 図書館情報大学の情報システム : 第13回ドクメンテーション・シンポジウム概要
- 未知語検出を用いた語彙統制のない音声検索
- 電子図書館Ariadneの開発(1) システム設計の方針:—システム設計の方針—
- 音声文書検索を用いたオンデマンド講義システム
- 音声文書検索を用いたオンデマンド講義システム
- 音声文書検索を用いたオンデマンド講義システム
- 質問翻訳と文書翻訳を統合した日英言語横断情報検索
- 日本ドクメンテーション協会編, 企業体における情報処理機械化の実施例, 東京,同協会, 1981, 86p. \1,600, (NIPDOKシリーズ27)ISBN4-88951-001-X