特許情報を対象とした機械翻訳 : 共通基盤による評価タスクを目指して(文書分類・翻訳)
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,特許の機械翻訳が,以下の観点から,日英・英日の機械翻訳の対象として好適なことを述べた.すなわち,(1)特許の翻訳は社会的にも重要なこと,(2)大規模な日英対訳コーパスが存在すること,(3)オープンソースの機械翻訳システムが存在すること,(4)NTICR-7において特許翻訳タスクが企画されていること.そして,特許翻訳タスクが有望なことを,NTICR-7において提供される対訳データおよびオープンソースの統計的機械翻訳システムを利用して,特許の機械翻訳の実験をすることにより,確かめた.
- 社団法人電子情報通信学会の論文
- 2007-07-17
著者
-
山本 幹雄
筑波大学システム情報工学研究科
-
藤井 敦
筑波大学
-
内山 将夫
情報通信研究機構
-
宇津呂 武仁
筑波大学
-
宇津呂 武仁
筑波大学大学院システム情報工学研究科
-
山本 幹雄
筑波大学大学院システム情報工学研究科
-
藤井 敦
筑波大学 図書館情報学系:科学技術振興事業団crest
-
宇律呂 武仁
筑波大学
-
藤井 敦
筑波大学 図書館情報学系
-
宇律呂 武仁
筑波大学大学院システム情報工学研究科
-
山本 幹雄
沖テクノシステムズラボラトリ(株)
-
山本 幹雄
筑波大学
-
山本 幹雄
豊橋技術科学大学情報工学系中川研究室
-
山本 幹雄
筑波大学システム情報系
関連論文
- トピック教師なしデータからのトピック依存評価表現モデルの獲得(「主観表現処理の最前線」シンポジウム)
- iPhoneとiPod touchを使った英語語彙学習教材の開発(言語と学習,場の共創)
- 多言語運用能力養成のためのマルチ・ランゲージ語彙学習教材の開発--カルタと携帯型ゲーム機を使った教材
- NTCIR-7速報(NTCIR特別セッション)
- フレーズテーブル及び既存対訳辞書を用いた専門用語の訳語推定
- 携帯ゲーム機の特性を活かした語彙学習教材の開発(言語と学習)
- フレーズテーブル及び既存対訳辞書を用いた専門用語の訳語推定(自然言語処理)
- 特許情報処理を指向したテストコレクションの構築 : 情報検索と自然言語処理の融合を目指して(NTCIR特別セッション)
- 特許情報処理を指向したテストコレクションの構築 : 情報検索と自然言語処理の融合を目指して(NTCIR特別セッション)
- 日英特許公報を用いた対訳辞書および翻訳メモリの構築
- 統計的機械翻訳におけるフレーズ対応最適化を利用したN-best翻訳候補のリランキング
- フェイスシートとの関係を利用した自由回答アンケートの分析(解析)
- 新聞記事コーパスでの単語出現特徴を利用した観光イベント情報の検索支援
- フェイスシートとの関係を利用した自由回答アンケートの分析(解析)
- 英文読解のためのコースウェアの作成(教育)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- 英文読解のためのコースウェアの作成(教育)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- 英語教育のための分野特徴単語の選定尺度の比較
- 自由回答アンケートにおける要求意図判定基準
- 6U-2 特許文に対するクロストリガーモデルを用いた統計的機械翻訳システム(自然言語処理,学生セッション,人工知能と認知科学)
- 特許情報を対象とした機械翻訳 : 共通基盤による評価タスクを目指して
- 特許情報を対象とした機械翻訳 : 共通基盤による評価タスクを目指して(文書分類・翻訳)
- 音声認識セミナー : 基礎からディクテーションまで
- コーパスから抽出された辞書を用いた表記誤り検出法
- Web情報を用いた事典検索サイトの構築(Webアプリケーションを背景としたWeb利用)
- OpinionReader : 意思決定支援を目的とした主観情報の集約・可視化システム(データマイニング)
- NTCIR-4における類似特許検索テストコレクションの構築(テキスト検索,分類)
- 声帯振動の非線形効果パラメータのパタン化とその評価
- 声帯振動の非線形効果を考慮した合成音声とその評価
- 代表・派生関係を利用した日本語機能表現の解析
- 音声対話データベース構築の現状(音声対話システムの実力と課題)
- ブログ記事集合を用いたポストとコメントとの自動分離抽出手法の提案
- 方言音声コーパスの設計・構築と分析
- 日本語方言音声コーパスの構築と分析
- Integer programming for a phrase alignment problem on statistical machine translation (21世紀の数理計画--最適化モデルとアルゴリズム--RIMS研究集会報告集)
- SIG-SLP/SIG-NL合同セッションここまでできるぞ音声/言語処理技術 : 音声編
- ここまでできるぞ音声/言語処理技術 : 音声編
- 日本語ディクテーションのための言語資源・ツールの整備
- 日本語ディクテーションのための言語資源・ツールの整備
- 日本語ディクテーション基本ソフトウェア(99年度版)
- 2000-NL-137-7 / 2000-SLP-31-2 日本語ディクテーション基本ソフトウェア(99年度版)の性能評価
- 2000-NL-137-7 / 2000-SLP-31-2 日本語ディクテーション基本ソフトウェア(99年度版)の性能評価
- 日本語ディクテーション基本ソフトウェア : 98年度版
- 日本語ディクテーション基本ソフトウェア(98年度版)の性能評価
- 日本語ディクテーション基本ソフトウェア(98年度版)の性能評価
- 日本語ディクテーション基本ソフトウェア(97年度版)
- 日本語ディクテーション基本ソフトウェア(97年度版)の性能評価
- 対訳特許文書からの専門用語対訳辞書半自動獲得におけるフレーズテーブルと既存対訳辞書の併用(機械翻訳・要約・評判分析)
- 3D-5 フレーズテーブルと要素合成法を用いた対訳特許文書からの専門用語対訳辞書生成(自然言語処理,一般セッション,人工知能と認知科学)
- 大規模オープンソース日英対訳コーパスの構築
- 大規模オープンソース日英対訳コーパスの構築
- 質問応答における常識的な解の選択と期待効用に基づく回答群の決定(質問応答)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- 質問応答における常識的な解の選択と期待効用に基づく回答群の決定(質問応答)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- 講演音声の認識における言語モデルのタスク適応
- 音声入力型情報検索のための自由発話収録
- 大語彙日本語連続音声認識研究基盤の整備 : 汎用音素モデルの作成
- 大語彙日本語連続音声認識研究基盤の整備 : 学習・評価テキストコーパスの作成
- 大語彙日本語連続音声認識研究基盤の整備 : 評価用連続音声認識プログラムの開発
- 日本語音声コーパスの比較・選択の方法
- 日本音響学会新聞記事読み上げ音声コーパスからの評価用発話セットの作成
- 日本語ディクテーション基本ソフトウェア(97年度版)の性能評価
- 単語分布と専門語彙の関連付けに関する研究
- 子供話し言葉コーパスの特徴語抽出に関する研究
- BNC口語3分野からのレベル別ESP語彙の抽出
- 初級英語学習者を対象としたコーパス利用学習の試み
- 9種の統計的手法を用いた学習者の語彙レベルに適合したESP学習語彙の選定(言語の学習・教育と言語処理)
- 絵辞書と子供話し言葉コーパスに基づく日常生活語彙リスト作成の試み(英語教育の到達目標-その基準を求めて-)
- 統計的指標を利用した時事英語資料の特徴語選定に関する研究
- 英語絵辞書の語彙
- 日英パラレルコーパスを活用した英語語彙指導の試み
- 日英パラレルコーパスを構成するテキストの難易度分類に関する研究
- 言語教育・言語学習と知的情報処理研究(第二言語の教育と学習)
- 言語教育・言語学習と知的情報処理研究
- 文献紹介 Wang, Y.-M., Ma, M., Niu, Y., and Chen, H.: Spam double-funnel: Connecting Web spammers with advertisers, Proc. 16th Int. World Wide Web Conf. (WWW2007), pp. 291-300 (2007)
- 混合ディリクレ分布を用いたトピックに基づく言語モデル(音声, 聴覚)
- 生成文書モデルを用いた文書読み上げ音声認識(認識, 信頼度)
- GMMによる多言語音声系統樹の構成
- 文書確率を用いた文書読み上げ音声認識
- F_0モデルパラメータ自動抽出方法の改良(聴覚・音声・言語とその障害, 一般)
- 混合ガウス分布による多言語音声系統樹の構成(音声言語応用)(第6回音声言語シンポジウム)
- F_0モデルパラメータ自動決定の一方法
- 国内における音声データベースの現状 : 開発,管理及び音声研究への利用
- 多言語音声コーパスの構築と分析
- 韻律情報を考慮した音声要約の一方法
- 混合ディリクレ分布パラメータの階層ベイズモデルを用いたスムージング法(音声言語情報処理一般)(テーマ:音声対話システム、音声言語情報処理、一般)
- 英日統計的機械翻訳における語順優先探索デコーダ(自然言語)
- 多言語運用能力養成のためのマルチ・ランゲージ語彙学習教材の開発 : カルタと携帯型ゲーム機を使った教材
- 教師情報を必要としないニュースページ群からのコンテンツ自動抽出
- パラレルコーパスの自動生成技術 (ヒューマンコミュニケーション特集) -- (自然言語)
- 文献検索タスクを用いた音声対話データの収録と分析
- 文献検索をタスクとした音声対話コーパスの構築と分析
- 韻律情報を用いた発話文タイプ付与支援システム
- 表層情報を用いた統計的手法による発話文の自動分類
- 表層情報を用いた数量化理論第III類による発話文の分類と分析
- 語彙のカバー率計測の変数に関する研究
- 人手と人知
- 評価表現と文脈一貫性を利用した教師データ自動獲得によるクレーム文検知(第3回集合知シンポジウム)
- パテントファミリーを用いた専門用語訳語獲得における対訳文対非抽出部分およびフレーズテーブルの利用
- 統計的指標を利用した特徴語抽出に関する研究
- E-034 レビュー集合要約における特徴的評価視点セレクション(感情・評判,E分野:自然言語・音声・音楽)
- ブログページ集合からのポストおよびコメント自動分離抽出手法