特許情報処理を指向したテストコレクションの構築 : 情報検索と自然言語処理の融合を目指して(NTCIR特別セッション)
スポンサーリンク
概要
- 論文の詳細を見る
情報検索や自然言語処理に関する技術を体系的に評価するためには,ベンチマークとして研究者が共有できる大規模なテストコレクションが必要である.本稿は,NTCIRワークショップにおいて構築している特許情報処理テストコレクションについて,検索,分類,機械翻訳,マイニングの観点から解説する.検索では技術動向調査,無効資料調査,パッセージ検索を目的とし,分類ではFタームに基づくカテゴリ分類を目的としたテストコレクションを構築した.現在進行中のワークショップでは,検索や分類で用いた日英特許情報を応用して,翻訳とマイニングに関するテストコレクションを構築している.翻訳では,対応特許(パテントファミリー)から抽出した文対応データをシステムの訓練や評価に用いる.マイニングでは,特許と技術論文を横断した技術動向分析を想定して,論文抄録に特許分類のカテゴリを付与することを目的とする.
- 社団法人情報処理学会の論文
- 2008-01-21
著者
-
山本 幹雄
筑波大学システム情報工学研究科
-
神門 典子
国立情報学研究所
-
神門 典子
総合研究大学院大学:国立情報学研究所
-
神門 典子
国立情報学研究所ソフトウェア研究系
-
藤井 敦
筑波大学
-
難波 英嗣
広島市立大学
-
難波 英嗣
広島市立大学大学院情報科学研究科
-
橋本 泰一
東京工業大学統合研究院
-
岩山 真
東京工業大学
-
内山 将夫
情報通信研究機構
-
宇津呂 武仁
筑波大学
-
宇津呂 武仁
筑波大学大学院システム情報工学研究科
-
山本 幹雄
筑波大学大学院システム情報工学研究科
-
藤井 敦
筑波大学 図書館情報学系:科学技術振興事業団crest
-
橋本 泰一
東京工業大学
-
藤井 敦
筑波大学 図書館情報学系
-
神門 典子
国立情報学研
-
宇律呂 武仁
筑波大学大学院システム情報工学研究科
-
山本 幹雄
沖テクノシステムズラボラトリ(株)
-
岩山 真
(株)日立製作所基礎研究所
-
山本 幹雄
筑波大学
-
岩山 真
東京工業大学:日立製作所
-
山本 幹雄
豊橋技術科学大学情報工学系中川研究室
-
山本 幹雄
筑波大学システム情報系
関連論文
- トピック教師なしデータからのトピック依存評価表現モデルの獲得(「主観表現処理の最前線」シンポジウム)
- Qサイトにおけるベストアンサー推定の分析とその機械学習への応用
- 目次と帯を用いた図書の自動分類(情報検索・分類,テーマ : 「デジタルアーカイブの活用(応用)」および一般)
- NTCIR-3言語横断検索タスクの分析 : プーリングを中心として
- 大規模テストコレクション構築のためのプーリング : NTCIR-3言語横断検索タスクの分析(コーパス分析・言い換え)(セマンティックウェブと自然言語処理その他一般)
- LL_011 コンテンツを組織化する知識コンテンツ構築システムの提案(L分野:ネットワークコンピューティング)
- 協調学習のためのコンテンツ構築システムEduWikiの開発(セッション7: 社会システム・教育支援システム)
- 時系列情報の値と変化に関する言語表現コーパスの構築 : 動向情報の情報編纂に向けて
- タスク種別とユーザ特性の違いがWeb情報探索行動に与える影響: : 眼球運動データおよび閲覧行動ログを用いた分析
- サーチエンジン検索結果ページにおける視線情報の分析(第17回(2009年度)年次大会(研究報告会&総会))
- 〈情報処理学会 第100回情報基礎とアクセス技術研究会(IFAT) 発表論文〉Q&Aサイトにおける質問と回答の分析(4) : 質問タイプ分類の一致度について(立命館大学 びわこ・くさつキャンパス エポック立命21. 2010年11月4日)
- Concentric Ring View F+ : マルチメディアデータのためのリング状検索インタフェース(ユーザインタフェースとインタラクティブシステム)
- Concentric Ring View F+ : マルチメディアデータのためのリング状検索インタフェース
- Q&Aサイトにおけるベストアンサー推定の分析とその機械学習への応用
- NTCIRにおける質問応答技術の評価と今後の展望(NTCIR特別セッション)
- Basic Elementを用いた質問応答の自動評価(情報検索・情報抽出・QA)
- Web情報探索における視線データの予備的分析(創立20周年記念 第16回(2008年度)年次大会(研究報告会&総会))
- 多面的な検索とブラウジングを統合したGUI(セッション3 : GUIデザイン)
- フレーズテーブル及び既存対訳辞書を用いた専門用語の訳語推定(自然言語処理)
- 特許情報処理を指向したテストコレクションの構築 : 情報検索と自然言語処理の融合を目指して(NTCIR特別セッション)
- 特許情報処理を指向したテストコレクションの構築 : 情報検索と自然言語処理の融合を目指して(NTCIR特別セッション)
- 情報アクセス対話のための質問応答技術評価タスク
- NTCIRにおける質問応答技術の評価と今後の展望(NTCIR特別セッション)
- Basic Elementを用いた質問応答の自動評価(情報検索・情報抽出・QA)
- 目次と帯を用いた図書の自動分類(情報検索・分類,テーマ : 「デジタルアーカイブの活用(応用)」および一般)
- 統計的機械翻訳におけるフレーズ対応最適化を利用したN-best翻訳候補のリランキング
- 動向情報の要約と可視化とその展開 : MuST(動向情報の要約と可視化に関するワークショップ)活動報告(言い換え・略語・要約)
- 動向情報の要約と可視化 : 言葉と図で情報をまとめる
- 6U-2 特許文に対するクロストリガーモデルを用いた統計的機械翻訳システム(自然言語処理,学生セッション,人工知能と認知科学)
- 特許情報を対象とした機械翻訳 : 共通基盤による評価タスクを目指して
- 特許情報を対象とした機械翻訳 : 共通基盤による評価タスクを目指して(文書分類・翻訳)
- 音声認識セミナー : 基礎からディクテーションまで
- コーパスから抽出された辞書を用いた表記誤り検出法
- NTCIR-4における類似特許検索テストコレクションの構築(テキスト検索,分類)
- 特許コーパスを用いた検索タスクの提案
- 声帯振動の非線形効果パラメータのパタン化とその評価
- 声帯振動の非線形効果を考慮した合成音声とその評価
- Q&Aサイトにおける質問と回答の分析(4)-質問タイプ分類の一致度について-
- 音声対話データベース構築の現状(音声対話システムの実力と課題)
- Q&Aサイトにおけるベストアンサー推定可能性の検証
- Q&Aサイトにおけるベストアンサー推定可能性の検証
- ブログ記事集合を用いたポストとコメントとの自動分離抽出手法の提案
- Web上のexploratory searchの特徴:発話プロトコルと事後インタビュー分析結果より
- 新聞記事とコミュニティQAを対象とした詳細な意見分析コーパスの作成と分析
- 新聞記事とコミュニティQAを対象とした詳細な意見分析コーパスの作成と分析
- Wikipediaを介した関連ニュース・ブログの対応付け? Wikipediaエントリの分析?
- 特定トピックの日英ブログ収集・分析・類型化:事例研究
- 特集「NTCIR : 情報アクセスに関わるテキスト処理技術の評価ワークショップ」にあたって(NTCIR : 情報アクセスに関わるテキスト処理技術の評価ワークショップ)
- 大規模テストコレクションNTCIR-2の構築 : 対話型追加検索と言語横断的プーリングの効果(情報の検索とテストコレクション)
- 多段階レレバンス判定による評価 : 平均可能な単一指標の検討
- 大規模テストコレクションNTCIR-2の構築 : 言語横断的プーリングの評価への影響
- 大規模学術情報データベースに適した情報検索システムの開発
- 大規模テストコレクションNTCIR-1 NTCIR-2 : レコードから見た違い
- 大規模テストコレクション NTCIR-1 と NTCIR-2 : レコードから見た違い
- 方言音声コーパスの設計・構築と分析
- 日本語方言音声コーパスの構築と分析
- Integer programming for a phrase alignment problem on statistical machine translation (21世紀の数理計画--最適化モデルとアルゴリズム--RIMS研究集会報告集)
- SIG-SLP/SIG-NL合同セッションここまでできるぞ音声/言語処理技術 : 音声編
- ここまでできるぞ音声/言語処理技術 : 音声編
- 日本語ディクテーションのための言語資源・ツールの整備
- 日本語ディクテーションのための言語資源・ツールの整備
- Q&Aサイトにおける質問と回答の分析(3)-質問・回答履歴を用いたベストアンサー推定-
- 日本語ディクテーション基本ソフトウェア(99年度版)
- 2000-NL-137-7 / 2000-SLP-31-2 日本語ディクテーション基本ソフトウェア(99年度版)の性能評価
- 2000-NL-137-7 / 2000-SLP-31-2 日本語ディクテーション基本ソフトウェア(99年度版)の性能評価
- 日本語ディクテーション基本ソフトウェア : 98年度版
- 日本語ディクテーション基本ソフトウェア(98年度版)の性能評価
- 日本語ディクテーション基本ソフトウェア(98年度版)の性能評価
- 日本語ディクテーション基本ソフトウェア(97年度版)
- 日本語ディクテーション基本ソフトウェア(97年度版)の性能評価
- 対訳特許文書からの専門用語対訳辞書半自動獲得におけるフレーズテーブルと既存対訳辞書の併用(機械翻訳・要約・評判分析)
- 3D-5 フレーズテーブルと要素合成法を用いた対訳特許文書からの専門用語対訳辞書生成(自然言語処理,一般セッション,人工知能と認知科学)
- 大語彙日本語連続音声認識研究基盤の整備 : 汎用音素モデルの作成
- 大語彙日本語連続音声認識研究基盤の整備 : 学習・評価テキストコーパスの作成
- 大語彙日本語連続音声認識研究基盤の整備 : 評価用連続音声認識プログラムの開発
- 日本語音声コーパスの比較・選択の方法
- 日本音響学会新聞記事読み上げ音声コーパスからの評価用発話セットの作成
- 日本語ディクテーション基本ソフトウェア(97年度版)の性能評価
- 混合ディリクレ分布を用いたトピックに基づく言語モデル(音声, 聴覚)
- 生成文書モデルを用いた文書読み上げ音声認識(認識, 信頼度)
- GMMによる多言語音声系統樹の構成
- 文書確率を用いた文書読み上げ音声認識
- F_0モデルパラメータ自動抽出方法の改良(聴覚・音声・言語とその障害, 一般)
- 混合ガウス分布による多言語音声系統樹の構成(音声言語応用)(第6回音声言語シンポジウム)
- F_0モデルパラメータ自動決定の一方法
- 国内における音声データベースの現状 : 開発,管理及び音声研究への利用
- 多言語音声コーパスの構築と分析
- 韻律情報を考慮した音声要約の一方法
- 混合ディリクレ分布パラメータの階層ベイズモデルを用いたスムージング法(音声言語情報処理一般)(テーマ:音声対話システム、音声言語情報処理、一般)
- 英日統計的機械翻訳における語順優先探索デコーダ(自然言語)
- 教師情報を必要としないニュースページ群からのコンテンツ自動抽出
- 文献検索タスクを用いた音声対話データの収録と分析
- 文献検索をタスクとした音声対話コーパスの構築と分析
- 韻律情報を用いた発話文タイプ付与支援システム
- 表層情報を用いた統計的手法による発話文の自動分類
- 表層情報を用いた数量化理論第III類による発話文の分類と分析
- 評価表現と文脈一貫性を利用した教師データ自動獲得によるクレーム文検知(第3回集合知シンポジウム)
- パテントファミリーを用いた専門用語訳語獲得における対訳文対非抽出部分およびフレーズテーブルの利用
- E-034 レビュー集合要約における特徴的評価視点セレクション(感情・評判,E分野:自然言語・音声・音楽)
- ブログページ集合からのポストおよびコメント自動分離抽出手法