言い換えを用いた技術マニュアルの類似文検索
スポンサーリンク
概要
- 論文の詳細を見る
技術マニュアルなど専門的な文書の翻訳作業を効率化するために,過去の翻訳事例を可能な限り再利用する翻訳メモリが広く用いられている.しかし,翻訳メモリ上から翻訳事例を探す際,ユーザが異表記の用語を用いて検索した場合には,その事例を発見することが困難であるという問題が生じる.そこで,本稿では,表層的な文字列の一致だけでなく,言い換えを用いて,原文と類似度の高い文を検索する手法を提案する.提案手法の有効性を確認するため,マツダエース株式会社が業務に用いている技術マニュアル文書データを用いて実験を行った.実験の結果,再現率において 9.2 ポイントの改善が得られ,提案手法の有効性を確認した.
- 2010-11-11
著者
-
竹澤 寿幸
広島市立大学大学院情報科学研究科
-
難波 英嗣
広島市立大学
-
竹沢 寿幸
ATR自動翻訳電話研究所
-
難波 英嗣
広島市立大学大学院情報科学研究科
-
竹澤 寿幸
独立行政法人情報通信研究機構知識創成コミュニケーション研究センター:国際電気通信基礎技術研究所音声言語コミュニケーション研究所
-
矢舖 将隆
広島市立大学大学院情報科学研究科
-
竹沢 寿幸
(株)エイ・ティ・アール音声翻訳通信研究所
-
竹沢 寿幸
Atr
-
竹澤 寿幸
(株)atr音声言語通信研究所
-
竹澤 寿幸
(株)エイ・ティ・アール音声翻訳通信研究所
-
竹澤 寿幸
Atr音声翻訳通信研究所:(現)atr音声言語通信研究所
関連論文
- 情緒計算手法と心的状態遷移ネットワークを用いた音声対話エージェントの気分変化手法
- 携帯型端末を用いた音声自動翻訳システムとフィールド実験(モバイルと放送の融合時代を迎えて(1セグ放送, モバイル放送, 携帯放送融合サービス, 1セグ対応携帯端末, モバイルコンテンツと放送コンテンツの融合, マルチメディア配信, ディジタル放送受信機, および一般))
- 論文と特許を対象にした技術動向分析 第7回,第8回NTCIRワークショップ 特許マイニングタスク
- NTCIR-7速報(NTCIR特別セッション)
- プレゼンテーションスライド情報の構造抽出(コンテンツ技術・Web情報システム,知識基盤社会を支える情報技術論文)
- プレゼンテーションスライド情報の構造化(ライフログ活用技術とその課題,オフィス情報システム,デジタルドキュメント,一般)
- 隠れマルコフモデルを用いた論文とプレゼンテーションシートの対応付け(表理解,アライメント,抽出)
- 特許,論文間の引用関係を用いた論文用語の特許用語への変換(語彙・文書書類)
- コミュニケーション効率に基づく音声翻訳システムの評価(異文化コラボレーション論文)
- 多言語音声コミュニケーションプラットホームと音声翻訳への応用(第8回音声言語シンポジウム)
- コミュニケーション効率に基づく課題遂行型音声対話の評価(第8回音声言語シンポジウム)
- 多言語音声コミュニケーションプラットホームと音声翻訳への応用(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- コミュニケーション効率に基づく課題遂行型音声対話の評価(Session-3 コミュニケーション・対話,第8回音声言語シンポジウム)
- 課題遂行型対話実験による日英及び日中音声翻訳システムの評価
- E-015 複合語翻訳による異言語で記述された書誌情報の同定(E.自然言語・文書・ゲーム)
- ATR音声言語翻訳実験システムASURA
- 翻訳知識を用いた英語論文表題の構造解析(解析・抽出)
- プレゼンテーションスライド情報の構造化(ライフログ活用技術とその課題,オフィス情報システム,デジタルドキュメント,一般)
- 特許情報処理を指向したテストコレクションの構築 : 情報検索と自然言語処理の融合を目指して(NTCIR特別セッション)
- 特許情報処理を指向したテストコレクションの構築 : 情報検索と自然言語処理の融合を目指して(NTCIR特別セッション)
- テキスト要約の自動評価(テキストの自動評価)
- 知財活用の実際 論文と特許データベースを統合したジャンル横断検索および技術動向分析(知財)
- 抜粋による複数文書要約を評価するためのコーパスと評価指標
- C11 特許,論文データベースを統合した検索環境および動向分析ツールの構築(セッションC1(情報処理技術),一般発表概要:各セッション報告,INFOPRO2006)
- 情報抽出を利用した複数文書要約(テキストの可視化と要約)
- 論文データベースからのイディオム用例検索(検索)
- 文書横断文間関係を考慮した動向情報の抽出と可視化(情報抽出・可視化)
- 特許, 論文データベースを統合した検索環境の構築(重要語抽出・検索・文書分類)
- 文書横断文間関係を考慮した動向情報の抽出と可視化(情報抽出・可視化)
- 特許, 論文データベースを統合した検索環境の構築(重要語抽出・検索・文書分類)
- 動向情報の抽出と要約--動向をまとめる (特集 動向情報と情報アクセス)
- 携帯型端末を用いた音声自動翻訳システムとフィールド実験
- 機械学習を用いた発話スタイル依存音響モデル自動選択による対話音声認識
- 機械学習を用いた発話スタイル依存音響モデル自動選択の検討
- 音声認識結果と非母語話者の聞き取り能力の比較による音声言語処理システムの性能評価(音声言語応用)
- E-013 日本語話者の中国語運用能力との比較による日中翻訳評価の検討(E.自然言語・文書・ゲーム)
- 日本語話者の英語運用能力との比較による英日翻訳の評価(機械翻訳・言い換え)
- 言い換えを用いたテキスト要約の自動評価
- 論文と特許を対象にした技術動向分析--第7回、第8回NTCIRワークショップ特許マイニングタスク (検索の高効率化と精度向上)
- 言い換えを用いたテキストの自動評価
- 言い換えを用いたテキストの自動評価
- 言い換えを用いた技術マニュアルの類似文検索
- 多言語音声コミュニケーションプラットホームと音声翻訳への応用(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 多言語音声コミュニケーションプラットホームと音声翻訳への応用
- 発話単位の分割または接合による言語処理単位への変換
- コミュニケーション効率に基づく課題遂行型音声対話の評価(Session-3 コミュニケーション・対話,第8回音声言語シンポジウム)
- コミュニケーション効率に基づく課題遂行型音声対話の評価
- 翻訳システムを介した音声対話における相手話者音声と翻訳テキスト表示の影響について(対話)
- 翻訳システムを介した音声対話における相手話者音声と翻訳テキスト表示の影響について(対話)
- 翻訳システムを介した音声対話における教示と言語表現の関係
- 音声インタフェースのための発話を単位とした話題及び発話行為タイプの推定(音声,聴覚)
- 翻訳システムを介した対話における修正のストラテジー (テーマ:一般)
- 日英音声翻訳システム ATR MATRIX
- 論文用語の特許用語への自動変換
- 異種言語知識の併用による文法的単語グラフ生成法
- 異種言語知識の併用による局所的信頼性向上
- 異種言語知識の併用による局所的信頼性向上
- バイリンガル旅行会話コーパスに見られる話し言葉の特徴分析
- 大語彙日本語連続音声認識研究基盤の整備 : 汎用音素モデルの作成
- 大語彙日本語連続音声認識研究基盤の整備 : 学習・評価テキストコーパスの作成
- 大語彙日本語連続音声認識研究基盤の整備 : 評価用連続音声認識プログラムの開発
- C-STAR 音声翻訳国際共同実験
- 構文規則と前終端記号バイグラムを併用する対話音声認識手法の高速化と高性能化
- 旅行ブログエントリからの観光情報の自動抽出 (特集 知的インタラクション)
- 2種類の翻訳システムを用いた学術論文の特許分類体系への自動分類
- 2種類の翻訳システムを用いた学術論文の特許分類体系への自動分類 (検索の高効率化と精度向上)
- 国内における音声データベースの現状 : 開発,管理及び音声研究への利用
- 2 Text Summarization Challenge : 自動要約の評価型ワークショップ(テキスト自動要約 : 知的活動支援の基本技術として)
- 発話状況の情報を音声認識に用いた音声対話システム
- 対訳情報を用いた単語のクラスタリングに関する考察
- 旅行ブログエントリからの観光情報の自動抽出
- Support Vector Machineを用いた談話構造解析
- 大語彙連続音勢認識研究用日本語コーパス : JNAS
- 大語彙連続音声認識のための読み上げ文コーパスの構築
- 大語彙連続音声認識のための読み上げ文の選択
- 大語彙連続音声認識研究のためのテキストデータ処理
- パネル討論「統計的言語処理/音声言語処理における大規模言語データベースの利用」
- 観光情報の自動抽出とその音声翻訳への適用(第1回集合知シンポジウム〜言語処理が紡ぎ出す未来〜)
- 2010年度論文賞の受賞論文紹介 : ジャンル横断情報アクセスを目指して
- 発話単位の分割または接合による言語処理単位への変換手法
- 部分木に基づく構文規則と前終端記号バイグラムを併用する対話音声認識手法
- 次発話予測による音声認識結果の再順序付け
- 動向情報の抽出と要約 : 動向をまとめる
- 対話音声文法の構築(音声対話システムの実力と課題)
- 日本語音声ディクテーション基本技術講習会開催報告
- 日本音響学会新聞記事読み上げ音声コーパスの構築
- ユーザの知的欲求による選好に基づいたマイクロブログの記事分類
- 新しい産学連携支援システム--特許分類を用いたライセンシーの探索
- 自然言語処理における統合の諸相 (自然言語処理における統合)
- ユーザの知的欲求による選好に基づいたマイクロブログの記事分類
- 隠れマルコフモデルを用いた論文とプレゼンテーションシートの対応付け(表理解,アライメント,抽出)
- 誤認識傾向を考慮した音声認識のための構文規則
- 話しことばにおける接続助詞終止とその音声認識への応用
- 日英特許データベースからのシソーラスの自動構築 (機械翻訳技術の向上)
- 機械学習による科学技術論文からの書誌情報の自動抽出(オントロジ・抽出(2))(セマンティックウェブと自然言語処理その他一般)
- ATRの会話音声翻訳研究用データベース(音声研究関連データベースの動向)
- HT-1-4 ブログからのユーザの行動経路の自動抽出と可視化(HT-1.大規模災害時におけるソーシャルメディアの知的活用,チュートリアルセッション,ソサイエティ企画)
- 特許請求項と詳細説明の自動対応付け (特許情報普及活動功労者表彰 発足記念版) -- (検索の高効率化と精度向上)
- 論文と特許からの技術動向情報の抽出と可視化
- Twitterと論文との自動対応付け(「ソーシャルコンピューティング研究最前線」,ポスター発表のためのショートプレゼン,ソーシャルコンピューティング)