カタカナ異表記を考慮したユーザ辞書システムの拡張
スポンサーリンク
概要
- 論文の詳細を見る
日本語における表記のゆれは、自然言語処理システムの開発において大きな負担となっている。中でもカタカナ語については、その種類、量ともに豊富である。複合語の一部となりやすいこと、日々新しい外来語がカタカナ語として日本語に取り入れられていることを考えると、カタカナ語の表記すべてを登録することは事実上不可能である。そこで我々は、現在開発中の日英機械翻訳システムに、カタカナ異表記変換アルゴリズムに基づいた処理を組み込み、その有効性を既に確認している。しかし、従来の変換処理は、ユーザ辞書中の単語に対して適用することができなかった。そのため、ユーザ辞書にカタカナ語を登録する時には、異表記をすべて登録する必要があり、非常に効率が悪かった。我々は、翻訳システムのユーザ辞書中の単語にもカタカナ異表記変換を適用できるよう、ユーザ辞書システムを拡張し、翻訳実験によりその有効性を確認できたので報告する。また、カタカナ異表記を考慮したユーザ辞書編集が可能となるよう、ユーザ辞書エディタを改良したので、これについても報告する。
- 一般社団法人情報処理学会の論文
- 1992-02-24
著者
-
高山 泰博
三菱電機(株)情報技術総合研究所
-
鈴木 克志
三菱電機(株)パーソナル情報機器開発研究所
-
丸山 冬樹
三菱電機(株)パーソナル情報機器開発研究所
-
相川 勇之
三菱電機(株)情報技術総合研究所
-
宮原 浩二
三菱電機(株)情報技術総合研究所
-
鈴木 克志
三菱電機 情報技総研
-
丸山 冬樹
三菱電機株式会社情報技術総合研究所
-
宮原 浩二
三菱電機 情報技総研
-
相川 勇之
三菱電機(株)
関連論文
- 見出し構造を用いた情報機器操作マニュアルからの用語知識獲得方式
- 技術文書標題からのキーワード抽出
- 概念抽出型テキストマイニングによるアンケート分析手法の提案
- D-5-2 CRM 向けテキストマイニング方式の提案
- eCRM向け概念抽出型テキストマイニング
- D-37 大規模検索システムにおける概念辞書自動更新(辞書・シソーラス,D.データベース)
- 言語事例推論を用いたネットワーク障害対応ガイダンス
- 1N-1 ヘルプデスク支援システムにおける用語獲得
- 2U-1 ヘルプデスク支援システムにおける言語事例データの類似検索
- コーパスからの同義語の獲得(2) : スパース性への対処
- コーパスからの同義語の獲得(1) : 近傍単語頻度統計によるアプローチ
- 対話型ヘルプデスク支援システムにお1ナる事例べース構築
- 自然言語事例ベース検索の設計支援への適用
- 自然言語事例ベースの仕様書文解析の評価
- eCRM向け概念抽出型テキストマイニング
- 言語事例推論を用いたネットワーク障害対応ガイダンス
- ヘルプデスク支援システムにおける問題解決機能
- 1P-4 ヘルプデスク支援システムにおける言語事例検索 : 全体構成
- 1P-3 ヘルプデスク支援システムにおける言語事例検索 : 類似文照合
- B-7-179 デジタルサイネージにおける視聴率モニタリング(B-7.情報ネットワーク,一般講演)
- D-11-46 画像検出を用いた大画面表示装置の効果測定(D-11.画像工学C(画像通信・応用システム),一般講演)
- 技術文書からの用語知識の自動獲得方式の検討(セッション2:情報のラベリングと知識の獲得,学生チャレンジ特集)
- 技術文書からの用語知識の自動獲得方式の検討(セッション2:情報のラベリングと知識の獲得,学生チャレンジ特集)
- D-5-8 表層格解析を用いた業務文書チェック方式(D-5.言語理解とコミュニケーション,一般講演)
- 10.Socio Sense : 過去9年に及ぶWebアーカイブから社会の動きを読む(第2部:情報の高信頼蓄積・検索技術等の開発,学と産の連携による基盤ソフトウェアの先進的開発)
- 9-9 超高精細マルチメディアサーバを用いたアプリケーションの検討
- 9-8 超高精細マルチメディアサーバ制御ソフトウェアの検討
- B-8-66 JAVAを用いたMHEG-5エンジンの検討
- 5L-6 ウェブからの分析対象文書抽出手法の検討(リーディングプロジェクト e-society:WebアーカイブとWebデータ解析技術,一般セッション,リーディングプロジェクト e-society)
- D-13-8 適合性フィードバックに基づいた文書チェックルール作成支援方式(D-13.知能ソフトウェア工学,一般講演)
- D-5-6 意味構造抽出のための係り受け解析に関する考察(D-5.言語理解とコミュニケーション,一般講演)
- D-11-29 画像コンテンツの階層的配信方式に関する一検討
- 5-7 MPEG-7利用画像部分検索システムの試作
- D-11-90 動的に機能拡張可能な画像検索サーバに関する一検討
- D-11-80 MPEG-7を利用した高精細画像部分検索システムの検討
- 木・表構造間写像モデルに基づくXML入力画面自動生成方式(コンテンツ処理)
- 中国語オンライン手書き文字認識 : 日本語のオンライン手書き漢字認識との比較と認識性能・文字入力効率の改善 (画像の認識・理解)
- ピンイン情報を併用したオンライン中国語文字認識
- 企業間文書情報共有におけるSGML文書内容検証方式
- WWWブラウザによるXML文書入力方式について
- SGML 文書の内容検証方式とその評価
- 全文検索システムにおける文字成分表の作成手法
- 全文検索における例文検索
- カタカナ異表記を考慮したユーザ辞書システムの拡張
- 専門用語辞書からの情報抽出と翻訳支援への適用
- 日英機械翻訳における数量表現処理の拡張
- 「韻」に基づく並列句の解析
- 実用性の向上を目指した機械翻訳システムの改良(2)
- 漢字に関する異表記の調査
- 実用性の向上を目指した機械翻訳システムの改良
- 日英機械翻訳システムMELTRAN-J/Eにおける空間的機能名詞の処理
- 日英機械翻訳システムにおける長文の解析
- 日本語の表層格構造の記述について(2) : 拡張格構造の扱い
- 日英機械翻訳における日本語解析前半部の一構成
- 日本語の表層格構造の記述について
- 中国語単語知識処理方式の開発
- 中国語オンライン手書き文字データの分析
- E-35 XML入力画面自動生成方式(自然言語処理応用,E.自然言語・文書)
- 電子申請におけるXML文書内容検証方式
- 次世代WebビジョンSemantic Webの技術動向
- 電子申請におけるXML文書内容検証方式 : 複数XML文書の内容間制約を記述する文書規約記述言語DRDL
- XML文書ワークフロー構築支援方式 : インターネットを用いた設計支援システムにおけるXML文書設計支援方式
- D-9-12 XML文書ワークフロー構築支援方式
- XMLによる電子申請書のメタ情報の表現について
- XMLスタイルシート作成ツールとワークフローへの応用
- 5P-2 企業間XML文書交換における文書規約の表現と利用について
- 5P-1 SGML文書のWWW入力・表示プログラム作成ツール
- XML文書のスタイルシート生成方式
- 4V-8 SGML文書の表組みレイアウト作成支援方式
- HTMLによるXML文書の入力方式について
- WWWブラウザによるSGML文書入力方式について
- 社内文書のSGMLによる標準化とイントラネットによる活用
- SGML文書の内容検証方式の検討
- MSLRパーザにおける未定義語処理の一検討
- カタカナ異表記処理
- CYK法構文解析の一検討 : quick parsingについて
- 日英機械翻訳システムThalia-3 (〔三菱電機株式会社〕研究所50周年記念特集)
- データベースとProlog (プログラミング言語 Prolog)
- D-5-7 情報検索のタスク評価手法に関する一考察(D-5. 言語理解とコミュニケーション)
- インターネット情報監視システムの試作
- JEIDA機械翻訳システム評価基準(利用者編) : ユーザのための評価項目の作成とアンケート調査による検証
- 既存紙文書からSGML文書への変換システムの試作
- 6C-2 動き履歴画像を用いた人数計数システム(画像認識応用,一般セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 文字成分表型全文検索システムのSGML文書検索への拡張
- A-17-20 形状特徴を保持したデフォルメ地図生成手法(A-17.ITS,一般セッション)
- D-11-78 デジタルカメラを用いた輝度計測手法の検討(D-11.画像工学,一般セッション)
- D-11-68 マルチ画面対応デジタルサイネージ編集システムの構築(D-11.画像工学,一般セッション)
- オクルージョンを考慮したレーザ点群抽出に基づく看板計測アプリケーション
- D-5-1 インタネット全文検索と関連文書検索を用いたポータル構築支援
- タグ無しコーパスからの複合語データの自動抽出
- 自然言語事例ベースの仕様書文解析への応用
- モービルマッピングシステムの観測データを用いた看板計測ソフトウェアとその精度評価 (ITS研究会 交通センシング,通信,一般)
- MSLRパーザにおける未定義語処理の一方式
- モービルマッピングシステムの観測データを用いた看板計測ソフトウェアとその精度評価 (ITS)
- 単語の連想関係に基づく情報検索システムInfoMAP
- オクルージョンを考慮したレーザ点群抽出に基づく看板計測アプリケーション
- モービルマッピングシステムの観測データを用いた看板計測ソフトウェアとその精度評価
- モービルマッピングシステムの観測データを用いた看板計測ソフトウェアとその精度評価(交通センシング、通信、情報処理、一般)
- 5-6 交通向けデジタルサイネージシステム : カメラ付端末の複数台連携によるコンテンツ制御(第5部門情報ディスプレイ)
- 5-7 交通向けデジタルサイネージシステム(第5部門情報ディスプレイ)