英音素変換を用いたカタカナ異表記の自動生成(機械翻訳・医療情報)
スポンサーリンク
概要
- 論文の詳細を見る
情報検索おける問題の一つに,文字表記の揺れ(異表記)があげられる.例えば,「ロサンゼルス」は「ロスアンゼルス」や「ロサンジェルス」のようにも表記が可能であるため,これらのうち任意の表記が検索語として与えられた場合,情報検索システムは他の表記も考慮することが望ましい.特に,日本語においては上記のようなカタカナ異表記が多く存在しており,これに対処するために様々な研究が行われている.しかし,これらの研究では異表記の生成に限られたコーパスを用いているため,データの過疎性に起因する問題が生じやすい.そこで本論文では,原言語の音韻がカタカナ表記に関係している点に着目し,英語由来のカタカナ語を確率的に原言語音素列に変換,さらにその音素列をカタカナ語に逆変換することで複数のカタカナ異表記を自動生成する手法を提案する.また,NTCIR-3のWeb検索テストコレクションを用いた評価実験について報告する.
- 2007-09-25
著者
-
上原 邦昭
神戸大学大学院自然科学研究科
-
関 和広
神戸大学自然科学系先端融合研究環
-
服部 弘幸
神戸大学大学院自然科学研究科
-
上原 邦昭
神戸大学大学院工学研究科
-
服部 弘幸
グーグル株式会社
-
上原 邦昭
神戸大学大学院システム情報学研究科
関連論文
- 実空間検索メタデータとしてのソーシャルメディア (ライフインテリジェンスとオフィス情報システム)
- 原言語音韻を考慮した多様なカタカナ異表記生成モデル
- 英音素変換を用いたカタカナ異表記の自動生成(機械翻訳・医療情報)
- 各属性のレビュー・評価値の関係を用いた評判情報の検索支援(「主観表現処理の最前線」シンポジウム)
- ニューラルネットを利用したイメージを表わす自然語入力からの色出力システム
- モバイルアドホック網における位置情報交換レスキューシステム(有線無線シームレス, モバイルネットワーキング, Mobile IP, 無線通信, ネットワーク制御, 一般)
- 重み更新規制の修正によるBoostingアルゴリズムの改善について(知識処理)
- 1R-7 Content-Free Image Retrievalを用いた個人の嗜好を満たすレシピ推薦システム(画像検索・画像情報処理,学生セッション,データベースとメディア)
- 部門間の関係に基づくインシデントレポート共有システムに関する研究(インターネット応用,夏のデータベースワークショップDBWS 2006)
- 時系列の類似性検索における上界関数による効率化(データマイニング)
- AMSS : 時系列データの効率的な類似度測定手法(データマイニング)
- 感覚的情報を扱うためのPrologとニューラルネットワークの結合
- 決定支援における感覚的情報の処理手法
- 図形パターン群における類似度決定のモデル化
- D-12-3 映像検索精度改善のためのMPEG-7準拠の特徴量の導入(D-12.パターン認識・メディア理解A(パターンメディアの認識・理解・生成),一般セッション)
- D-12-4 部分教師付き学習を用いた映像検索(D-12.パターン認識・メディア理解A(パターンメディアの認識・理解・生成),一般セッション)
- D-12-9 機械学習においての学習対象ドメイン外データの活用(D-12.パターン認識・メディア理解A(パターンメディアの認識・理解・生成),一般セッション)
- D-12-37 多重対応分析を利用した特徴量選択による映像検索精度の改善(D-12.パターン認識・メディア理解A(パターンメディアの認識・理解・生成),一般セッション)
- D-12-61 SIFTを用いた映像キーフレームの分類(D-12.パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス),一般セッション)
- スペクトルと周波数を用いた形状に基づいた時系列データの類似度測定手法
- バースト検出に基づく映像からのトピック抽出
- 主観的トリガー言語モデルによる意見情報検索
- 相同遺伝子を考慮したGOアノテーションへの多階層分類の適用
- ブログコミュニティにおける話題波及の検出の試み
- 主観的トリガー言語モデルによる意見情報検索
- 相同遺伝子を考慮したGOアノテーションへの多階層分類の適用
- ブログコミュニティにおける話題波及の検出の試み
- 相同分子種を利用した多階層分類による遺伝子機能アノテーション(セッション6b:アプリケーション)
- 第15回機械学習国際会議
- 模倣ロボットのための特徴量ネットワーク設計 : 不整地歩行のための足探り動作の生成(レスキューシステム・レスキュー工学3)
- 主観的トリガー言語モデルによる意見情報検索
- 映像文法に基づく映像編集支援システム
- 実空間検索メタデータとしてのソーシャルメディア(ログ活用・情報検索,ライフログ活用技術,グループウェアとネットワーク,一般)
- マルチチャンネル型ニュース配信システムのための時系列クラスタリング
- 複合現実感を利用した机上コラボレーションシステムの開発(複合現実感とパターン認識・メディア理解, 一般)
- コンピュータを用いた分節学習による手話学習の提案
- リンク構造とコンテンツを複合的に用いた極少訓練事例によるスプログ検出
- モバイル環境におけるコミュニケーション支援のためのコンテンツの再構成
- モバイル環境におけるユミュニケーション支援のためのコンテンツの再構成
- 位置依存情報配信システムのための空間ハイパーメディアの枠組み
- Prologを対象としたソースプログラムからのプログラム仕様自動生成 : 構造と引数操作パターンに基づく変形解析法の提案
- ESP言語上のウィンドウ制御プログラム開発支援システムWINCS
- 現実関係モデルを導入した自然語による検索キーの取り扱い : 再利用プログラムベースの構築を目指して
- 計算機利用支援システムNeo-ASSISTにおけるユーザモデルを用いた応答メカニズム
- ユーザモデルを利用した説明文生成プランニング
- プログラムの類似性定義のためのネットワーク表現
- プログラム合成システムWINCSのための知識獲得サブシステム
- 述語パターンのマッチングに基づく文解析メカニズム
- インクリメンタルPROLOGコンパイラの設計と実現
- ESP言語上のウィンドウ制御プログラムの開発を支援するシステムWINCS
- 事象駆動型と予測駆動型を融合した文脈解析手法
- 自然言語理解に基づくプログラム合成 (「知的プログラミングの基礎」)
- Prologと関係データベースとの結合システムDB-Prolog
- 自然言語による仕様からの自動プログラム合成
- マニュアルレスシステムにおける説明文生成(2)
- 色情報,発話情報を用いたビデオの自動要約手法
- マニュアルレスシステムにおける説明文生成(1)
- 実時間カメラワーク評価に基づく単一ショット訓練指向型オンライン映像撮影ナビゲーションシステム : 映像文法を背景とした映像撮影学習システムに向けて
- 輝度投影相関と二分化テンソルヒストグラムを併用したオンライン処理向けカメラワーク解析法の精度向上 : 訓練指向型オンライン映像撮影ナビゲーションシステム
- 神戸大学における高速キャンパスネットワークおよび高速計算機群の連用について
- 神戸大学における高速キャンパスネットワークおよび高速計算機群の運用について
- 机上型MRシステムによる作業空間共有のためのネットワーク構築手法に関する研究(仮想都市, 複合現実感, および一般)
- 光学マーカを用いた指差し型メニューインタフェースに関する考察
- 複合現実感を利用した机上コラボレーションシステムの開発
- 6)VRMLの論理構造に基づく3次元画像検索エンジン(マルチメディア情報処理研究会)
- 発想を支援するユーザエージェント(学習・開発支援,ライフログ活用技術,グループウェアとネットワーク,一般)
- 英語音韻を考慮した情報検索のための多様なカタカナ異表記生成
- 多様な遺伝子名認識と文書分類を用いたGene Ontologyアノテーション(パターン認識)
- 状態遷移図とテキスト分類による対話相手の個性を考慮した交渉システム(「主観表現処理の最前線」シンポジウム)
- peer to peer 技術に基づくウェアラブル情報共有システムの開発
- 5W-6 制約充足問題に基づく,顔の向きによらない登場人物の認識(人物・行動の認識,学生セッション,人工知能と認知科学)
- 物体の明度と法線ベクトルの関係学習による3次元形状復元(一般セッション22)
- 物体の明度と法線ベクトルの関係学習による3次元形状復元(一般セッション6,三次元画像,多視点画像)
- 物体の明度と法線ベクトルの関係学習による3次元形状復元(一般セッション6,三次元画像,多視点画像)
- 近傍事例集合の分布密度を用いたMultiple-Instance学習
- 逆伝播を持つ有向グラフ上でのラベル伝播を用いた半教師付き学習
- 6W-1 特徴メタデータを用いた分類ルール学習と映像分類(画像データベース,学生セッション,人工知能と認知科学)
- 3W-9 ビデオオントロジーの構築による映像イベントの体系化(動画像・メディア理解,学生セッション,人工知能と認知科学)
- 5V-7 グラフを用いた半教師付き学習における逆伝播構造の有効性評価(ニューラルネット・学習,学生セッション,人工知能と認知科学)
- 4C-4 映像ストリームにおけるバースト検出に基づくトピック発見(画像処理システム,一般セッション,人工知能と認知科学)
- 相補的な視覚的学習による複数の認識手法の統合(画像認識,コンピュータビジョン)
- 逆伝播を持つ有向グラフ上でのラベル伝播を用いた半教師付き学習(セッション4)
- 近傍事例集合の分布密度を用いたMultiple-Instance学習(セッション4)
- 時間制約に基づく時系列パターンマイニング手法を用いた映像からのイベント抽出
- 最大密度グラフによる特徴選択を用いた半教師付き学習(人工知能,認知科学)
- D-8-2 多属性商品を対象にした交渉戦略に関する一考察(D-8. 人工知能と知識処理, 情報・システム1)
- D-5-10 Web上の評判情報の信頼性評価に関する一検討(D-5. 言語理解とコミュニケーション, 情報・システム1)
- D-12-96 重み付きマッチング法を用いた特徴構成法による視覚的学習(D-12. パターン認識・メディア理解, 情報・システム2)
- 複合現実感を用いた机上コラボレーションシステムの開発
- マイクロブログを用いた感染症サーベイランス
- マイクロブログを用いた感染症サーベイランス
- 文献情報を用いたカーネル法による遺伝子機能アノテーション
- ネットワークの構造解析に基づく有望ノードの同定
- 生物医学要素関係間の意味的類似度に基づく仮説の順位付け
- モバイルアドホック網における位置情報交換レスキユーシステム(有線無線シームレス,モバイルネットワーキング,Mobile IP,無線通信,ネットワーク制御,一般)
- 頑健なスパースカーネル分類器の学習
- 頑健なスパースカーネル分類器の学習
- 生物医学文献検索におけるソーシャルタグと統制語彙との比較(Web・データベース,第2回集合知シンポジウム)
- 株価回帰とWEBニュース記事分析を組み合わせた株価動向推定 (音声)
- 株価回帰とWEBニュース記事分析を組み合わせた株価動向推定 (パターン認識・メディア理解)