Multinomial Logit Modelによるオフライン手書き文字認識
スポンサーリンク
概要
- 論文の詳細を見る
一般化線形モデルの一種であるMultinomial Logit Modelは、多クラスパターンの識別のための最も簡単なニューラルネットワークモデルの一つであるが、このモデルを画像の認識/識別問題に適用した研究事例はあまり報告されていない。そこで本研究では、このモデルを多次元・多クラスの画像パターンの認識問題に適用し、その性能を評価した。評価実験には、手書き文字データベースETL6中の(1)36クラス(数字+英大文字)、(2)82クラス(数字+英大文字+片仮名)のデータを用いた。また本研究では、これまでニューラルネットワークの分野で汎化性の向上のために寄与すると報告されているいくつかの手法をMLMに導入して評価した。実験の結果、これまで独立に提案され、利用されてきたそれらの手法を複合的に利用することによって、それぞれを単独に利用した場合に比べ、一層の汎化性の向上が図れることを確認した。
- 社団法人電子情報通信学会の論文
- 2002-03-08
著者
-
長谷川 修
産業技術総合研究所
-
栗田 多喜夫
産業技術総合研究所つくば中央第二
-
栗田 多喜夫
産業技術総合研究所脳神経情報研究部門
-
栗田 多喜夫
筑波大学大学院システム情報工学研究科:産業技術総合研究所脳神経情報研究部門
-
長谷川 修
東京工業大学大学院理工学研究科像情報工学研究施設:産業技術総合研究所脳神経情報研究部門:科学技術振興事業団さきがけ研究21
-
長谷川 修
産業技術総合研究所 脳神経情報研究部門
関連論文
- 非隣接型矩形特徴を用いた物体検出(一般セッション,手,顔,身体表現の認識,理解)
- 非隣接型矩形特徴を用いた物体検出(一般セッション3)
- サポートベクターマシンを用いたBag-of-Featuresにおける局所特徴の初期特徴選択(テーマ関連セッション1,コンピュータビジョンとパターン認識のための学習理論)
- サポートベクターマシンを用いたBag-of-Featuresにおける局所特徴の初期特徴選択(テーマ関連セッション1)
- 車の安全運転支援システムのための車線状態の推定法(一般セッション2(ITS),文字・文書の認識・理解)
- 幾何学的拘束を考慮したバックミラー画像からの車両検出・追跡(一般セッション7)
- 幾何学的拘束を考慮したバックミラー画像からの車両検出・追跡(一般セッション(5),CVのためのパターン認識・学習理論の新展開)
- 車の姿勢を考慮したハフ変換による車線検出(一般セッション(2),文字認識・文書理解)
- 車の姿勢を考慮したハフ変換による車線検出(一般セッション(2), 文字認識・文書理解)
- 直進する車載カメラの動画像からのオプティカルフローを用いた環境の形状復元法の検討(文書・文字メディアの認識・理解, 一般)
- 直進する車載カメラの動画像からのオプティカルフローを用いた環境の形状復元法の検討
- 1-3 感性への数理科学的なアプローチ(1.感性情報学の方法論,感性情報学)
- 交通安全のための状況・意図理解に向けて(交通移動体事故の抜本的低減へ向けて)
- 高次相関特徴によるテクスチャ解析の試み
- 視覚情報を対話的に学習するマルチモーダル擬人化エージェント
- コンピュータとの対話におけるユーザの振舞いの解析
- 視覚・聴覚・発話機能を有するエージェント型マルチモーダルインタフェースの試作
- マシンビジョンの実利用を促進するための技術展望
- Particle Swarm Optimiztionを用いたサポートベクターマシンのハイパーパラメータ探索(一般セッション6(パターン認識基礎),文字・文書の認識・理解)
- EEGを利用したブレインコンピュータインタフェースのためのデータクレンジング(一般セッション(1),文字認識・文書理解)
- EEGを利用したブレインコンピュータインタフェースのためのデータクレンジング(一般セッション(1), 文字認識・文書理解)
- RANSACを用いた車両運転時のイベント検出法(確率数値解析に於ける諸問題,VII)
- 直進する車載カメラの動画像からのオプティカルフローを用いた環境の形状復元法の検討(文書・文字メディアの認識・理解, 一般)
- 人の表情を有し音声対話・視覚機能を備えたマルチモーダルインタフェース
- 音声・視覚・画像を統合した対話システムの試作
- 複数人物の顔方向・表情認識に基づく映像中の観客の満足度の自動定量評価
- Support Vector Machineを用いたAdaBoostの重み最適化(一般セッション,手,顔,身体表現の認識,理解)
- Support Vector Machineを用いたAdaBoostの重み最適化(一般セッション,手,顔,身体表現の認識,理解)
- Support Vector Machineを用いたAdaBoostの重み最適化(一般セッション3)
- 自動推論 Wizard of OZ システムによる日本語自由発話コーパス
- ノンバーバル情報を導入した音声・画像統合対話システムでの初期データ収録
- ノンバーバル情報を導入した音声・画像統合対話システムの設計
- 画像の例外部分を補正する前処理機構をもったニューラルネット識別器(バイオサイバネティックス,ニューロコンピューティング)
- 場所細胞の位置マップと強化学習を用いた移動ロボットのナビゲーション(画像認識, コンピュータビジョン)
- 場所細胞の位置マップによる移動ロボットのナビゲーション
- ニューラルガスと強化学習による移動ロボットのナビゲーション
- 場所細胞による移動ロボットのナビゲーション
- 身振りと発話のマルチモーダルデータベース
- 手の表面情報認識による人物同定
- EM法を用いた複数情報源からの概念獲得
- EM法を用いた複数情報源からの概念獲得
- 非隣接型矩形特徴を用いた物体検出(一般セッション,手,顔,身体表現の認識,理解)
- パターンコンピューティング : カーネル学習法と汎化性(知能コンピューティングとその周辺〔第6回〕)
- Viola-Jones顔検出器の学習時に2値化画像を利用した場合の効果(一般セッション8(顔・医用画像),文字・文書の認識・理解)
- Histograms of Oriented Gradientsを用いた対象識別での特徴選択(一般セッション6(パターン認識基礎),文字・文書の認識・理解)
- インタラクションのための計測・認識 : ビジョンの特長を生かせるか?
- インタラクションのための計測・認識 : ビジョンの特長を生かせるか?
- シグモイド型パルスジェネレータを取り入れたPulse-Coupled Neural Networkによる注視点探索法
- 論争支援マルチモーダル実験システム MrBengo
- 論争支援のマルチモーダル実験システム
- 音声・視覚・画像をもつインタラクションシステム
- マスク行列を用いて抽出した局所特徴を組み合わせた多クラス識別器による画像判別(一般セッション6(パターン認識基礎),文字・文書の認識・理解)
- ロバスト統計に基づいた適応的な背景推定法
- インタフェース研究と脳科学
- インタフェース研究と脳科学
- インタラクションのための計測・認識 : ビジョンの特長を生かせるか?
- 学習による不特定環境下の顔の追跡と向きの推定
- Multimodal Interaction System that Integrates Speech and Visual Information (特集 RWC研究--実世界知能の実現を目指して) -- (第2部 実世界知能研究推進センターの最新の研究成果)
- 実世界視覚情報を対話的に学習・管理する人間型ソフトウェアロボット (知能情報メディア論文特集)
- 人間型マルチモーダルエージェントによる実世界情報の学習と管理
- 実空間中の人物や物体を認識して対話するマルチモーダル擬人化エージェント
- 部分画像からの物体の認識と切り出し手法の提案
- 「顔」の情報処理
- 「顔」の情報処理
- ディベート : 「仮想ネットワーク社会に自律擬人化エージェントは必要か」の主旨と論点
- 高次局所自己相関特徴とKL展開による3次元物体のビューベース画像認識
- マルチモーダル対話システムのための人間型CGエージェントの構築
- 自己組織的基底配置による関数回帰法の評価
- 矩形特徴を用いた顔検出器から得られる識別スコアの最大化による顔追跡(テーマセッション, 顔・ジェスチャーの認識・理解)
- カーネル学習法とその画像認識への応用(CVにおけるパターン認識・学習理論の新展開)
- 画像認識におけるカーネル学習法(サーベイ(1))
- 特徴選択と Soft-Margin SVM の Boosting を用いた歩行者検出(学習理論とパターン認識メディア理解, 機械学習による自然言語処理・言語処理を利用したメディア理解, 一般)
- 特徴選択と Soft-Margin SVM の Boosting を用いた歩行者検出(学習理論とパターン認識メディア理解, 機械学習による自然言語処理・言語処理を利用したメディア理解, 一般)
- カーネル学習法とその画像認識への応用(テーマ関連/オーガナイズドセッション(1))
- カーネル学習法とその画像認識への応用(オーガナイズドセッション(1))(CVのためのパターン認識・学習理論の新展開)
- 高次元特徴ベクトルの次元圧縮と重みつきK-最近傍法によるパターン認識(画像の認識と理解)
- PCNNを用いた運動検出モデル
- 頑健な恒等写像学習を用いた計量アフィン射影画像列からの運動と形状の復元(コンピュータビジョン基盤技術, 画像の認識・理解)
- 任意方向からの顔画像の認識のための多方向顔画像の主成分分析(一般セッション(5),CVのためのパターン認識・学習理論の新展開)
- カーネル判別分析を用いた顔と顔以外の識別
- 未知の画像に対する識別率を用いた顔検出のための特徴点の順序付け (画像の認識・理解論文特集)
- 画像の隠れ部分を例外として取り除く前処理機構をもったニューラルネット識別器
- 解説 マルチモーダル研究の現状と展望--フレーム問題の擬似的解決と実世界知能
- マルチモーダル研究の現状と展望 : フレーム問題の疑似的解決と実世界知能
- 生体の視覚に学ぶコンピュータビジョン
- 空間指示語と想起される認知領域の基礎的研究
- Multinomial Logit Modelによるオフライン手書き文字認識
- マルチモーダル対話における視覚の役割とその応用
- マルチモーダル対話における視覚の役割とその応用
- D-2-16 PCNN を用いた顔検出モデル
- D-2-13 3次元PCNNによる3次元領域抽出
- 生体模倣型ビジョン
- D-12-101 矩形特徴とAdaBoostを用いた顔検出器における弱識別器のランダムネスと汎化性能(D-12. パターン認識・メディア理解, 情報・システム2)
- 恒等写像学習を用いた複数の画像からの3次元形状の復元
- TD-3-4 汎化性能の高い非線形識別器の学習と画像認識への応用(TD-3. 天下無敵のサポートベクトルマシン?)
- 恒等写像学習を用いたscaled orthographic画像列からの複数物体の分離と形状復元(一般セッション(7))(データマイニングとパターン認識・メディア理解)
- 擬人化エージェントによるマルチモーダルインタフェース
- 2-2 顔画像からの個人識別(2.認識技術の現状)(人体と顔の画像処理)
- 対話しながら学習するマルチモーダル対話システムを目指して
- マルチモーダル対話