リカレントネットワークを用いた連続音声認識
スポンサーリンク
概要
- 論文の詳細を見る
連続音声認識を行うためには、連続音声を音素などの認識の基本単位にセグメンテーションをしなければならない。現在、用いられている方法は任意のフレームを音素間の業界の候補であるとし、各候補点ごとにHMMと照合を行うため、処理時間がかかり、実時間処理が難しい。本報告ではリカレントニューラルネットワーク(RNN)を用いた連続音声認識の実現法を提案し、実験と検討を行った。本手法は音素単位での認識を行うようにRNNの学習を行うが、RNNが音素を認識する際、スペクトル包絡やホルマント周波数の遷移といった音響的特徴を利用するので、音素間の境界が自動的に決定され、ほぼ実時間で音素スポッティングが行える。また、ネットワークの内部を解析したところ、特定周波数成分の時間変化に反応するAMニューロンや、ホルマント周波数の遷移に強く反応するFMニューロンが形成されるなど、生体の聴覚と比較しても興味深い結果を得た。
- 社団法人電子情報通信学会の論文
- 1993-12-09
著者
-
高橋 治久
電気通信大学電気通信学部情報通信工学科
-
富田 悦次
電気通信大学
-
富田 悦次
電気通信大学|中央大学研究開発機構
-
柳谷 尚寿
電気通信大学電子情報学科
-
高橋 治久
電気通信大学情報通信工学科
関連論文
- 文脈情報に基づく対象が存在する事前確率の推定
- 最大クリーク問題の多項式時間的可解性の一結果(情報・システム基礎)
- 最大クリーク抽出の単純な最大時間計算量評価と多項式時間的可解性 (アルゴリズムと計算機科学の数理的基盤とその応用)
- 最大クリーク抽出問題の理論計算量評価について : グラフの次数を限定した場合
- 準同型写像によって拡張されたある言語クラスに対する正例からの極限同定
- CRFによる係り受け解析の結果を反映させた日本語形態素解析(形態素・係り受け解析・感情)
- 実時間空スタック受理式決定性限定ワンカウンタ変換器の多項式時間等価性判定(オートマトン・言語理論)
- 正則言語のある部分クラスに対する正の例からの多項式時間極限同定
- 最大クリーク抽出アルゴリズムの共有メモリ型並列計算機上での並列化
- 極大クリーク全列挙アルゴリズムを用いた企業コミュニティ理解
- 極大クリーク全列挙アルゴリズムを用いた企業コミュニティ理解
- ある種の有限状態変換器に対する多項式時間極限同定
- 実時間空スタック受理式決定性限定ワンカウンター変換器の多項式時間等価性判定アルゴリズム
- ε-推移を許したある決定性プッシュダウン変換器対の等価性判定(オートマトン・言語理論)
- ハイパーグラフを対象とした最大クリーク抽出の分枝限定アルゴリズム(セッション6)
- クラスタリングとBoostingを用いた高速、高精度な映像自己診断方式の提案
- 極大クリーク全列挙アルゴリズムCLIQUESを基にした極大2部クリーク全列挙アルゴリズム(セッション4)
- 極大クリーク全列挙アルゴリズムCLIQUESを基にした極大2部クリーク全列挙アルゴリズム(セッション4)
- 極大クリーク全列挙アルゴリズムCLIQUESを基にした極大2部クリーク全列挙アルゴリズム
- 最大クリーク抽出のより高速な分枝限定アルゴリズム
- ε-推移を許したある決定性プッシュダウン変換機器対の等価性判定アルゴリズム(セッション4)
- サイズの大きな極大クリークの効率的列挙アルゴリズム(セッション3)
- 最大クリーク抽出アルゴリズムの効率化と実験的評価・解析(セッション3)
- 正の例から極限同定可能な言語クラスを拡張する統一的アルゴリズム
- 効率的クリークアルゴリズムに基づく電気泳動画像マッチング、タンパク質構造マッチング、および、タンパク質側鎖パッキング
- 単純でより高速な最大クリーク抽出アルゴリズム
- 部分迂回中継システムの最適設計について
- 制約付きプロファイルアライメント(文字列アルゴリズム)
- 非線形nポ-ト電気回路におけるエネルギ-概念
- グラフの近似彩色を行う確率アルゴリズム
- 質問と正の反例による正則言語の多項式時間学習 (計算機科学の基礎理論 : 21世紀の計算パラダイムを目指して)
- 質問と初期情報による文法推論に関する一考察
- 構造反例付き等価性質問を用いた単純決定性言語の多項式時間MAT学習
- 単純決定性言語のある部分族に対する多項式時間MAT学習
- 構造反例付き等価性質問を用いた単純決定性言語の多項式時間MAT学習
- 質問と反例による単純決定性言語の多項式時間学習を可能とさせる十分条件
- RA-001 最大クリーク問題の多項式時間的可解性 : 基本的結果(モデル・アルゴリズム・プログラミング,査読付き論文)
- 最大クリークを抽出するO(2^)-時間の多項式領域アルゴリズム
- 理論評価付き最大クリーク抽出アルゴリズムの実験的評価
- 理論評価付き最大クリーク抽出アルゴリズムの実験的評価
- 最大クリークを抽出するO(2^)-時間の多項式領域アルゴリズム
- 最大クリークを抽出する時間計算量O(2^)の多項式領域アルゴリズム
- 最大クリークを抽出する単純なアルゴリズムの最大次数4のグラフにおける計算量
- リカレントニューラル予測モデルを用いた不特定話者単語音声認識
- リカレントニューラル予測モデルによる数字音声認識
- D-1-3 巡回セールスマン問題に対する確率及び遺伝的ハイブリッドアルゴリズムとその実験的評価
- 「情報処理学会論文誌:数理モデル化と応用」論文誌発行にあたって
- 論文誌発行にあたって
- ボルツマンマシンによる日本語係り受け解析
- カーネル判別分析を利用した多クラス識別のためのパラメータ自動決定法
- D-12-8 色に基づく文脈情報を用いた対象位置の推定(D-12.パターン認識・メディア理解A(パターンメディアの認識・理解・生成),一般セッション)
- CRFによる係り受け解析の結果を反映させた日本語形態素解析(形態素・係り受け解析・感情)
- H-050 条件付確率場を用いた顕微鏡画像からのアスベスト検出(画像認識・メディア理解,一般論文)
- H-049 文脈情報を用いた対象検出のための事前確率の推定(画像認識・メディア理解,一般論文)
- H-030 Eigenphase of Local Normalized Image
- H-023 局所特徴の相対位置情報を用いたカテゴリ分類(画像認識・メディア理解,一般論文)
- カーネル主成分分析を用いた学習機械のパラメータ自動決定法
- D-12-120 One-Class SVMを用いた顕微鏡画像からの粒子検出と計数(D-12. パターン認識・メディア理解,一般セッション)
- D-12-119 色と形状のカーネルの和を用いた顕微鏡画像からのアスベスト検出(D-12. パターン認識・メディア理解,一般セッション)
- カーネル主成分分析を用いた学習機械のパラメタ自動決定法(Session 1)
- 幾何学的学習アルゴリズムによる最大マージン識別法(パターン認識)
- 幾何学的学習アルゴリズムによる最大マージン識別法(「脳・認知科学」及び一般)
- 位相ニューラルネットと平均場近似(一般)(ニューロインフォーマティックスとは何か)
- 位相ニューラルネットと平均場近似
- 最大クリーク抽出に基づく向きの変化に依存しない人物の顔検出法
- カーネル主成分分析の一般化及びパラメタ自動決定手法の提案
- カーネル主成分分析の一般化及びパラメタ自動決定手法の提案(NC一般セッション(3))(認識と学習,模倣学習)
- 「情報処理学会論文誌 : 数理モデル化と応用」の発行にあたって
- 第9回社会に存在感ある学会として : 幅広い立場からの情報教育支援を(これからの情報処理学会)
- 研究会活動のあらましと話題(研究会千夜一夜)
- 最大クリーク抽出に基づく画像からの対象検出(クリーク問題と応用)
- 待ち行列システムの修正拡散近似について
- 即時式GI+M/M/Sモデルにおける呼種別呼損率の近似式について(技術談話室)
- 多元トラヒック処理における呼種別呼損率について(技術談話室)
- カーネル主成分分析の一般化及びパラメタ自動決定手法の提案(NC一般セッション(3))(認識と学習,模倣学習)
- D-2-7 マルチクラスサポートベクトルマシンの実現
- 相反非線形nポ-ト抵抗の構成(技術談話室)
- 近似最大クリークを抽出する確率アルゴリズムとその実験的評価
- 構造化学習とサポートベクターマシンの性能比較
- D-2-8 サポートベクトルマシンとラグランジュ法との性能比較
- Solving Ambiguity in Depth Estimation for Piecewise Smooth Surfaces Using Hopfield Network
- 自己平均性とサンプル計算量
- 最悪学習曲線の上限 : 実用的評価を目指して
- 概念学習における学習曲線の評価
- リカレントネットワークを用いた連続音声認識
- 非対称ランダムアクセスシステムの近似平均遅延解析
- 近似最大クリ-クを抽出する多項式時間アルゴリズムとその実験的評価
- マルコフ変調到着待ち行列システムの近似解析
- 一般制限式巡回多重待ち行列の拡散近似解析
- 発信・着信・両用混在回線群の最適設計法
- 1A2-D03 分散染色法によるアスベスト定性分析作業支援のための偏光顕微鏡画像管理システムの開発
- 待ち行列システムにおける最小通過時間の拡散近似とその応用
- GI1GI2/G1G2/1割込継続形優先権待ち行列モデルの平均系内呼数近似式
- Approximate Queueing System Model via N-dimentional Elementary Return Process
- 時変トラヒックにおけるあふれ呼解析(技術談話室)
- 斜ル-トの最適開設条件について(技術談話室)
- 非線形回路網の受動実現--C1級内部エネルギ-関数の存在
- 非線形nポ-トの受動性・無損失性について(技術談話室)
- 寄生リアクタンスによる正規化モデルの等価性について
- 非線型nポ-トの一般分解定理と構成