単語音声サンプルからの音韻概念の獲得
スポンサーリンク
概要
- 論文の詳細を見る
単語音声に相当する時系列データを学習サンプルとし、単語の区別のみを教師として学習を行ない、音韻に相当する概念を獲得するタスクについて検討する。ここで音韻概念とは、ある音声がどのような音韻列として表記されるかを決定する規準の体系を指す。ここで想定する学習の課題は、単語単位のサンプルデータとその単語が属するカテゴリとを与えて、単語の識別能力を獲得することである。すなわちこれは、通常の単語音声認識と同じタスクである。異なる点は詞学習の結果として音韻に相当する概念が形成されるように学習方法を設計する点である。これは、例からの概念学習の一例となっている。ニューラルネットと比較すると、単語を教師としてPDP的な学習を行ない、隠れ層に音韻に相当するものが現れるのと近いが、この場合は音韻の概念が明示的になりにくい点が異なる。人工知能的な学習においては仮説空間の探索的な手法を用いることが多いが、音声のような実数データを扱う際には、統計的な手法をベースとして記号処理的手法を融合するのが有効と考えられる。音韻を単位とする通常の音声認織の手法と比較すると、通常は音韻のカテゴリは既知として音韻の識別方法を学習するが、ここでは、音韻は未知として自動的に獲得することを目指している点が異なる。単語を単位としたのは、文法などの言語的な処理を捨象することによって問題を単純化するためである。この問題設定を人間の幼児の言語音声習得過程とのアナロジーで考えてみる。例えば、「りんご」という単語を幼児が習得する過程を考えると、「りんご」という音声を、視覚をはじめとする他の感覚と対応付けながら、「りんご」の概念を体系化していると考えられる。ただし計算機実験では、視覚などの情報は直接単語カテゴリを教えることで代用している。音韻概念そのものは教えないという設定は、幼児の場合は通常音素そのものを外部から教えることはないことに対応する。
- 一般社団法人情報処理学会の論文
- 1991-02-25
著者
関連論文
- 三軸マイクロフォンアレイを用いた三次元ポインティング音声インタフェースの開発(福祉と音声処理,一般)
- 2群対判別法による不特定話者日本語単音節中の子音の識別
- デコンボルーションによる声道形の推定と適応型音声分析システム
- 視覚情報を対話的に学習するマルチモーダル擬人化エージェント
- コンピュータとの対話におけるユーザの振舞いの解析
- 視覚・聴覚・発話機能を有するエージェント型マルチモーダルインタフェースの試作
- 声帯振動の非線形効果パラメータのパタン化
- 共通中間音声符号系を用いた音声認識方式
- 声帯振動の非線形効果を考慮した音声合成法とその評価
- ホルマント・ノモグラムによる音声パラメータの調音解析の検討
- 声帯振動の非線形性を考慮した音声合成法とその評価実験
- 基本波フィルタリング法による精細ピッチパターンの抽出
- 汎用音声符号系への符号化と音声処理システムの構築
- 言語に共通な音声符号系を用いた音声検索システム
- 人の表情を有し音声対話・視覚機能を備えたマルチモーダルインタフェース
- 座談会 : 音声研究 (音声研究)
- 言語に共通な音声符号系とその音響セグメントモデルの作成
- 単語発声の複数サンプルを利用した未知語の音韻系列の推定(音声情報処理 : 現状と将来技術論文特集)
- 人の間, ものの間のインタフェース
- 複数サンプルを用いた未知語認識
- RWC計画における音声対話データベースの構築
- 休止を単位とした漸進的対話処理
- 対話システム制御における時間の扱い
- EA2000-40 HMMによる音源のモデリングと高基本周波数に頑健な声道特性抽出法
- ユビキッキ : オフィス活動支援のための分散配置型ポータブルロボット(複合現実感,仮想都市,及び一般)
- 三軸マイクロフォンアレイを用いた三次元ポインティング音声インタフェースの開発(福祉と音声処理,一般)
- 音素上の文字列カーネルを用いた重度障害者の不明瞭音声コマンド認識(聴覚・音声・言語とその障害,一般)
- 音素上の文字列カーネルを用いた重度障害者の不明瞭音声コマンド認識
- HLAC尺度に依存した非定常信号処理 : 音素識別の性能評価(一般)
- 音素片と文字列カーネルを用いた語彙制約のないトピック分割について
- 音素片のカーネル主成分分析を用いたトピックセグメンテーション(セッション : 一般(知識処理), 「社会システムにおける知能」及び一般)
- 音素片のカーネル主成分分析を用いたトピックセグメンテーション
- 音素片のカーネル主成分分析を用いたトピックセグメンテーション(一般(知識処理), 「社会システムにおける知能」及び一般)
- 単語アクセントパターン識別におけるモーラ単位HMMの語彙独立性の評価と検討
- セグメント単位の音声符号列からのレキシコンの生成
- 区分線形セグメントラティスによる日英混合音声の認識
- 言語混合単語音声認識に関する実験的検討
- 区分線形セグメントラティスにおける音韻的チャンクの抽出
- 中間符号系と記号列間距離計算に基づく音声処理の提案
- 区分線形セグメントラティス音韻モデルにおけるクラスタリング
- 単語セットの音声認識難易度推定 : 記号領域における単語間距離計算の応用
- 記号領域における単語間距離の計算と音声認識難易度
- 音声・視覚・画像をもつインタラクションシステム
- 区分線形セグメント列からの音素的構造の抽出
- 音声スペクトルからの識別的特徴抽出に関する実験的検討
- 音韻モデル獲得のための区分線形セグメントラティスの学習
- 時間の扱いを考慮した対話システム制御手法
- 区分線形セグメントラティスを用いた単語モデルの自動生成
- マンマシン対話における言語表現の多様性の解析
- MF143 表情筋および頸部の筋電位信号を利用した日本語母音の識別(MF14 情報・コミュニケーション支援,あたり前のことを知る)
- サポートベクターマシンを用いた筋電位信号からの日本語母音の識別(一般)
- 頸部から計測した筋電位信号を利用した発話認識
- 電総研の研究用音声データベース (<小特集>出揃った音声データベース)
- 休止を区切りとした対話処理
- 音声対話システム構築のための実対話データ収録実験
- 高度対話システムの実現のためのヒューマンファクタの解析
- 「話せばわかる」は「あたり前」?("あたり前"について考えたこと-福祉工学シンポジウム2007実行委員寄稿集-,あたり前のことを知る)
- 「音声研究者電子メールアドレス帳」について
- 音声の音響音声的変動パターンの類型化 : データベースと生成領域からの類推の利用 : 視聴覚技術 : 聴覚、音声関係および一般
- 音声の変動記述のための知識ベースについて
- 音声の音素片ネットワーク表現と時系列のセグメント化法を用いた自動ラベリング手法
- 単語音声サンプルからの音韻概念の獲得
- 対判別による多群パタ-ンの認識
- 認知症者とロボットの対話のための相槌認識における話者依存性の分析と話者適応の効果について(オーガナイズドセッション「人にやさしい音声情報処理」,福祉と音声処理,一般)
- 認知症者とロボットの対話のための相槌認識における話者依存性の分析と話者適応の効果について(オーガナイズドセッション「人にやさしい音声情報処理」,福祉と音声処理,一般)
- 軽度認知症高齢者のための情報支援システムにおける不適格発話に頑健な談話行為識別 (一般セッションと「ワークショップにおける学びの共有化」に関する特別セッション)