日本語文章の音声認識システム
スポンサーリンク
概要
- 論文の詳細を見る
We have constructed a continuous speech recognition system for various kinds of Japanese sentences. We explain the procedure referring to the flow diagram shown in Fig. 1. (1)The parameters as shown in Fig. 2 are extracted from the input speech waves, then this input speech waves are transformed into a phoneme string. (2)This input phoneme string is transformed into a condensed phoneme string (Fig. 3). (3)The characteristic phoneme string, in which vowels and /s/ continuing over 50 ms and silence are contained, is extracted from the input phoneme string(Fig. 3). (4)Candidate words are predicted by syntactic and semantic informations. (5)Furthermore, candidate words are restricted by a few phoneme at the beginning of the condensed phoneme string. (6)The input characteristic phoneme string is compared with the characteristic phoneme string of candidate words, and some words are selected. (7)The input condensed phoneme string is compared with the items of the word dictionary of candidate words, and some words are selected. Table 2 shows some items in the two dictionaries. (8)In this way, some words following the preceding word are selected and so on. Thus several word strings are formed(Fig. 4). (9), (10)Above procedures are repeated until all input phonemes are precessed. (11)Each candidate word string is compared with the input condensed phoneme string. (12)As the final output, the word string having the highest reliability is taken. (13)Pragmatic analysis is carried out with the output word string, and the subject concerned now is decided. (14)Then the words unrelated to the subject are removed from the dictionaries. The vocabulary contains 99 words, and it is possible to deal with the sentences concerning to both statistics and landscape. Japanese sentences as shown in Fig. 8 were spoken by four adult males. The results are shown in Fig. 9 and Table 3. This system can recognize 28 sentences among 36, and 76 blocks among 86. (We call a part of a sentence uttered in a breath a block. ) In this paper, we discuss some problems concerning to the system performances. The results are as follows: (1) Some learning process is necessary in order to satisfactorily identify vowels and nasals. (2) Acoustic informations are very effective to restrict the number of candidate words. For example, at the beginning of sentences 91 words are reduced usually to 5 (5. 5%). (3) The use of syntactic and semantic informations reduces the number of candidate words to 20-30% of the ones appearing in case of using only the acoustic informations (Fig. 11). (4) The restriction of the word dictionary by pragmatic informations is also very effective (Table 5). (5) Misrecognition is mostly due to the appearance of undesirable silence owing to decrease of the amplitude of speech waves. The advantages of this system are as follows. (1) Phoneme identification is fairly reliable, and the recognition score of short blocks is very good. (2) Even when the input phoneme string has some errors, the recognition score is much better than that by the matching method using dynamic programing. (3) Many kinds of Japanese sentence may be dealt with in this system, because syntactic restriction is loose. (4) So far, the semantic informations used are simple, but semantically unreasonable sentences may seldom appear. (5) Candidate words are sufficiently restricted by acoustic and linguistic informations.
- 社団法人日本音響学会の論文
- 1978-03-01
著者
関連論文
- 聴取実験を考慮した自動感情判別と感情音声合成システム開発の試み
- 感性情報を利用した音声合成 : 単語音声に含まれる感情情報
- 文音声に含まれる感情表現の基本周波数パターンについて-2句よりなる場合
- 事務処理支援システムの要求事項の検討とプロトタイプの構築
- 平成5年度秋季研究発表会
- ワープロ使用文書と手書き文書の比較
- ビデオ教材の利用方法と効果
- 野鳥の鳴き声の識別
- ニューラルネットワークによる管楽器音の識別
- 計算機間結合用ハードウェアの開発
- 単語音声による感情表現について
- 単語音声に含まれる感情情報について
- F-12 サンプリング周波数に依存しない話者方向識別(音声・音声言語情報処理,F.音声・音楽)
- E-3 要約文生成のための集合名詞の要素の抽出(要約・情報検索,E.自然言語・文書)
- 不特定話者連続音声認識のための規則による音素識別
- 感情音声の機械による感情の判別の試み
- ピッチ周期の不規則変動の特性と個人性の識別の試み
- 韻律情報を利用した連続音声中の隣接句間の修飾関係有無の判定
- 物語理解におけるエピソード・ネットワークの構築
- 感性情報による小型モータの評価システム
- スケッチ画制御用音声対話システムにおける文脈情報の利用
- 音声認識のための連想辞書作成の一手法
- 音声対話システムにおける代名詞処理の試み
- 意味属性を利用した音声認識のための連想情報について
- 話し言葉中の助詞の推定
- スケッチ画制御用音声対話システムの作成
- 対話音声中の助詞の補完とその評価
- 複数句を照合単位とした連続音声認識
- 韻律情報を利用した対話音声中の隣接句間の修飾関係の抽出
- 連続音声認識への連想情報の利用
- D105 マイコンを使った簡易型母音発音練習装置
- G-5 マイクロコンピュータによる言語障害児の発話練習用システムの開発
- 調音機構のモデル化に関するシンポジウム
- 声道の合成による音声の識別
- 破裂音の声道断面積の移行について
- 破裂音の声道断面積について
- 鼻子音の分離について
- 鼻子音の識別
- 日本語音声の零交叉波時系列 : II.無声子音
- 日本語音声の零交叉波時系列 : I.測定方法および母音
- 聴覚障害者用文音声発話練習システム
- 日本語連続音声認識のための韻律情報を利用した句境界の抽出
- 連続音声認識における述語および名詞句の予測の可能性について (新しい音声処理技術特集)
- フォートラン・プログラムの音声認識システム
- 連続音声中の音素識別のための線形判別関数の話者適応
- 日本語文章の音声認識システムにおける意味情報について
- 日本語文章の音声認識システムにおける構文情報について
- B-28 声道の側面図とF1-F2 Diagramとによる聴覚障害児用発音練習システム
- グラフを利用して誤りを含む記号列を分類する方法とその音声認識への応用
- 80 声道の側面図による聴覚障害児用発声訓練システム
- 日本語文章の音声認識システム
- 音声認識システムにおける単語辞書について
- 単語音声の音素系列による表現