日本語文音声認識システムを利用した音声圧縮・編集方法の提案
スポンサーリンク
概要
- 論文の詳細を見る
近年,音声認識の分野では,音素HMMのようなサブワードを認識単位とした統計的連続音声認識手法の研究が活発である.発声単位等にまだ制約が残るものの,既に英語に対しては,ディクテーションシステムが実用化されるに至っている.一方,テキスト音声合成の分野でも,ピッチ同期波形重畳法(PSOLA)による音声合成手法が開発され,合成音の音質を,大幅に改善出来ることが示された.ただ,韻律については,まだ不自然な部分も多く,テキスト解析の精度向上とともに,今後の課題として残っている.もし,音声認識システムを用いて発声内容のテキスト(読み),ならびに韻律情報を自動抽出し,これを既存のテキスト音声合成システムの言語解析部の出力と置き換えることが出来れば,情報圧縮の観点からは非常に効率のよい分析合成系を構築できる.ただ,これを一般的な音声の符号化法として用いるには,まだ,認識率が不十分であるが,ユーザーが入力内容の確認・修正を行う,ディクテーションシステムの利用を前提とした場合には,音声付きの文書データを効率良く作成でき,さらに,テキスト上で,音声の編集が可能になるという利点がある.また,同様にして,個人用の音声合成素片辞書を自動生成することも可能になるだろう.逆に,他人の素片辞書を用いることで,声質変換としての応用も期待出来る.本論文では,このような音声認識を前提とする分析合成システムの構成について述べるとともに,文音声の韻律(音素継続長と,基本周波数)の自動抽出に関して基本的な検討を行ったので報告する.
- 一般社団法人情報処理学会の論文
- 1994-09-20
著者
-
阪本 正治
日本アイ・ビー・エム株式会社東京基礎研究所
-
西村 雅史
日本アイ・ビー・エム株式会社東京基礎研究所
-
西村 雅史
日本アイ・ビー・エム(株)
-
鈴木 和洋
日本アイ・ビー・エム(株)東京基礎研究所
-
大嶋 良明
日本アイ・ビー・エム東京基礎研究所
-
斎藤 隆
日本アイ・ビー・エム東京基礎研究所
-
鈴木 和洋
日本アイ・ビー・エム株式会社東京基礎研究所
関連論文
- IBMプロフェッショナル論文 作業効率の高いテキスト合成音声チューニング環境
- 電子スクラップシステム(ユビキタスシステム,マルチメディア,分散,協調とモバイル(DICOMO2005))
- 波形重畳型音声合成の韻律と音質のためのF0傾きモデルの利用(音声合成・韻律,第9回音声言語シンポジウム)
- コーパスベース日本語音声合成フロントエンド(音声システム,システム開発論文)
- MatlabParallelizer : MATLABのMaster-Worker並列化(並列・分散システム,システム開発論文)
- ユーザの発話傾向分析に基づく車載機器操作のための音声入力手法の検討(音声システム,システム開発論文)
- カーナビの音声インターフェース--理想と現実のギャップ
- 単語クラスタリングによる確率的言語モデルの分野適応
- 電話音声による列車時刻問合せシステムの評価
- LSAにもとづく電話音声情報検索システム
- 子供音声データベース
- 構造を仮定しない文解釈の一手法
- 講義コーパスを用いた自由発話の大語彙連続音声認識(音声情報処理 : 現状と将来技術論文特集)
- 形態素係り受けモデルによる構文解析
- 2000-SLP-32-3 構文構造を反映した確率的言語モデル
- 放送大学コーパスを用いた自由発話の大語彙連続音声認識
- 口語体言語モデルのためのコーパス
- 単語を認識単位とした日本語の大語彙連続音声認識 (音声言語情報処理)
- 音声ワープロ : 過去・現在・未来
- 放送音声の書き起こしに関する検討
- 音声認識・合成によるホームページの閲覧方式
- 単語単位による日本語言語モデルの検討
- ニュース音声書き起こしシステムに関する検討
- 単語を認識単位とした日本語の大語彙連続音声認識
- 7 音声インタフェースの現状とイノベーションの可能性(音声認識技術の実用化への取り組み)
- 波形重畳型音声合成の韻律と音質のためのF0傾きモデルの利用(音声合成・韻律,第9回音声言語シンポジウム)
- 波形重畳型音声合成の韻律と音質のためのF0傾きモデルの利用(音声合成・韻律,第9回音声言語シンポジウム)
- Cell Broadband EngineTMプロセッサを利用したセキュアソフトウェアプラットフォームの実現
- 高品質な感情音声を合成する手法と顔型ロボットへの実装例
- 電話音声による列車時刻問合せシステムの評価
- 日本語自由発話電話音声からの固有表現抽出
- 長時間スペクトル変動と調波構造に基づく発話区間検出法の音声認識による評価
- 日本語生コーパスから自動獲得した未知語と言語モデルによる大語彙連続音声認識([特別セッション]音声言語獲得・学習技術(2), 未知語処理)
- 音声合成を用いたインターネット動画用音声ガイド
- 音声とテキストを用いた認識単語辞書の自動構築
- フェノニックマルコフモデルに基づく音声認識のための話者適応化法
- ボイスフォントに基づく話者性を有する音声の合成
- ボイスフォントの話者性の評価
- シームレス音声合成におけるイントネーションの生成に関する検討
- F0形状の統計的操作に基づくイントネーションの生成
- ボイスフォント・ビルダー : テキスト音声合成における音声辞書作成ツール
- テキスト音声合成を利用した音素・韻律統合ラベリングシステム
- 話者特徴を反映した音声合成のための音声特徴抽出
- ウェーブレット変換を用いた自動ピッチマーキング手法
- 環境依存性を考慮した音節を合成単位とする音声合成 -音素クラスターを用いた音節合成単位の生成-
- 波形重畳法を用いた日本語テキスト音声合成システムについて
- 音声合成にどこまで使えるか?--テキストから抑揚をもった音声へ変換 (ウェ-ブレットの産業応用)
- ユーザの発話傾向分析に基づく車載機器操作のための音声入力手法の検討
- 長時間スペクトル変動情報と調波構造特徴量を併用した発話区間検出法(音声認識技術)
- 自動車内音声認識のためのスペクトル サブトラクションとエコーキャンセラの同時適応法
- プロファイル・フィッティング法による音源位置推定
- プロファイルフィッティング法による雑音抑圧処理
- ビーム形状に注目した音声強調処理
- 多重ベータ混合モデルを用いた調波時間構造のモデル化による音声合成の検討(一般(ポスターセッション),第11回音声言語シンポジウム)
- 多重ベータ混合モデルを用いた調波時間構造のモデル化による音声合成の検討(一般(ポスターセッション),第11回音声言語シンポジウム)
- 講義関連コーパスを利用した音声認識システムの自動適応(音声,聴覚)
- 音声合成のための自動アクセントラベリング(セッション5 : 音声認識+音声合成)
- 音声合成のための自動アクセントラベリング(セッション5 : 音声認識+音声合成)
- N-gramモデルを用いた音声合成のための読みおよびアクセントの同時推定(音声言語,情報処理技術のフロンティア)
- 確率モデルを用いた読み及びアクセント推定(言語解析, 対話)
- 読み上げ韻律との差分を使った強調韻律の学習
- 音声認識ビジネスの現状と将来展望(音声認識のビジネス動向)
- 雑音・残響下音声認識におけるHMM分離・合成法の改良(音響と音声処理,音声強調,ロバスト音声認識)
- 雑音・残響下音声認識におけるHMM分離・合成法の改良(音響と音声処理,音声強調,ロバスト音声認識)
- ハンズフリー音声認識におけるHMM分離法の改良
- 残響下音声認識におけるHMM分離法の改良
- 調波構造と音源方向を利用した音声強調手法の検討
- フレーム単位でのモデル選択による突発性雑音下での音声認識
- 車内音声認識におけるマルチスタイル学習法の効果について
- HMM 合成と遅延和アレーの統合による混合音声の認識
- HMM合成法を用いた混合音声の認識
- IBM電話音声自動応答システム(音声処理技術のデモの紹介)
- 日本語ディクテーションシステムの現状と今後の課題
- 日本語ディクテーションシステムの現状と今後の課題
- 日本語ディクテーションシステムの現状と今後の課題
- 音声認識・理解のための統計的言語処理
- 音声ワープロ最新事情
- IBMプロフェッショナル論文 息継ぎ音を利用したコールセンター会話音声の発話分割
- 単語を認識単位とした日本語大語彙連続音声認識
- 単語を認識単位とした日本語ディクテーションシステム
- 人の発声単位を考慮した日本語言語モデルの検討 : 日本語における単語とは
- 単語を認識単位とした日本語ディクテーションシステム
- 口述筆記や音声対話,音声自動翻訳に実用化されはじめた 声認識技術の基礎と応用プログラム開発手法 (特集 マルチメディア/インタ-ネット時代の必須技術となる 圧縮/認識/合成を追求する音声処理の徹底研究)
- 音声認識の最新技術--日本語ディクテ-ションプログラム
- N-gramを用いた日本語テキストの単語単位への分割
- クラスに基づく言語モデルのための単語クラスタリング
- 離散単語発生による日本語ディクテーションシステムについて
- 日本語Dictation Systemのための統計的言語モデルに関する一考察
- 適応ノイズキャンセラを用いた高騒音下での音声認識
- 日本語文音声認識システムを利用した音声圧縮・編集方法の提案
- Decision Treeによる日本語音素環境クラスタリングの検討
- 汎用音声処理カードによる大語彙音声認識
- 応答音声から本人を確認する方式
- 音響信号処理とウェーブレット変換(ウェーブレット)
- PC系 音声認識ソフトウエアの到達点 (特集 入力しなければ何も起きない「情報入力技術」に注目!!)
- 音声認識ソフトウエアの実力(IBM) (特集 応用製品も登場、いよいよ実用化時代へ 99音声認識探検隊) -- (応用事例)
- 素片接続によるF0パターンの生成
- 息継ぎ音を利用した電話音声の発話分割 (音声)
- ウェーブレット変換を用いた自動ピッチマーキング手法
- 波形接続型音声合成のための波形処理の検討