調波構造分離と子音補完による音声ストリーム分離

概要

論文の詳細を見る
1996-03-01

著者

奥乃博
京都大学大学院情報学研究科知能情報学専攻
川端豪
Ntt研究所
中谷智広
NTT 基礎研究所
川端豪
NTT 基礎研究所
奥乃博
NTT 基礎研究所
中谷智広
Ntt基礎研究所:(現)東日本電信電話(株)法人営業本部
奥乃博
Ntt 基礎研

関連論文

複数の言語モデルと言語理解モデルによる音声理解の高精度化(音声認識・理解,情報爆発論文)
調波構造と音源方向に基づく音源分離法における残響耐性の改善(音響と音声処理,音声強調,ロバスト音声認識)
発話行為レベルの情報を活用した音声対話システムの研究
音声分離と楽音分離の統合のための音オントロジーの提案
背景音楽つき音声に対する音響ストリームの分離
背景音楽つき音声に対する音響ストリームの分離
多重奏中の歌声の基本周波数と有声音素の同時推定手法
テルミンの音高・音量特性のモデルに基づくテルミン演奏ロボットの開発
RNNを備えた2体のロボット間における身体性に基づいた動的コミュニケーションの創発
Query-by-Conducting:テンポ類似性に基づく同一楽曲における多様な解釈の検索インタフェース
多重奏音響信号中の演奏をユーザー指定の旋律に差し替えるフレーズ置換システム
バージイン許容音声対話システムにおけるユーザ発話の分析と指示対象同定への応用
SpeakBySinging: 歌声を話声に変換する話声合成システム
テキスト選択に基づくタスク依存言語モデル構築の検討
音声対話によるテキスト内容の伝達方法
大規模データベースを用いたタスク依存言語モデル構築の検討
ICSLP-98 会議報告
システム発話のnon-verbal情報がユーザーの対話行動へ与える影響
韻律情報に着目した相互理解発話モデル
非言語的現象の分析と対話処理 : 電子メール討論(音声対話システムの実力と課題)
文型と音調によるユーザ発話行為理解
逐次的音声認識・理解のためのISTARアーキテクチャ
文型と音調によるユーザの発話意図の推定
TV番組の録画予約を受け付ける実時間音声対話システム
多重文脈を用いた逐次的な発話理解
細かな発話単位の処理に基づく対話システム
話しことば対話によるテキスト内容の伝達
話しことば対話によるテキスト内容の伝達
複数の対話ドメインにおける協調的対話原則の分析
音声対話システムNoddy : ユーザ発話途中でのうなずき・相槌生成
わかってうなずくコンピュータの試作
わかってうなずくコンピュータの試作
わかってうなずくコンピュータの試作
バージイン許容音声対話システムにおけるユーザ発話の分析と指示対象同定への応用
調波構造と音源方向に基づく音源分離法における残響耐性の改善(音響と音声処理,音声強調,ロバスト音声認識)
音オントロジーに基づいた音環境理解システムの統合 (「オントロジーの基礎と応用」)
マルチエージェントシステムによる音響ストリーム分離
音声ストリーム分離法の提案と複数音声の同時認識の予備実験
調波構造分離と子音補完による音声ストリーム分離
音響ストリーム分離の音声認識からの評価
音響ストリーム分離の音声認識からの評価
カクテルパーティ効果実現のための音響ストリーム分離の検討 : II.残差駆動型アーキテクチャの提案とモノラル音への適用
カクテルパーティ効果実現のための音響ストリーム分離の検討 : I.音環境理解によるモデル化
音環境理解のためのマルチエージェントによる調波構造ストリームの分離
マルチエージェントシステムによる音響ストリーム分離 : ストリーム分離の排他性の向上
マルチエージェントシステムによる音響ストリーム分離のダイナミクス
創発的計算モデルによる音環境理解 : 音響ストリーム分離エージェントの構築と評価
3U-2 複数の言語モデルと言語理解モデルによる音声理解手法のラピッドプロトタイピングへの適用(音声認識・理解,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
6J-6 楽器音イコライザによる楽曲音響特徴変動と類似楽曲検索への応用(情報爆発時代における対話ロボティクス,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
対話調整の表出における韻律的特徴の分析
対話調整の表出における韻律的特徴の分析
音声の音響的特性を用いた顔方向認識
音声の音響的特性を用いた顔方向認識
音声対話の発話交代に関わる現象の分析
共同作業タスクにおける対話の分析
二項事後分布に基づくN-gram言語モデルのBack-off平滑化
二項事後分布に基づくN-gram言語モデルのBack-off平滑化
共同作業タスクにおける対話の分析
談話標識語の音韻的研究(II)
談話標識語の音韻的研究(II)
談話標識語の音韻的研究
談話標識語の音韻的研究
5V-6 RNNを用いた行為予測による人間とロボットの協調物体配置(人工知能一般(4),学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
6U-1 F0・振幅・音韻長の制御により歌声を話声に変換する話声合成システムSpeakBySinging(音声・歌声合成,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
AI-1-3 ロボット聴覚オープンソースソフトウエアHARK(AI-1.マルチモーダル信号処理とその応用,依頼シンポジウム,ソサイエティ企画)
6J-8 実環境音声認識のためのロボット聴覚システム開発とパラメータチューニング(情報爆発時代における対話ロボティクス,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
6J-7 ロボット音声対話におけるSemi-blind ICAを用いた自己発話キャンセル(情報爆発時代における対話ロボティクス,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
2ZN-2 バージイン許容音声対話におけるLSMによる許容発話範囲の拡張(情報爆発時代における対話インタラクション,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
バージイン発話タイミングモデルを導入した指示対象同定
6W-8 MTRNNを用いた単語と文法の階層的自己組織化による文の認識・生成(構文解析・生成・学習,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
5U-9 ユーザの文法知識を状態に加えたPOMDPに基づく音声対話システム(音声インタフェース・システム,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
3U-9 環境音から擬音語への自動変換における特徴量抽出法の検討(音声認識・理解,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
3U-7 スペクトル推定を用いたマイク数以上の同時発話に対する音声認識(音声認識・理解,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
音声理解システムJUNOにおける対話マスコット
残差駆動型アーキテクチャの提案と音響ストリーム分離への応用
BPD Back-off法における継承係数の決定法
N-gram記号連鎖確率の統計的性質
音声認識のための新しい言語処理
二項事後分布に基づくN-gram言語モデルのBack-off平滑化
確率文法と話題マルコフモデルに基づく音声認識のための話題制御
ベース音高と和音特徴の統合に基づく和音系列認識
ロボット聴覚用オープンソースソフトウェアHARKの展開 (特集世界に飛び出す日本のソフトウェア)
MAHL:演奏者間のインタラクション分析のためのスコアアライメント手法の提案
歌詞と音響特徴量を用いた楽曲印象軌跡推定法の設計と評価
ドメイン外発話が扱え拡張性が高い対話ドメイン選択フレームワーク
ドメイン外発話が扱え拡張性が高い対話ドメイン選択フレームワーク
ぺた語義:京大における Lisp を使ったプログラミング教育
視聴覚統合ビートトラッキングを用いた音楽ロボットとギターとの合奏システム
ロボットを対象とした二階層視聴覚統合音声認識システム
多数の人の声を一度に聞き分ける聴覚技術 : 聖徳太子ロボットを目指して
ロボット聴覚 : 高雑音下でのハンズフリー音声認識(オーガナイズドセッション,一般,オーガナイズドセッション(雑音を消せ!騒音下で有効な音声信号処理とは))
音楽共演ロボット:開始・終了キューの画像認識による人間のフルート奏者との実時間同期
音声対話システムにおける簡略表現認識のための自動語彙拡張
フレーズ置換のための調波非調波GMM・NMFに基づく音源分離・演奏合成
発語行為レベルの情報をユーザ発話の解釈に用いる音声対話システム
混合音を聞き分けるセンシング技術 (特集人間を理解するためのICT技術 : 人間を対象としたセンシング・情報処理からその応用まで) -- (人間をセンシングする技術)
ベイジアン非負値調波因子分解と多重基本周波数推定への応用
押弦制約と運指制約を用いたタブ譜自動生成システム
2-2 混合音を聞き分けるセンシング技術(2.人間をセンシングする技術,人間を理解するためのICT技術-人間を対象としたセンシング・情報処理からその応用まで-)
ロボット聴覚用オープンソースソフトウェア HARKの展開

調波構造分離と子音補完による音声ストリーム分離

スポンサーリンク

概要

著者

関連論文

スポンサーリンク