Support Vector Machine を使ったモーラ列からの日本語姓名のアクセント推定(音声, 聴覚)
スポンサーリンク
概要
- 論文の詳細を見る
音声合成において合成音を作るためには, 未登録語であってもそのアクセント型(アクセントの位置の情報)が必要となる.本論文では, Support Vector Machine (SVM)を使って単語の読みから未登録語のアクセント型を推定する三つの方法を提案し, 性能を比較する.第1の方法では, 未登録語の読みを構成する各モーラのトーンの高低をSVMを使って推定し, 得られたトーン変化の中で高いトーンから低いトーンへ下降する場所を探して, アクセント型を判定する.第2の方法では, 単語の長さごとに用意されたSVMを使って, 同じアクセント型をもつ単語の集合に未登録語を分類することによってアクセント型を判定する.第3の方法は, 第2の方法の変形版で, 第2の方法とは異なる方法で単語の読みとアクセント型を表現する.また, 単語の長さによらない単一のSVMを使う.未登録の日本人の姓名を対象にしたアクセント型の推定実験を行ったところ, 第2と第3の手法において決定木の精度を上回り, 最高精度で姓では86.1%, 名では96.0%という結果が得られた.また, 実際のWebのニュース記事に現れた未登録語を対象にした実験でも決定木を上回り, 姓では91%, 名では86%という高い精度が得られ, 本手法の有効性が確認された.
- 2005-03-01
著者
-
浅野 久子
Nttサイバースペース研究所
-
永田 昌明
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
永田 昌明
NTTコミュニケーション科学基礎研究所
-
阿部 匡伸
東日本電信電話株式会社
-
中嶋 秀治
日本電信電話株式会社NTTサイバースペース研究所
-
浅野 久子
日本電信電話株式会社NTTサイバースペース研究所
-
中嶋 秀治
日本電信電話株式会社 Nttサイバースペース研究所
関連論文
- ラベルありデータの選択バイアスに頑健な半教師あり学習
- 同義語情報を用いた確率的単語アライメントモデル
- Wikipediaからの大規模な人オントロジー構築
- 電子メールインテリジェントサービス (「創造的ネットワーク化情報環境に向けて」)
- 日本語語彙大系を用いたWikipediaからの汎用オントロジー構築
- 機械翻訳最新事情 : (下)評価型ワークショップの動向と日本からの貢献
- 機械翻訳最新事情 : (上)統計的機械翻訳入門
- 統計的機械翻訳(自然言語とコンピュータ)
- 意味的等価性検証に基づく記述式解答文の採点法(テキストの類似性・文処理モデル)
- 意味的等価性検証に基づく記述式解答文の採点法(テキストの類似性・文処理モデル)
- Wikipedia からの大規模な人オントロジー構築
- SLP・NL合同セッション「ここまでできるぞ音声/言語処理技術」 : 言語編
- SLP・NL合同セッション「ここまでできるぞ音声/言語処理技術」 : 言語編 : 1 言語処理技術の現状
- リッチアノテーション : 固有表現に焦点をあてた知識抽出の試み(情報抽出(テーマセッション2))
- リッチアノテーション : 固有表現に焦点をあてた知識抽出の試み(情報抽出(テーマセッション2))
- D-12-67 「領域抽出不要型文字認識」に基づく景観中単語認識(D-12. パターン認識・メディア理解, 情報・システム2)
- クロス言語情報検索と多言語情報アクセスシステム (特集論文1 高度検索技術)
- 顧客へのリアルな音声応答を実現するテキスト音声合成技術「Cralinet」 (特集 コンタクトセンタ業務に革新をもたらす音声処理技術)
- Support Vector Machine を使ったモーラ列からの日本語姓名のアクセント推定(音声, 聴覚)
- D-14-13 広帯域音声コーデック(UEMCLIP)のIP電話会議装置への実装(D-14.音声・聴覚,一般講演)
- D-14-12 方向別AGC機能のIP電話会議装置への実装(D-14.音声・聴覚,一般講演)
- Web上の口コミを分析する評判情報インデクシング技術 (特集 ポータルサービスを支える自然言語処理技術)
- マルチメディア時代を支える言語処理技術 (特集論文 メディア処理技術)
- 音声翻訳実験システム(ASURA)のシステム構成と性能評価
- 発話タイプ付きコーパスを用いた確率的対話モデルの自動生成
- 単一化に基づく構文解析における制約の選択的適用
- 音声制御ブラウザ VCWeb の英日シームレス化
- 日本語語彙大系を用いた Wikipedia からの汎用オントロジー構築
- 表層情報を利用したネットニュース領域構造解析
- 表層情報を利用したネットニュース領域構造解析
- チャートパーザによる音声認識候補の効率的解析手法
- 汎用的な意味解析技術への挑戦 (特集 ポータルサービスを支える自然言語処理技術)
- テキスト分類 : 学習理論の「見本市」(情報論的学習理論とその応用)
- ループを含む素性構造単一化における構造共有手法
- 日本語教育のための誤り訂正ローマ字かな変換
- 日本語OCRのための表記と読みの同時形態素解析
- 大規模データを用いた半教師あり学習による高精度係り受け解析モデルの学習
- 構文・照応・評価情報つきブログコーパスの構築
- 再学習による翻訳モデルを用いた単語アライメントの向上
- 予測尤度最大化に基づく誤分類サンプルの検出 (情報論的学習理論と機械学習)
- 言語横断情報検索における画像手がかりを用いたインタラクティブな翻訳曖昧性解消の評価
- 統計的言語モデルとN-best探索を用いた日本語形態素解析法
- 未知語の確率モデルと単語の出現頻度の期待値に基づくテキストからの語彙獲得
- Pitman-Yor過程に基づく確率的木挿入文法モデル
- 表現豊かな音声合成の為のテキストからの句末音調ラベルの予測(音声合成,第13回音声言語シンポジウム)
- 表現豊かな音声合成の為のテキストからの句末音調ラベルの予測(音声合成,第13回音声言語シンポジウム)
- 予測尤度最大化に基づく誤分類サンプルの検出(ポスターセッション,第14回情報論的学習理論ワークショップ)
- カテゴリ名と記事名の意味属性分類に基づくWikipediaからの上位下位関係オントロジーの構築
- 統計的文法獲得モデルのための部分木ブロック化サンプリング法
- 予測尤度最大化に基づく誤分類サンプルの検出
- 表現豊かな音声合成の為のテキストからの句末音調ラベルの予測
- 表現豊かな音声合成の為のテキストからの句末音調ラベルの予測
- 強調音声合成のための局所韻律コンテキスト自動付与の検討(一般,音声知覚生成/聴覚コミュニケーション,一般)
- テキストからの表現豊かな音声合成のための句末上昇ラベル予測における句末コンテキストの利用
- テキストからの表現豊かな音声合成のための句末上昇ラベル予測における句末コンテキストの利用
- カテゴリ名と記事名の意味属性分類に基づく Wikipedia からの上位下位関係オントロジーの構築
- 統計的文法獲得モデルのための擬似部分木ブロック化サンプリング法
- 多様な韻律生成のための多クラス局所韻律コンテキストの検討(オーガナイズドセッション「多様な音声・歌声の合成に向けて」,音声・言語・対話,一般)
- 画像検索を用いた語義別画像付き辞書の構築
- 語順の相関に基づく機械翻訳の自動評価法