Aramaya Dön

MAP yaklaşımını ve en yakın komşuları kullanan istatistiksel konuşma sentezi sistemleri için minimum veriyle öz ses hoparlör uyarlaması

İsim	MAP yaklaşımını ve en yakın komşuları kullanan istatistiksel konuşma sentezi sistemleri için minimum veriyle öz ses hoparlör uyarlaması
Yazar	Mohammadi, Amir, Sarfjoo, Seyyed Saeed, Demiroğlu, Cenk
Basım Tarihi:	2014-12
Basım Yeri	- IEEE
Konu	Küme uyarlamalı eğitim, Özses uyarlaması, En yakın komşu, Konuşmacı uyarlaması, İstatistiksel konuşma sentezi
Tür	Süreli Yayın
Dil	İngilizce
Dijital	Evet
Yazma	Hayır
Kütüphane:	Özyeğin Üniversitesi
Demirbaş Numarası	2329-9290
Kayıt Numarası	381836f7-5637-4ed5-aa56-4a55290fcaf5
Lokasyon	Elektrik ve Elektronik Mühendisliği
Tarih	2014-12
Notlar	Telif hakkı kısıtlamaları nedeniyle bu makalenin tam metnine erişim yalnızca abonelik yoluyla mümkündür.
Örnek Metin	İstatistiksel konuşma sentezi (SSS) sistemleri, birkaç dakikalık uyarlama verileriyle hedef konuşmacıya uyum sağlama yeteneğine sahiptir. Adaptasyon ifadelerinin sayısını birkaç saniyelik veriye daha da azaltmak için adaptasyon algoritmaları geliştirmek, teknolojinin tüketici elektroniği cihazları gibi gerçek hayattaki uygulamalara uygulanması üzerinde önemli bir etkiye sahip olabilir. Bu kadar hızlı adaptasyonu sağlamanın geleneksel yolu, konuşma tanımada iyi çalışan ancak istatistiksel konuşma sentezinde algısal yapaylıklar ürettiği bilinen özses tekniğidir. Burada, minimum veriyle hoparlör uyarlamasına izin verirken temel özses uyarlama algoritmasının kalite sorunlarını hafifletmek için üç yöntem öneriyoruz. İlk yöntemimiz, yapaylıkları azaltmak amacıyla uyarlama algoritmasını hoparlör alanında gerçekçi yönlerde hareket edecek şekilde sınırlamak için Bayesian özses yaklaşımını kullanmaya dayanmaktadır. İkinci yöntemimiz, hedef konuşmacıya yakın, önceden eğitilmiş referans hoparlörleri bulmaya ve ikinci bir özses uyarlama yinelemesinde yalnızca bu referans hoparlör modellerini kullanmaya dayanmaktadır. Her iki teknik de objektif testlerde temel öz ses yönteminden önemli ölçüde daha iyi performans gösterdi. Benzer şekilde, her ikisi de öznel testlerde temel öz ses yöntemiyle karşılaştırıldığında konuşma kalitesini artırdı. Üçüncü yöntemde, önerilen özses yönteminin son teknoloji ürünü doğrusal regresyona dayalı uyarlama tekniğiyle birlikte kullanılmasının uyarılma özelliklerinin uyumunu iyileştirdiği bulunmuştur.
DOI	10.1109/TASLP.2014.2362009
Cilt	22

Kaynağa git Özyeğin Üniversitesi Özyeğin Üniversitesi - Tarihî eser, arşiv ve süreli yayın arama motoru

Özyeğin Üniversitesi

MAP yaklaşımını ve en yakın komşuları kullanan istatistiksel konuşma sentezi sistemleri için minimum veriyle öz ses hoparlör uyarlaması

Yazar Mohammadi, Amir, Sarfjoo, Seyyed Saeed, Demiroğlu, Cenk

Basım Tarihi 2014-12

Basım Yeri - IEEE

Konu Küme uyarlamalı eğitim, Özses uyarlaması, En yakın komşu, Konuşmacı uyarlaması, İstatistiksel konuşma sentezi

Tür Süreli Yayın

Dil İngilizce

Dijital Evet

Yazma Hayır

Kütüphane Özyeğin Üniversitesi

Demirbaş Numarası 2329-9290

Kayıt Numarası 381836f7-5637-4ed5-aa56-4a55290fcaf5

Lokasyon Elektrik ve Elektronik Mühendisliği

Tarih 2014-12

Notlar Telif hakkı kısıtlamaları nedeniyle bu makalenin tam metnine erişim yalnızca abonelik yoluyla mümkündür.

Örnek Metin İstatistiksel konuşma sentezi (SSS) sistemleri, birkaç dakikalık uyarlama verileriyle hedef konuşmacıya uyum sağlama yeteneğine sahiptir. Adaptasyon ifadelerinin sayısını birkaç saniyelik veriye daha da azaltmak için adaptasyon algoritmaları geliştirmek, teknolojinin tüketici elektroniği cihazları gibi gerçek hayattaki uygulamalara uygulanması üzerinde önemli bir etkiye sahip olabilir. Bu kadar hızlı adaptasyonu sağlamanın geleneksel yolu, konuşma tanımada iyi çalışan ancak istatistiksel konuşma sentezinde algısal yapaylıklar ürettiği bilinen özses tekniğidir. Burada, minimum veriyle hoparlör uyarlamasına izin verirken temel özses uyarlama algoritmasının kalite sorunlarını hafifletmek için üç yöntem öneriyoruz. İlk yöntemimiz, yapaylıkları azaltmak amacıyla uyarlama algoritmasını hoparlör alanında gerçekçi yönlerde hareket edecek şekilde sınırlamak için Bayesian özses yaklaşımını kullanmaya dayanmaktadır. İkinci yöntemimiz, hedef konuşmacıya yakın, önceden eğitilmiş referans hoparlörleri bulmaya ve ikinci bir özses uyarlama yinelemesinde yalnızca bu referans hoparlör modellerini kullanmaya dayanmaktadır. Her iki teknik de objektif testlerde temel öz ses yönteminden önemli ölçüde daha iyi performans gösterdi. Benzer şekilde, her ikisi de öznel testlerde temel öz ses yöntemiyle karşılaştırıldığında konuşma kalitesini artırdı. Üçüncü yöntemde, önerilen özses yönteminin son teknoloji ürünü doğrusal regresyona dayalı uyarlama tekniğiyle birlikte kullanılmasının uyarılma özelliklerinin uyumunu iyileştirdiği bulunmuştur.

DOI 10.1109/TASLP.2014.2362009

Cilt 22