Aramaya Dön

Faz bazlı sentetik konuşma dedektörlerini yanıltmak için karmaşık bir cepstrum ses kodlayıcıyla sentetik konuşmayı sonradan işleme

İsim	Faz bazlı sentetik konuşma dedektörlerini yanıltmak için karmaşık bir cepstrum ses kodlayıcıyla sentetik konuşmayı sonradan işleme
Yazar	Demiroğlu, Cenk, Buyuk, O., Khodabakhsh, Ali, Maia, R.
Basım Tarihi:	2017-06
Basım Yeri	- IEEE
Konu	Sahtekarlık, Konuşmacı doğrulama, Sentetik konuşma algılama, Karmaşık cepstrum, Konuşma sentezi, Ses dönüştürme
Tür	Süreli Yayın
Dil	İngilizce
Dijital	Evet
Yazma	Hayır
Kütüphane:	Özyeğin Üniversitesi
Demirbaş Numarası	1932-4553
Kayıt Numarası	c1d66c1e-bdf9-42ed-9e49-7cdec5d5a96e
Lokasyon	Elektrik ve Elektronik Mühendisliği
Tarih	2017-06
Notlar	Telif hakkı kısıtlamaları nedeniyle bu makalenin tam metnine erişim yalnızca abonelik yoluyla mümkündür.
Örnek Metin	Son teknoloji ürünü konuşmacı doğrulama sistemleri, sahtekarlık saldırılarına karşı savunmasızdır. Sorunu çözmek için mevcut sahtekarlık yöntemlerine yönelik yüksek performanslı sentetik konuşma dedektörleri (SSD'ler) önerildi. Çoğu parametrik konuşma kodlayıcının minimum faz filtreleri kullandığı gerçeğinden yararlanan faz tabanlı SSD'ler, sentetik konuşma parametrik bir ses kodlayıcıyla üretildiğinde özellikle başarılıdır. Burada, daha genelleştirilmiş SSD'lerin geliştirilmesini sağlayarak ses doğrulama sistemlerinin güvenliğini artırmak amacıyla faz tabanlı SSD'leri taklit etmek için yeni bir saldırı stratejisi öneriyoruz. Diğer parametrik ses kodlayıcıların aksine, karmaşık cepstrum yaklaşımı karışık fazlı filtreler kullanır, bu da onu faz bazlı SSD'leri yanıltmak için ideal bir aday haline getirir. Faz bazlı SSD'lerin yanı sıra hoparlör doğrulama sistemini taklit etmek için mevcut tekniklere son işlemci olarak karmaşık bir cepstrum ses kodlayıcı kullanılmasını öneriyoruz. Bir konuşma sentezi veya bir ses dönüştürme tekniği ile sentetik konuşma üretildiğinde, her bir sentetik konuşma çerçevesi için, bir spektral mesafe ölçümü kullanılarak bir eğitim veri tabanından doğal bir çerçeve seçilir. Daha sonra sentetik çerçevenin yeniden sentezlenmesi için doğal çerçevenin karmaşık cepstrum parametreleri kullanılır. Önerilen yöntemde, karmaşık cepstrum bazlı yeniden sentez, son işlemci olarak kullanılır. Bu nedenle herhangi bir sentetik konuşma oluşturucuyla birlikte kullanılabilir. Deneysel sonuçlar, yaklaşımın dokuz parametrik saldırı algoritması üzerinden dört aşamalı tabanlı SSD'leri yanıltmada başarılı olduğunu gösterdi. Ayrıca, konuşmacı doğrulama sisteminin yanıltılmasındaki performans, hiçbir son işlemcinin kullanılmadığı durumla karşılaştırıldığında önemli ölçüde düşmedi.
DOI	10.1109/JSTSP.2017.2673807
Cilt	11

Kaynağa git Özyeğin Üniversitesi Özyeğin Üniversitesi - Osmanlıca el yazması arama motoru

Özyeğin Üniversitesi

Faz bazlı sentetik konuşma dedektörlerini yanıltmak için karmaşık bir cepstrum ses kodlayıcıyla sentetik konuşmayı sonradan işleme

Yazar Demiroğlu, Cenk, Buyuk, O., Khodabakhsh, Ali, Maia, R.

Basım Tarihi 2017-06

Basım Yeri - IEEE

Konu Sahtekarlık, Konuşmacı doğrulama, Sentetik konuşma algılama, Karmaşık cepstrum, Konuşma sentezi, Ses dönüştürme

Tür Süreli Yayın

Dil İngilizce

Dijital Evet

Yazma Hayır

Kütüphane Özyeğin Üniversitesi

Demirbaş Numarası 1932-4553

Kayıt Numarası c1d66c1e-bdf9-42ed-9e49-7cdec5d5a96e

Lokasyon Elektrik ve Elektronik Mühendisliği

Tarih 2017-06

Notlar Telif hakkı kısıtlamaları nedeniyle bu makalenin tam metnine erişim yalnızca abonelik yoluyla mümkündür.

Örnek Metin Son teknoloji ürünü konuşmacı doğrulama sistemleri, sahtekarlık saldırılarına karşı savunmasızdır. Sorunu çözmek için mevcut sahtekarlık yöntemlerine yönelik yüksek performanslı sentetik konuşma dedektörleri (SSD'ler) önerildi. Çoğu parametrik konuşma kodlayıcının minimum faz filtreleri kullandığı gerçeğinden yararlanan faz tabanlı SSD'ler, sentetik konuşma parametrik bir ses kodlayıcıyla üretildiğinde özellikle başarılıdır. Burada, daha genelleştirilmiş SSD'lerin geliştirilmesini sağlayarak ses doğrulama sistemlerinin güvenliğini artırmak amacıyla faz tabanlı SSD'leri taklit etmek için yeni bir saldırı stratejisi öneriyoruz. Diğer parametrik ses kodlayıcıların aksine, karmaşık cepstrum yaklaşımı karışık fazlı filtreler kullanır, bu da onu faz bazlı SSD'leri yanıltmak için ideal bir aday haline getirir. Faz bazlı SSD'lerin yanı sıra hoparlör doğrulama sistemini taklit etmek için mevcut tekniklere son işlemci olarak karmaşık bir cepstrum ses kodlayıcı kullanılmasını öneriyoruz. Bir konuşma sentezi veya bir ses dönüştürme tekniği ile sentetik konuşma üretildiğinde, her bir sentetik konuşma çerçevesi için, bir spektral mesafe ölçümü kullanılarak bir eğitim veri tabanından doğal bir çerçeve seçilir. Daha sonra sentetik çerçevenin yeniden sentezlenmesi için doğal çerçevenin karmaşık cepstrum parametreleri kullanılır. Önerilen yöntemde, karmaşık cepstrum bazlı yeniden sentez, son işlemci olarak kullanılır. Bu nedenle herhangi bir sentetik konuşma oluşturucuyla birlikte kullanılabilir. Deneysel sonuçlar, yaklaşımın dokuz parametrik saldırı algoritması üzerinden dört aşamalı tabanlı SSD'leri yanıltmada başarılı olduğunu gösterdi. Ayrıca, konuşmacı doğrulama sisteminin yanıltılmasındaki performans, hiçbir son işlemcinin kullanılmadığı durumla karşılaştırıldığında önemli ölçüde düşmedi.

DOI 10.1109/JSTSP.2017.2673807

Cilt 11