استخراج ميزات جديدة بناءً على الرسوم البيانية للـ mfccs المستخدمة في تصنيف المشاعر من مجموعة بيانات الكلام الأصلية التي تم إنشاؤها

العنوان استخراج ميزات جديدة بناءً على الرسوم البيانية للـ mfccs المستخدمة في تصنيف المشاعر من مجموعة بيانات الكلام الأصلية التي تم إنشاؤها
المؤلف باكيورك، م.، أتميس، ماهر، كولاك، إس.، أولوداغ، يو.
تاريخ النشر: 2020-02-17
مكان النشر - جامعة كاوناس للتكنولوجيا
الموضوع تصنيف العاطفة، MFCC، إشارة الكلام، SVM
النوع دورية
اللغة الإنجليزية
رقمي نعم
مخطوط لا
المكتبة: جامعة اوزيجين
معرف أصل المكتبة 1392-1215
رقم السجل 402ed8a8-d474-4596-9997-6da02b63c12b
التاريخ 2020-02-17
نص عينة تقدم هذه الورقة مساهمتين مهمتين: إحداهما ميزة جديدة تعتمد على الرسوم البيانية لـ MFCC (معاملات الميل الترددي Cepstral) المستخرجة من الملفات الصوتية التي يمكن استخدامها في تصنيف المشاعر من إشارات الكلام، والأخرى - قاعدة بيانات الكلام الجديدة متعددة اللغات ومتعددة الأشخاص، والتي تحتوي على ثلاثة مشاعر. في هذه الدراسة، يتم استخدام قاعدة بيانات برلين (BD) (باللغة الألمانية) وقاعدة بيانات PAU المخصصة لدينا (باللغة الإنجليزية) التي تم إنشاؤها من مقاطع فيديو YouTube والبرامج التلفزيونية الشهيرة لتدريب نتائج الاختبار وتقييمها. تظهر النتائج التجريبية أن الميزات المقترحة لدينا تؤدي إلى تصنيف أفضل للنتائج من الأساليب الحالية مع آلة دعم المتجهات (SVM) من الأدبيات. بفضل ميزتنا الجديدة، يمكن أن تتفوق هذه الدراسة على عدد من ميزات MFCC والدراسات القائمة على مصنف SVM، بما في ذلك الأبحاث الحديثة. نظرًا لعدم وجود مناهجنا الجديدة القائمة على الميزات، تم تنفيذ أحد إطاري MFCC وSVM الأكثر شيوعًا، ويتم استخدام إحدى قواعد بيانات Berlin DB الأكثر شيوعًا لمقارنة نهجنا الجديد مع هذا النوع من الأساليب.
DOI 10.5755/j01.eie.26.1.25310
Cilt 26
عرض في المصدر جامعة اوزيجين جامعة اوزيجين - محرك بحث المخطوطات العثمانية
جامعة اوزيجين - محرك بحث المخطوطات العثمانية جامعة اوزيجين

استخراج ميزات جديدة بناءً على الرسوم البيانية للـ mfccs المستخدمة في تصنيف المشاعر من مجموعة بيانات الكلام الأصلية التي تم إنشاؤها

المؤلف باكيورك، م.، أتميس، ماهر، كولاك، إس.، أولوداغ، يو.
تاريخ النشر 2020-02-17
مكان النشر - جامعة كاوناس للتكنولوجيا
الموضوع تصنيف العاطفة، MFCC، إشارة الكلام، SVM
النوع دورية
اللغة الإنجليزية
رقمي نعم
مخطوط لا
المكتبة جامعة اوزيجين
معرف أصل المكتبة 1392-1215
رقم السجل 402ed8a8-d474-4596-9997-6da02b63c12b
التاريخ 2020-02-17
نص عينة تقدم هذه الورقة مساهمتين مهمتين: إحداهما ميزة جديدة تعتمد على الرسوم البيانية لـ MFCC (معاملات الميل الترددي Cepstral) المستخرجة من الملفات الصوتية التي يمكن استخدامها في تصنيف المشاعر من إشارات الكلام، والأخرى - قاعدة بيانات الكلام الجديدة متعددة اللغات ومتعددة الأشخاص، والتي تحتوي على ثلاثة مشاعر. في هذه الدراسة، يتم استخدام قاعدة بيانات برلين (BD) (باللغة الألمانية) وقاعدة بيانات PAU المخصصة لدينا (باللغة الإنجليزية) التي تم إنشاؤها من مقاطع فيديو YouTube والبرامج التلفزيونية الشهيرة لتدريب نتائج الاختبار وتقييمها. تظهر النتائج التجريبية أن الميزات المقترحة لدينا تؤدي إلى تصنيف أفضل للنتائج من الأساليب الحالية مع آلة دعم المتجهات (SVM) من الأدبيات. بفضل ميزتنا الجديدة، يمكن أن تتفوق هذه الدراسة على عدد من ميزات MFCC والدراسات القائمة على مصنف SVM، بما في ذلك الأبحاث الحديثة. نظرًا لعدم وجود مناهجنا الجديدة القائمة على الميزات، تم تنفيذ أحد إطاري MFCC وSVM الأكثر شيوعًا، ويتم استخدام إحدى قواعد بيانات Berlin DB الأكثر شيوعًا لمقارنة نهجنا الجديد مع هذا النوع من الأساليب.
DOI 10.5755/j01.eie.26.1.25310
Cilt 26
جامعة اوزيجين - محرك بحث المخطوطات العثمانية
جامعة اوزيجين يتم إعادة توجيهك...

يرجى الانتظار