تعزيز التعلم لضبط البدائيات الحركية ذات المعلمات إلى المواقف الجديدة

العنوان تعزيز التعلم لضبط البدائيات الحركية ذات المعلمات إلى المواقف الجديدة
المؤلف كوبر، ج.، فيلهلم، أ.، أوزتوب، إرهان، بيترز، ج.
تاريخ النشر: 2012-11
مكان النشر - سبرينغر ساينس + بزنس ميديا
الموضوع تعلم المهارات، البدائيات الحركية، التعلم المعزز، المعلمات الفوقية، تعلم السياسات
النوع دورية
اللغة الإنجليزية
رقمي نعم
مخطوط لا
المكتبة: جامعة اوزيجين
معرف أصل المكتبة 1573-7527
رقم السجل 1a72cfbd-4fb3-4174-8e3b-f2865b40443d
موقع المكتبة علوم الكمبيوتر
التاريخ 2012-11
ملاحظات الجماعة الأوروبية
نص عينة يتمكن البشر من تكييف الحركات المستفادة بسرعة كبيرة مع المواقف الجديدة من خلال تعميم السلوكيات المستفادة من المواقف المماثلة. في المقابل، تحتاج الروبوتات حاليًا في كثير من الأحيان إلى إعادة تعلم الحركة الكاملة. في هذا البحث، نقترح طريقة تتعلم كيفية تعميم الخطط الحركية ذات المعلمات من خلال تكييف مجموعة صغيرة من المعلمات العالمية، تسمى المعلمات الفوقية. نحن نستخدم التعلم المعزز لمعرفة المعلمات الفوقية المطلوبة للتعامل مع الوضع الحالي، الذي تصفه الدول. نحن نقدم خوارزمية التعلم المعزز المناسبة بناءً على نسخة النواة من الانحدار المرجح بالمكافأة. ولإظهار جدواها، قمنا بتقييم هذه الخوارزمية على مثال لعبة ومقارنتها بعدة طرق سابقة. بعد ذلك، قمنا بتطبيق النهج على ثلاث مهام روبوتية، أي تعميم حركات الرمي في لعبة السهام، وحركات الضرب في تنس الطاولة، ورمي الكرات حيث يتم تعلم المهام على العديد من الروبوتات المادية الحقيقية المختلفة، أي Barrett WAM، وBioRob، وJST-ICORP/SARCOS CBi، وKuka KR 6.
DOI 10.1007/s10514-012-9290-3
Cilt 33
عرض في المصدر جامعة اوزيجين جامعة اوزيجين - محرك بحث المخطوطات العثمانية
جامعة اوزيجين - محرك بحث المخطوطات العثمانية جامعة اوزيجين

تعزيز التعلم لضبط البدائيات الحركية ذات المعلمات إلى المواقف الجديدة

المؤلف كوبر، ج.، فيلهلم، أ.، أوزتوب، إرهان، بيترز، ج.
تاريخ النشر 2012-11
مكان النشر - سبرينغر ساينس + بزنس ميديا
الموضوع تعلم المهارات، البدائيات الحركية، التعلم المعزز، المعلمات الفوقية، تعلم السياسات
النوع دورية
اللغة الإنجليزية
رقمي نعم
مخطوط لا
المكتبة جامعة اوزيجين
معرف أصل المكتبة 1573-7527
رقم السجل 1a72cfbd-4fb3-4174-8e3b-f2865b40443d
موقع المكتبة علوم الكمبيوتر
التاريخ 2012-11
ملاحظات الجماعة الأوروبية
نص عينة يتمكن البشر من تكييف الحركات المستفادة بسرعة كبيرة مع المواقف الجديدة من خلال تعميم السلوكيات المستفادة من المواقف المماثلة. في المقابل، تحتاج الروبوتات حاليًا في كثير من الأحيان إلى إعادة تعلم الحركة الكاملة. في هذا البحث، نقترح طريقة تتعلم كيفية تعميم الخطط الحركية ذات المعلمات من خلال تكييف مجموعة صغيرة من المعلمات العالمية، تسمى المعلمات الفوقية. نحن نستخدم التعلم المعزز لمعرفة المعلمات الفوقية المطلوبة للتعامل مع الوضع الحالي، الذي تصفه الدول. نحن نقدم خوارزمية التعلم المعزز المناسبة بناءً على نسخة النواة من الانحدار المرجح بالمكافأة. ولإظهار جدواها، قمنا بتقييم هذه الخوارزمية على مثال لعبة ومقارنتها بعدة طرق سابقة. بعد ذلك، قمنا بتطبيق النهج على ثلاث مهام روبوتية، أي تعميم حركات الرمي في لعبة السهام، وحركات الضرب في تنس الطاولة، ورمي الكرات حيث يتم تعلم المهام على العديد من الروبوتات المادية الحقيقية المختلفة، أي Barrett WAM، وBioRob، وJST-ICORP/SARCOS CBi، وKuka KR 6.
DOI 10.1007/s10514-012-9290-3
Cilt 33
جامعة اوزيجين - محرك بحث المخطوطات العثمانية
جامعة اوزيجين يتم إعادة توجيهك...

يرجى الانتظار