تعزيز التعلم لضبط البدائيات الحركية ذات المعلمات إلى المواقف الجديدة
| العنوان | تعزيز التعلم لضبط البدائيات الحركية ذات المعلمات إلى المواقف الجديدة |
|---|---|
| المؤلف | كوبر، ج.، فيلهلم، أ.، أوزتوب، إرهان، بيترز، ج. |
| تاريخ النشر: | 2012-11 |
| مكان النشر | - سبرينغر ساينس + بزنس ميديا |
| الموضوع | تعلم المهارات، البدائيات الحركية، التعلم المعزز، المعلمات الفوقية، تعلم السياسات |
| النوع | دورية |
| اللغة | الإنجليزية |
| رقمي | نعم |
| مخطوط | لا |
| المكتبة: | جامعة اوزيجين |
| معرف أصل المكتبة | 1573-7527 |
| رقم السجل | 1a72cfbd-4fb3-4174-8e3b-f2865b40443d |
| موقع المكتبة | علوم الكمبيوتر |
| التاريخ | 2012-11 |
| ملاحظات | الجماعة الأوروبية |
| نص عينة | يتمكن البشر من تكييف الحركات المستفادة بسرعة كبيرة مع المواقف الجديدة من خلال تعميم السلوكيات المستفادة من المواقف المماثلة. في المقابل، تحتاج الروبوتات حاليًا في كثير من الأحيان إلى إعادة تعلم الحركة الكاملة. في هذا البحث، نقترح طريقة تتعلم كيفية تعميم الخطط الحركية ذات المعلمات من خلال تكييف مجموعة صغيرة من المعلمات العالمية، تسمى المعلمات الفوقية. نحن نستخدم التعلم المعزز لمعرفة المعلمات الفوقية المطلوبة للتعامل مع الوضع الحالي، الذي تصفه الدول. نحن نقدم خوارزمية التعلم المعزز المناسبة بناءً على نسخة النواة من الانحدار المرجح بالمكافأة. ولإظهار جدواها، قمنا بتقييم هذه الخوارزمية على مثال لعبة ومقارنتها بعدة طرق سابقة. بعد ذلك، قمنا بتطبيق النهج على ثلاث مهام روبوتية، أي تعميم حركات الرمي في لعبة السهام، وحركات الضرب في تنس الطاولة، ورمي الكرات حيث يتم تعلم المهام على العديد من الروبوتات المادية الحقيقية المختلفة، أي Barrett WAM، وBioRob، وJST-ICORP/SARCOS CBi، وKuka KR 6. |
| DOI | 10.1007/s10514-012-9290-3 |
| Cilt | 33 |