جلسه دفاع پایان نامه: عفیفه ملکی قلقاچی، گروه کامپیوتر
عنوان پایان نامه: بهبود الگوریتم بهینهسازی گرگ خاکستری با استفاده از یادگیری تقویتی چندعاملی
ارائه کننده: عفیفه ملکی قلقاچی استاد راهنما: دکتر مهدی رعایائی اردکانی استاد مشاور اول: دکتر محمد صنیعی آباده استاد ناظر داخلی: دکتر نصراله مقدم چرکری استاد ناظر خارج از دانشگاه: دکتر علیرضا رضوانیان (دانشگاه علم و فرهنگ) تاریخ: ۱۴۰۳/۰۶/۲۶ ساعت: ۱۴ مکان: اتاق ۳۵۱
چکیده: الگوریتم های فراابتکاری به دلیل ساختار انعطاف پذیر و توانایی حل مسائل پیچیده، کاربرد گسترده ای در بهینه سازی دارند. با این حال، این الگوریتم ها اغلب در بهینه های محلی گیر می کنند و از پتانسیل کامل داده های تولید شده توسط خود برای بهبود عملکردشان استفاده نمی کنند. به طور خاص، الگوریتم گرگ خاکستری علی رغم سادگی و کارایی بالا، به دلیل جستجوی محدود اطراف سه گرگ رهبر و اختصاص وزن های یکسان به آن ها، عملکرد اکتشاف و همگرایی مناسبی در برخی مسائل ندارد. علاوه بر این، چون مقداردهی اولیه جمعیت به صورت تصادفی می باشد، به شدت بر پاسخ نهایی تأثیر می گذارد. در این تحقیق، برای رفع این مشکلات و بهبود عملکرد الگوریتم گرگ خاکستری، از یادگیری تقویتی استفاده شده است تا داده های تولید شده توسط الگوریتم به نحو موثرتری به کار گرفته شده و الگوریتم با دریافت بازخوردهای مناسب هدایت شود. ابتدا، مقداردهی اولیه جمعیت به عنوان یک مسئله تصمیم گیری مارکوف مدل سازی شده و با بهره گیری از یادگیری تقویتی، گرگ ها در موقعیت های بهینه تری قرار گرفته اند. همچنین، به منظور بهبود توازن بین اکتشاف و بهره برداری، از الگوریتم های چندعاملی یادگیری تقویتی برای اشتراک گذاری تجربیات استفاده شده است، به گونه ای که هر عامل بتواند از تجربیات سایر گرگ ها بهره مند شود. علاوه بر این، تابع به روزرسانی گرگ های رهبر نیز به عنوان یک مسئله یادگیری تقویتی مدل سازی شده تا از گیر افتادن در بهینه های محلی جلوگیری شود. نتایج ارزیابی ها بر روی ۲۳ تابع محک استاندارد، نشان دهنده بهبود قابل توجه روش پیشنهادی در معیارهای مختلف مانند دقت، پایداری، سرعت همگرایی و توانایی در فرار از بهینه های محلی در مقایسه با نسخه استاندارد گرگ خاکستری و سایر الگوریتم های گرگ خاکستری بهبودیافته است. روش پیشنهادی با ۸ الگوریتم مقایسه شده است. نتایج نشان می دهند که در ۱۵ مورد از ۲۳ تابع، روش پیشنهادی برای مقداردهی اولیه جمعیت و توازن اکتشاف و بهره برداری نسبت به الگوریتم پایه عملکرد بهتری داشته است. در ۱۷ مورد برای توابع به روزرسانی گرگ های رهبر نسبت به الگوریتم پایه عملکرد بهتری داشته است. روش پیشنهادی تجمیع شده در ۲۱ مورد به نتایج بهتری نسبت به نسخه پایه دست یافته است. همچنین الگوریتم پیشنهادی در مقایسه با سایر روش ها در معیارهای مختلف پایداری، سرعت همگرایی و زمان بهتر عمل کرده است. در پایان ارزیابی ها، به این نتیجه رسیدیم که الگوریتم پیشنهادی برای حل مسائل پیچیده و مسائل با ابعاد بالا می تواند عملکرد مناسبی داشته باشد. نتایج به دست آمده از توابع ارزیابی نشان داد که الگوریتم پیشنهادی پایدارتر بوده و قابلیت اطمینان بالاتری در مقایسه با سایر روش ها دارد.