جلسه دفاع پایان نامه: سیدمحمدجواد سیدعلی روته، گروه کنترل
عنوان پایان نامه: طراحی یک تصمیم ساز مبتنی بر یادگیری تقویتی برای انتخاب بهترین ایستگاه شارژ یک خودروی الکتریکی در ترافیک پویا
ارائه کننده: سید محمدجواد سیدعلی روته استاد راهنما: دکتر وحید جوهری مجد استاد ناظر داخلی: دکتر مهدی سجودی استاد ناظر خارج از دانشگاه: دکتر مهدی پورقلی (دانشگاه شهید بهشتی) تاریخ: ۱۴۰۳/۰۴/۱۲ ساعت: ۱۰ مکان: دانشکده مهندسی برق و کامپیوتر دانشگاه تربیت مدرس، اتاق ۶.۳۷، آزمایشگاه کنترل هوشمند
چکیده: گسترش استفاده از خودرو های الکتریکی به سیستم های کارامد برای بهینه سازی فرایند انتخاب ایستگاه شارژ، بویژه در محیط های شهری با ترافیک پویا نیاز دارد. اکثر پژوهش های صورت گرفته در این حوزه بر روی بهینه سازی برنامه های شارژ، بدون توجه به شرایط ترافیکی تمرکز دارند؛ و یا داده های ترافیکی آن ها پیچیدگی لازم برای مدل کردن ترافیک را ندارد. هم چنین در این پژوهش ها عدم قطعیت موجود در ترافیک به درستی در نظر گرفته نشده است و در بهترین حالت فقط از یک داده ی قطعی به دست آمده از ترافیک واقعی استفاده شده است. در این پژوهش یک رویکرد جدید برای طراحی یک سیستم تصمیم گیری با استفاده از الگوریتم های یادگیری تقویتی، برای تعیین بهترین ایستگاه شارژ ارائه می کنیم و با استفاده از داده های ترافیکی غنی به دست آمده از رابط برنامه نویسی کاربردی ویز، به مسئله ی تغییر پویای ترافیک در آن می پردازیم و محیط مورد نظر برای تعامل با عامل را تماماً بر اساس اطلاعات واقعی شبیه سازی می کنیم. ما در این پژوهش الگوریتم های یادگیری کیو، سارسا، داینا-کیو و داینا-کیوپلاس را پیاده سازی و ارزیابی می کنیم. الگوریتم های یادگیری کیو و سارسا یک دید کلی از کارایی روش های مبتنی بر ارزش در این مسئله ارائه می کنند و الگوریتم های داینا-کیو و داینا-کیوپلاس تأثیر برنامه ریزی را در افزایش کارایی تصمیم ساز، نشان می دهند. نتایج به دست آمده نشان می دهد که به طور کلی، الگوریتم داینا-کیوپلاس با ایجاد تعادل مناسب بین اکتشاف و بهره برداری، بهتر از سایرین عمل می کند.