روش جریمه (Penalty Function Methods)، در ریاضیات (Mathematics)
انواع روش های بهینه سازی (Optimization Methods) را در آموزش زیر شرح دادیم :
روش جریمه (Penalty Function Methods) :
📌 معرفی
روش های جریمه (Penalty Methods) دسته ای از روش ها برای حل مسائل بهینه سازی مقید هستند که با اضافه کردن یک جمله جریمه به تابع هدف، مسئله مقید را به یک مسئله بدون قید تبدیل می کنند. این جمله جریمه، نقاطی را که قیود را نقض می کنند، جریمه می کند.
📐 فرمول بندی
برای مسئله:
\[ \min f(x) \quad \text{s.t.} \quad g_i(x) \leq 0, \quad h_j(x) = 0 \]تابع جریمه (Penalty Function) به صورت زیر تعریف می شود:
\[ Q(x; \mu) = f(x) + \mu P(x) \]که
\[ \mu > 0 \]پارامتر جریمه و
\[ P(x) \]تابع جریمه است. دو نوع رایج تابع جریمه:
جریمه مربعی (Quadratic Penalty):
\[ P(x) = \sum_i [\max(0, g_i(x))]^2 + \sum_j [h_j(x)]^2 \]جریمه مقدار مطلق (Absolute Value Penalty):
\[ P(x) = \sum_i \max(0, g_i(x)) + \sum_j |h_j(x)| \](غیرمشتق پذیر)
🔧 روش کار
با افزایش تدریجی
\[ \mu \]و حل مکرر مسئله بدون قید، جواب ها به سمت ناحیه موجه و نقطه بهینه همگرا می شوند. هر چه
\[ \mu \]بزرگتر باشد، جریمه نقض قیود بیشتر و جواب به قیود نزدیک تر است.
⚖️ مزایا و معایب
مزایا: سادگی مفهوم، قابلیت استفاده برای انواع قیود.
معایب: با افزایش
\[ \mu \]، مسئله بدون قید بدحالت (Ill-conditioned) می شود و حل آن دشوار می گردد.