روش تابع جریمه (Penalty Function Methods)، در ریاضیات (Mathematics)
انواع روش های عددی (Numerical Methods) را در آموزش زیر شرح دادیم :
روش تابع جریمه (Penalty Function Methods) :
تبدیل مسئله مقید به نامقید با اضافه کردن جریمه برای نقض قیود
توضیح ساده: روش تابع جریمه یکی از روش های کلاسیک برای حل مسائل بهینه سازی مقید است. ایده اصلی این است که قیود را با اضافه کردن یک جمله جریمه به تابع هدف، به مسئله نامقید تبدیل کنیم. این جمله جریمه، زمانی که قیود نقض شوند، مقدار مثبت (برای کمینه سازی) به تابع هدف اضافه می کند. با افزایش تدریجی ضریب جریمه، جواب مسئله نامقید به جواب مسئله مقید اصلی همگرا می شود. دو نوع اصلی جریمه وجود دارد: جریمه خارجی (Exterior Penalty) که از خارج ناحیه شدنی شروع می کند، و جریمه داخلی (مانع) که از داخل ناحیه شروع می کند.
شرح گام به گام: برای مسئله مقید: minimize f(x) subject to gᵢ(x) ≤ 0, hⱼ(x) = 0.
تابع جریمه خارجی به صورت زیر تعریف می شود:
\[ P(x; \mu) = f(x) + \mu \sum_i \max(0, g_i(x))^p + \mu \sum_j |h_j(x)|^p \]که معمولا p=2 (جریمه درجه دوم) انتخاب می شود. پارامتر جریمه μ > 0 است.
الگوریتم:
۱. با μ₀ = ۱ (مثلا) و یک نقطه شروع x₀ شروع کنید.
۲. برای k = ۰,۱,۲,...:
- مسئله نامقید minimize P(x; μₐ) را با یک روش بهینه سازی نامقید (مثل نیوتن یا BFGS) حل کنید و xₐ* را بیابید.
- اگر قیود به اندازه کافی برآورده شده اند، متوقف شوید.
- μₐ₊₁ = c μₐ با c>1 (مثلا ۱۰) افزایش دهید.
- xₐ* را به عنوان نقطه شروع برای تکرار بعدی استفاده کنید.
مثال عددی: مسئله minimize f(x)=x² subject to x ≥ 1. تابع جریمه درجه دوم: P(x;μ) = x² + μ (max(0,1-x))². برای μ=1، کمینه در x≈0.5 (غیرقابل قبول). با افزایش μ به ۱۰، کمینه به x≈0.9 می رود. با μ→∞، جواب به x=1 همگرا می شود.
مزایا: ساده، قابل فهم، تبدیل مسئله به نامقید که روش های زیادی برای آن وجود دارد.
معایب: با افزایش μ، مسئله نامقید بدحالت (Ill-conditioned) می شود و حل آن دشوار می گردد. برای دقت بالا نیاز به μ بسیار بزرگ است.
کاربردها: در طراحی بهینه سازه ها، در کنترل بهینه، در مسائل مهندسی.
نکته: روش تابع جریمه پایه ای برای روش های پیشرفته تر مانند روش های چندگامه جریمه (Augmented Lagrangian) است.