معادله دیفرانسیل بلمن (Bellman Differential Equation / Hamilton-Jacobi-Bellman - HJB)، در ریاضیات (Mathematics)
انواع معادلات دیفرانسیل (Differential Equation) را در آموزش زیر شرح دادیم :
معادله دیفرانسیل بلمن (Bellman Differential Equation / Hamilton-Jacobi-Bellman - HJB) :
این یک معادله دیفرانسیل با مشتقات جزئی غیرخطی (Nonlinear PDE) است که در برنامه ریزی پویا (Dynamic Programming) و کنترل بهینه (Optimal Control) ظاهر می شود. معادله بلمن (یا معادله همیلتون-ژاکوبی-بلمن - HJB) شرط لازم برای بهینگی در مسائل کنترل بهینه با افق زمانی نامحدود را بیان می کند. شکل آن به صورت زیر است:
\[ \rho V(x) = \max_{u \in U} \left\{ f(x, u) + \frac{\partial V}{\partial x} g(x, u) \right\} \]که در آن
\[ V(x) \]تابع مقدار (Value Function) (بهترین مقدار تابع هدف از حالت
\[ x \]به بعد)،
\[ u \]متغیر کنترل،
\[ \rho \]نرخ تنزیل (Discount Rate)،
\[ f \]تابع سود آنی، و
\[ g \]دینامیک سیستم است. حل این معادله تابع مقدار را به دست می دهد که سپس برای تعیین کنترل بهینه استفاده می شود. این معادله در اقتصاد، مهندسی، و مدیریت کاربرد گسترده ای دارد.