Điều khiển tối ưu thích nghi trên cơ sở học tăng cường tích phân trực tuyến

Bài viết này đề xuất một cách tiếp cận trực tuyến để điều khiển tối ưu thích nghi trực tiếp với chi phí vô hạn cho các hệ thống phi tuyến trong một khung thời gian liên tục. Sự hội tụ của thuật toán trực tuyến với các giải pháp điều khiển tối ưu mà không yêu cầu động học nội của hệ thống. Tính ổn định động vòng kín được đảm bảo.