文档名:基于深度强化学习改进的Smith预估器温度控制
摘要:针对牛粪发酵过程具有惯性大、时滞性、参数变化非线性的特点,提出了一种基于深度确定性策略梯度(DDPG)改进Smith模糊PID控制器的温度控制方法.首先,针对传统模糊PID不能对时滞系统有效控制的问题,建立Smith预估模糊PID控制器.其次,使用DDPG算法改进温度控制器,对设计的智能体进行离线训练.最后,通过仿真对所设计控制器进行实验验证.实验结果表明:DDPG改进的Smith模糊PID控制器能有效消除时滞对温度控制的影响,减少超调量和误差,且能避免被控对象参数随时间变化产生动态偏离时造成的系统不稳定.
Abstract:Aimingatthecharacteristicsoflargeinertia,timelagandnonlinearparameterchangeinthefermentationprocessofcowmanure,atemperaturecontrolmethodbasedondeepdeterministicstrate-gygradienttoimproveSmithfuzzyPIDisproposed.Firstly,toaddresstheissuethattraditionalfuzzyPIDcannoteffectivelycontroltime-delaysystems,aSmithpredictivefuzzyPIDcontrollerisestablished.Secondly,usetheDDPGalgorithmtoimprovethetemperaturecontrollerandconductofflinetrainingonthedesignedintelligentagent.Finally,thedesignedcontrollerisexperimentallyvalidatedthroughsimula-tion.TheresultsshowthattheSmithPIDcontrollerimprovedbyDDPGcaneliminatetheinfluenceoftimedelayontemperaturecontrol,reduceovershootanderrors,andavoidsysteminstabilitycausedbydynamicdeviationofcontrolledobjectparametersovertime.
作者:高东祥 张洪 修伟杰 张林 Author:GAODongxiang ZHANGHong XIUWeijie ZHANGLin
作者单位:江南大学机械工程学院,江苏无锡214122江南大学机械工程学院,江苏无锡214122;江苏省食品先进制造装备技术重点实验室,江苏无锡214122江苏惠霖环保科技有限公司,江苏无锡214122
刊名:工业仪表与自动化装置 ISTIC
Journal:IndustrialInstrumentation&Automation
年,卷(期):2024, (3)
分类号:TP23
关键词:温度控制 Smith预估器 强化学习 神经网络 时滞系统
Keywords:temperaturecontrol Smithestimator reinforcementlearning neuralnetwork timelagsystem
机标分类号:TG334.9TH865TP391
在线出版日期:2024年7月1日
基金项目:基于深度强化学习改进的Smith预估器温度控制[
期刊论文] 工业仪表与自动化装置--2024, (3)高东祥 张洪 修伟杰 张林针对牛粪发酵过程具有惯性大、时滞性、参数变化非线性的特点,提出了一种基于深度确定性策略梯度(DDPG)改进Smith模糊PID控制器的温度控制方法.首先,针对传统模糊PID不能对时滞系统有效控制的问题,建立Smith预估模糊PID控...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
基于深度强化学习改进的Smith预估器温度控制 Improved smith predictor temperature control based on deep reinforcement learning
基于深度强化学习改进的Smith预估器温度控制.pdf
- 文件大小:
- 8.34 MB
- 下载次数:
- 60
-
高速下载
|
|