快乐彩正版app下载官网

快乐彩正版app下载官网

你的位置:快乐彩正版app下载官网 > 冠亚和 >

快乐彩app官方下载 好文推选|北京理工大学高端汽车集成与截止世界重心实验室盘考效劳:基于策略可靠性评估的燃料电板汽车DRL

点击次数:119 发布日期:2026-03-04

快乐彩app官方下载 好文推选|北京理工大学高端汽车集成与截止世界重心实验室盘考效劳:基于策略可靠性评估的燃料电板汽车DRL

{jz:field.toptypename/}

《汽车工程》2026年第1期发表了北京理工大学高端汽车集成与截止世界重心实验室盘考效劳"基于策略可靠性评估的燃料电板汽车DRL-ECMS能量管理步履盘考"一文。论文以燃料电板汽车为盘考对象,提议了一种基于策略可靠性评估的能量管理步履。当先配置了一种智能学习与模子优化深度会通的能量管理策略离线老师架构,愚弄最大熵行为者-指摘家(SAC)算法及时有蓄意等效燃料糟践最小策略(ECMS)的最优等效因子。然后联想了一种策略可靠性评估机制,愚弄集成策略集合模子定量评估能量管理策略有蓄意的可靠性,并基于可靠性阈值在线校准等效因子,保证安全动作的可讲明性。历练收尾标明,比较SAC和惯例自符合ECMS,所提议的SAC-ECMS老师架构将燃料经济性别离擢升了4.32%和7.82%;在目生测试工况下,策略可靠性评估机制八成将燃料经济性进一步擢升2.87%,并具备及时狡计性能。

一、盘考配景

燃料电板汽车加氢时期短、行驶里程长、无羞辱物排放,具有广漠的发展出息。为燃料电板汽车开拓可靠的能量管理策略是擢升整车燃料经济性的关键。尽管基于深度强化学习的能量管理策略在老师之后八成获得理思的燃料经济性,但该步履本色上是一种数据运行步履,其存在一个固有时弊,即难以督察不行靠的策略步履。集成集合模子时代八成灵验处理此问题,已在自动驾驶、风力发电、空调截止等鸿沟得到了应用,为评估能量管理策略可靠性提供了可行依据。为此,著述以燃料电板汽车为盘考对象,提议了一种基于策略可靠性评估的能量管理步履,通过将智能学习步履与模子优化步履的上风相鸠合,并对策略可靠性进行定量评估,在提高了智能能量管理策略优化效果的同期增强了其可讲明性。

伸开剩余83%

二、盘考内容

1. 燃料电板客车能源系统建模:历练车型为一款燃料电板公交客车,基于构型分析收尾,配置能源系统功率均衡方程;同期,基于台架历练数据,配置面向能量管理的能源系统仿真模子,为能量管理策略开拓提供模子基础。

图1 动态测试工况

图2 燃料电板氢耗模子

图3 电机效劳模子

2. 策略可靠性评估能量管理步履:在能量管理策略老师阶段,快乐彩app将SAC算法与ECMS步履的上风相鸠合:SAC智能体与ECMS环境捏续交互,基于不雅测情状,遴荐等效因子为截止动作;ECMS愚弄有蓄意等效因子狡计瞬时最优功率分派收尾。在能量管理策略测试阶段,设战略略可靠性在线评估机制,愚弄集成集合模子定量评估能量管理策略的可靠性;提议风险动作在线修正步履,基于动作可靠性阈值平等效因子进行在线校准,灵验隐敝风险动作,保证安全动作的可讲明性。

图4 基于策略可靠性评估的能量管理步履架构

三、盘考收尾

1.离线老师收尾:接收基于实车谈路速率数据合成的详细样本工况手脚老师工况,用于考据所提SAC-ECMS离线老师架构的优化性能。收尾标明,SAC-ECMS智能体在探索30回合后便可明白管理,且管理后八成获得98.38%的全局最优效果,比SAC和A-ECMS的燃料经济性别离擢升了4.32%和7.82%。

图5 老师工况

图6 SAC-ECMS管理经由

图7 燃料电板责任点分散

表1 离线老师的燃料经济性对比

2. 在线测试收尾:接收两种不同的测试工况,用于考据所提基于策略可靠性评估的能量管理策略在测试阶段的及时优化效果。收尾标明,即使测试工况与老师工况存在各异,基础动作的不细则性也基本可保捏在较低水平。在两种测试工况下,大部分时期的可靠性度量并未零碎其阈值,阐述集成动作在大批情况下是安全可靠的。所提能量管理策略的燃料电板功率分散与全局最优收尾最为接近,大大批责任点围聚分散在10~30 kW的高效责任区。在两种测试工况下,策略可靠性评估机制八成将SAC@ECMS的燃料经济性进一步擢升2.87%和2.93%,使所提能量管理策略的燃料经济性别离达到了全局最优的97.60%和96.98%;试验单个截留步的平均狡计时期别离为5.16 ms和5.05 ms,展现出了显耀的及时应用后劲。

图8 测试工况

图9 测试工况下的基础动作不细则性

{jz:field.toptypename/}

图10 测试工况下的策略可靠性

图11 测试工况下的燃料电板责任点分散统计

图12 测试工况下的燃料经济性对比

图13 所提能量管理策略的在线狡计时期

四、调动点与兴味

著述提议了一种基于策略可靠性评估的能量管理步履,该步履将智能学习与模子优化进行深度会通,愚弄集成策略集合模子对策略可靠性进行定量评估,并字据可靠性阈值对风险动作进行在线修正。著述步履相较于传统智能学习步履和模子优化步履八成在提高智能能量管理策略优化效果的同期增强其可讲明性,并具备及时狡计性能,具有病笃的表面兴味和工程应用价值。

发布于:北京市