基于充电过程的锂电池SOH估计和RUL预测
State of health estimation and remaining useful life predication of lithium batteries using charging process
通讯作者: 闵永军,博士,教授,主要从事汽车电子控制和汽车检测与诊断方面的科研和教学工作,E-mail:yjmin@njfu.edu.cn。
收稿日期: 2022-03-28 修回日期: 2022-04-25
基金资助: |
|
Received: 2022-03-28 Revised: 2022-04-25
作者简介 About authors
李放(1999—),男,硕士研究生,主要研究方向为基于数 。
车用锂离子电池的健康状态(state of health,SOH)和剩余寿命(remaining useful life,RUL)是锂离子电池的关键状态参数,为实现其准确的预估以保障整车安全可靠的运行,基于电动汽车充电过程提出一种改进高斯过程回归(Gaussian process regression,GPR)的锂电池SOH估计和RUL预测模型。首先以最大互信息系数(maximal information coefficient,MIC)、Pearson系数筛选充电过程的多元信息作为健康因子,基于主成分分析(principal components analysis,PCA)简化模型结构并使用粒子群算法和组合核函数改进高斯过程回归,实现车用锂离子电池SOH的准确在线估计以及RUL预测。通过NASA锂离子电池数据集验证了模型的有效性:测试电池SOH估计的最大均方根误差(root mean square error,RMSE)为0.0148,SOH预测的最大RMSE为0.0169,RUL预测的最大绝对误差为1个循环次数。
关键词:
The state of health (SOH) and the remaining useful life (RUL) of lithium-ion batteries for vehicles are key state parameters. Based on the charging process of electric vehicles, an improved Gaussian process regression (GPR) model for lithium battery SOH estimation and RUL prediction is proposed to achieve accurate estimation of SOH and RUL of the battery to ensure the safe and reliable operation of the vehicle. First, the maximal information coefficient (MIC) and Pearson coefficient are used to screen the multivariate information of the charging process as health factors. Further, the model structure is simplified using principal components analysis (PCA). The Gaussian process regression is then improved using particle swarm optimization and the combined kernel function. Finally, accurate online estimation of SOH and prediction of future RUL and SOH are realized. The validity of the model is verified with the NASA lithium-ion battery data set. This model outperforms other studies in terms of estimation and prediction accuracy. The maximum root mean square error (RMSE) of SOH estimation for test batteries is 0.0148, the maximum RMSE of SOH prediction is 0.0169, and the maximum absolute error of RUL prediction is 1 cycle.
Keywords:
本文引用格式
李放, 闵永军, 王琛, 张涌.
LI Fang.
据驱动的新能源汽车性能评估与检验技术,E-mail:lf1830661941@163.com;
为缓解能源危机和日益恶化的环境污染,实现“碳达峰、碳中和”的目标,电气化交通已成为促进经济转型、优化能源结构、改善空气质量的重要举措[1]。电池是电动汽车的核心部件,锂离子电池因其高能量密度、无记忆效应和循环寿命长的特点,现已作为电动汽车的主要储能设备[2-3]。电池的健康状态(state of health,SOH)和剩余寿命(remaining useful life,RUL)是电池生命周期中表征性能的重要参数,很大程度上决定了电动汽车的安全性和可靠性,由于无法使用传感器测量,因此实现锂电池SOH的实时准确估计以及RUL的未来预测,有助于改善消费者的驾驶体验,推动电动汽车产业持续发展,同时实现电池批次回收利用,合理利用社会资源。
数据驱动方法可以被视为一个“黑箱”,克服了复杂的建模和参数辨识问题,有较好的应用前景。常用的方法包括以经验风险最小化为代表的如BP神经网络(back propagation neural network,BPNN)[6],极限学习机(extreme learning machine,ELM)[7],这类模型在训练集中能保持较好的回归效果,但易陷入过拟合。基于深度学习的卷积神经网络(convolutional neural network,CNN)[8]、长短期记忆网络(long short-term memory,LSTM)[9]和门控循环神经网络(gated recurrent neural network,GRNN)[10]等方法确实取得了优秀的预估精度,但样本需具备一定规模且受超参数影响较大。Tsang等[11]将模糊逻辑应用于电池健康状态评估,但无法输出准确的预测值。支持向量机(support vector machine,SVM)[10]和最小二乘支持向量机(least squares support vector machine,LSSVM)[12]在SOH估计和RUL预测中有较高精度且对异常值具有鲁棒性,但随着样本数目的增加导致运行时间过长。
健康因子选取方面,Wang等[13]基于增量容量分析(incremental capacity analysis,ICA)提取IC曲线的峰值位置作为健康因子,该方法的优点是对电池类型不敏感,并能有效识别容量损失机制,但IC曲线的提取方法和噪声干扰会影响模型精度。杨胜杰等[14]提出测量电池表面温度和端电压,通过生成差分热伏安(differential thermal voltammetry,DTV)曲线的峰参数诊断电池老化情况,但不同倍率的充电电流会影响DTV峰特征,进而影响模型精度。Hu等[15]选取放电电压的样本熵作为健康因子,Huang等[16]选取等电压上升间隔作为健康因子,然而单一健康因子难以全面跟踪电池退化,如忽略了温度的影响。王凡等[17]提取电压变化率、内阻等参数作为健康因子,在工程中存在电池内阻测量困难的问题;Liu等[18]选择等压降时间作为健康因子,但电池实际工作时,其放电过程中电压、电流等参数变化较大,导致无法将模型应用于电动汽车的电池管理系统中。
理想的电池状态预估模型应该具备轻量化、健康因子易获取、有实际应用前景的特点。高斯过程回归适用于小样本,非线性的复杂回归问题,能准确捕捉电池的退化细节且鲁棒性较好,此外高斯过程回归能输出置信区间以量化结果的不确定程度[19]。本文基于车用锂离子电池的充电信息稳定且易获取的特点,经相关性算法筛选充电过程提取的多元特征参数作为健康因子,提出一种改进高斯过程回归的锂电池SOH估计和RUL预测模型,实现电池参数准确预估的同时输出置信区间。
1 数据介绍
1.1 数据集简介
本文采用美国航空航天局(NASA)艾姆斯卓越预测中心提供的公开电池数据集,对编号为B0005、B0006、B0007、B0018的18650型三元锂电池在25 ℃时进行充放电试验,电池额定容量为2 Ah。充放电规程如下:以1.5 A恒流充电至电压到达4.2 V后以恒压充电,当充电电流降至20 mA时停止充电;以2 A的电流放电,当B0005~B0018电池电压分别降至2.7 V、2.5 V、2.2 V、2.5 V时结束。充放电后将电池静置后进行下一次循环,并通过0.1 Hz~5 kHz的电化学阻抗谱(electrochemical impedance spectroscopy,EIS)测量电池阻抗。直至电池实际容量下降至额定容量的70%时停止。实验过程中记录了每次充放电时电池的电压、电流、温度和阻抗信息,电池容量随充放电循环的退化曲线如图1所示。
图1
图1
NASA数据集电池容量退化曲线
Fig. 1
Battery capacity degradation curve for NASA data set
1.2 电池健康状态和电池剩余循环寿命
由于研究角度的差异,对SOH有不同的定义,本文使用电池的当前可用容量占额定容量的比值作为电池SOH
式中,C0为电池额定容量;Ci 为第i次循环时的电池容量;SOH(i)为第i次循环时的电池健康状态。
随着电池的使用,电池可用容量下降,设定电池SOH下降到0.7时到达报废标准,使用达到终止寿命(end of life,EOL),则电池的RUL可定义为电池当前SOH衰退至EOL时还可进行的循环次数[20]
式中,Cycle(EOL)为电池充放电循环至EOL时的循环次数;Cycle(i)为当前电池循环次数。
2 算法介绍
2.1 相关性分析算法
Pearson系数是衡量变量相关性最常用的指标之一,以Pearson系数计算变量 X 、 Y 的相关性公式如下
式中,COV( X, Y )为变量 X 和 Y 的协方差;σX 、σY 为变量 X 和 Y 的标准差。变量之间相关性越强,则Pearson系数越接近±1。
最大信息系数(maximal information coefficient,MIC)由Reshef等[21]提出,适用于多种数据类型且计算复杂程度适中,现广泛应用于机器学习、模式识别的特征选取。
MIC的基本原理为:若两个变量之间存在某种关系,可在两个变量的散点图上绘制网格,通过改变网格的大小和不同网格的位置,选取不同的组合将这两种关系划分明确。首先引入互信息这一概念,互信息是一个随机变量中包含的关于另一个随机变量的信息量,常用来衡量变量间的关联程度,其表达式如下
式中,I( x, y )为变量 x 和 y 的互信息;p( x, y )为联合概率密度函数;p( x )和p( y )为边缘密度函数。
将二维空间的离散变量 x, y 组成的集合记为 S,其中 S ={(x1,y1),…,(xt,yt )}将集合 S 内数据划分为m段和n段,则得到m×n的网格,改变m和n数值可得到多种不同的划分方式,计算不同的网格划分方式的最大互信息值max I (m,n),并进行归一化处理
最大的 M ( S ) m,n 即为MIC值
式中,B(t)用于限制划分网格的数量,一般设定B(t)为t0.6,变量之间关联性越强,则MIC越接近1[21]。
2.2 主成分分析
为降低高斯过程回归的输入维数,减小模型复杂度并缩短运行时间,主成分分析(principal component analysis,PCA)可将高维数据映射至低维空间,并在所映射空间内保留大多数原始信息。计算步骤如下:将多维数据标准化后,求得数据协方差矩阵,基于奇异值分解计算其特征值和特征向量,将特征值从大到小排列,并以
式中,d为原始数据维数;d′为保留的特征值个数即降维后的维数。保留特征值对应的特征向量为主成分分析的解,一般取t=80%。
2.3 高斯过程回归
高斯过程回归(Gaussian process regression,GPR)是一种基于贝叶斯理论和核函数方法构建的机器学习模型,遵循结构风险最小化原则控制模型复杂度,实现训练表现和泛化能力的平衡,其特点如下:
(1)高斯过程回归可视为一类概率模型,可对其预测值输出置信区间,这给量化结果的不确定性提供了便利。
(2)核函数的引入在避免“维数灾难”的同时提高了模型的学习和泛化能力。
(3)高斯过程回归的推导由严格的概率统计理论支撑,模型内的超参数选取具备理论依据,而且对于低维回归问题待确定的超参数很少。
从函数空间视角的原理阐述高斯过程回归:可将高斯过程(Gaussian process,GP)定义为有限数量的具有联合高斯分布的变量集合,则高斯过程可视为由均值函数和协方差函数确定
式中,m( x )、k( x, x ′)分别为f( x )的均值函数与协方差函数,其表达式如下
f( x )可视为一种未知的潜在函数(latent function),考虑噪声εi 的影响,观测值yi 和f( xi )的回归可表示为
设有限个f( x )组成的 f 满足联合高斯分布
式中, u 为 f 的均值函数,表示观测数据之前 x 对应f( x )的期望; Σ 为 f 的协方差函数,在高斯过程回归起到度量集合相似性的重要作用,常以核函数的形式表示,其类型和超参数的选取直接影响到高斯过程回归的性能。
高斯过程回归根据训练样本数据,确定潜在函数 f 的分布,并利用推导的 f 得出测试集输入对应的输出值,如图2所示。
图2
设ε为独立同分布的高斯分布,满足ε~N(0,σn2),将含有噪声ε的潜在函数 f*的先验分布表示为
y 与 f* 的联合先验分布为
式中, K =K( X, X ), K*=K( X*, X ), K**=K( X*, X*),均为正定的协方差矩阵, X 为训练集, X*为测试集。
结合训练集 X 和测试集 X*,可得后验分布即预测式
式中, K*[ K*+σn2I ]-1y 为预测均值矩阵 up, K**- K*[ K +σn2I ] K*T为预测协方差矩阵 Σp。则高斯过程回归的输出的95%置信区间为
2.4 改进高斯过程回归
锂电池容量退化过程中受电解液、电极等多种物化反应耦合影响,会出现第i+1次循环的电池容量高于第i次的情况,称为容量再生现象,并有周期性的特点[22]。因此锂电池容量退化曲线具有很强的非线性和不确定性,由于单一协方差核函数能力有限,无法准确实现SOH估计任务。基于神经网络协方差核函数局部逼近能力较强,泛化能力较弱的特点和周期核函数对电池周期性容量再生拟合较好的特点,将二者组合作为改进高斯过程回归的协方差核函数,均值核函数的选取较为广泛,本文使用线性函数,最终SOH估计模型选取核函数如下
均值核函数使用
协方差函数使用神经网络核函数和周期核函数
高斯过程回归是根据最大边缘似然的策略获取最优超参数,基于训练样本集构造边缘似然函数如下
其中, θ 为超参数。
取负的对数边缘似然函数:
式中, G = K +σn2I,对矩阵 G 的求逆运算使用Cholesky分解:令 G = LLT,其中 L 为下三角矩阵,以减少高斯过程回归的计算成本。
以
为解决共轭梯度法受初值选取影响易陷入局部最优的问题,基于粒子群算法(particle swarm optimization,PSO)中群体和个体之间信息共享实现初值寻优,每个粒子在限定的空间中搜寻目标函数的最优解,且群体最优解与个体最优解实现信息共享,并以此影响其他粒子的位置,其原理如下
式中, phn 、 vhn 分别为第n次迭代时第h个粒子当前位置和速度;c1为个体学习因子;c2为群体学习因子;w为惯性权重;r1和r2为每次迭代随机产生在[0,1]间的随机数; Phn 表示第h个粒子n次迭代过程中的最优解; Gn 表示种群n次迭代过程中的最优解。
将高斯过程回归中训练集输入值与其观测值的平均绝对误差作为粒子的适应度值,使用粒子群算法对初值进行多次寻优,但当在协方差核函数的超参数选取差别过大时,会出现病态矩阵[23]。根据试错法,在[-5,5]之间进行初值寻优,粒子个数取15,c1=1.49,c2=0.7,w范围为[0.1,1.1],随迭代自适应调整并更新邻域内的粒子个数,w调整规则如下。
寻优开始时,记停滞次数c=0,当第1次更新种群时,种群最小极值时记为fit1,若第i+1次的fit i+1<fit i 时,则c=c+1。若fit i+1>fit i,则c=max{c-1,0},并作如下判断。若c<2,则w=2w,若c>5,w=w/2。
2.5 算法流程
本文提取充电过程中电压、电流、温度作为特征参数,经MIC、Pearson系数筛选后作为健康因子,以主成分分析降维后输入高斯过程回归模型中,选取组合核函数并使用粒子群算法对协方差核函数和均值核函数的超参数初值寻优,经极大似然法确定最优超参数后,高斯过程回归可输出其测试集的后验预测分布,即SOH的估计值和置信区间。基于SOH滑动采样后循环输入高斯过程回归模型,通过单步外推实现SOH预测,当预测SOH达到EOL时,输出此时的循环次数即RUL值,本文整体算法流程如图3所示。
图3
3 实验结果
3.1 充电过程特征参数提取
图4
图4
某电动公交车运行片段中SOC、电压、电流的变化曲线
Fig. 4
The change curve of SOC, voltage and current in the running segment of an electric bus
因此初步提取充电过程中的特征参数如下:充电过程中某区间电压升对应的充电时间T∆V,充电过程中电压到达4.2 V时电压曲线与时间的积分SV,充电过程中某电压1000 s后的电压值V1000,恒流充电时间TCC,恒压充电时间TCV,恒压充电时间与恒流充电时间比值TCC/TCV,到达峰值温度的时间Temp t-max,最高温度Tempmax,平均温度Tempaverage。
3.2 健康因子筛选
MIC和Pearson系数用于衡量上述充电过程中提取的特征参数与SOH的相关性,MIC和Pearson系数的绝对值越大,说明该特征随电池循环的变化趋势与电池SOH的退化趋势相关性越强,保留MIC和Pearson系数均大于0.95的特征参数作为SOH估计模型的输入可进一步提高模型精度。表1为充电过程所提取特征参数与电池容量的相关性分析结果,由于MIC基于网格划分计算相关性,与容量相关性较高的健康参数会出现数值相等的情况。4块电池最终提取健康因子如下:T∆V,Temp t-max,TCC,V1000,SV,如图5所示。对于T∆V,驾驶员一般在电池电量较低时连接充电桩直至电池电量充满,而不是在电池电量为0时,因此基于MIC和Pearson系数对4块电池的电压升的起始点分别寻优:B0005~B0018起始电压分别为3.71 V、3.81 V、3.70 V、3.81 V,结束电压为4.20 V。对于V1000,B0005~B0007起始电压为3.80 V,B0018为3.90 V,以电池第120次循环为例,上述5项健康因子如图5所示。
表1 电池特征参数相关性分析结果
Table 1
电池型号 | 相关性 分析方法 | T∆V | Temp t-max | TCC | V1000 | SV | TCV | TCC/TCV | Tempmax | Tempaverage |
---|---|---|---|---|---|---|---|---|---|---|
B0005 | Pearson | 0.9961 | 0.9958 | 0.9963 | -0.9820 | 0.9965 | -0.9115 | -0.9822 | -0.5038 | 0.0119 |
MIC | 0.9727 | 0.9672 | 0.9727 | 0.9702 | 0.9727 | 0.8037 | 0.9422 | 0.6004 | 0.3803 | |
B0006 | Pearson | 0.9899 | 0.9904 | 0.9906 | -0.9788 | 0.9907 | -0.9372 | -0.9523 | 0.3451 | 0.2543 |
MIC | 0.9727 | 0.9591 | 0.9727 | 0.9727 | 0.9727 | 0.8005 | 0.9349 | 0.3811 | 0.4040 | |
B0007 | Pearson | 0.9890 | 0.9923 | 0.9929 | -0.9680 | 0.9927 | -0.8828 | -0.9799 | -0.4357 | 0.0948 |
MIC | 0.9727 | 0.9807 | 0.9807 | 0.9546 | 0.9727 | 0.6998 | 0.8926 | 0.6124 | 0.4110 | |
B0018 | Pearson | 0.9854 | 0.9876 | 0.9803 | -0.9727 | 0.9819 | -0.4089 | -0.8854 | -0.0236 | 0.1611 |
MIC | 0.9791 | 0.9697 | 0.9697 | 0.9791 | 0.9697 | 0.7087 | 0.9632 | 0.1847 | 0.1197 |
图5
图5
电池SOH健康因子选取示意图
Fig. 5
Schematic diagram of SOH health factor selection for battery
将以上5项健康因子进行主成分分析,选取第一主成分作为高斯过程回归的输入。表2为B0005各主成分对应的特征值,其第一项主成分F1贡献率超过99%。
表2 B0005主成分特征值
Table 2
成分 | 特征值 |
---|---|
F1 | 4.9749 |
F2 | 0.0236 |
F3 | 0.0009 |
F3 | 0.0005 |
F5 | 0.0001 |
3.3 SOH估计与RUL预测
选取B0005~B0007前100个循环周期作为训练集,B0018选取前80个;剩余循环周期作为测试集。基于PSO对协方差核函数的超参数初值寻优后,以极大似然法选取最优超参数,最终高斯过程回归(PSO-NN+PE-GPR)的超参数如表3。
表3 高斯过程回归的超参数
Table 3
电池型号 | [a;b] | |
---|---|---|
B0005 | [0.0893; 1.6571] | [-2.2319; -4.5958; 1.7447; 4.0460; -2.1070] |
B0006 | [0.1588; 1.5570] | [0.9150; 1.7572; 3.3170; 0.9777; -4.7147] |
B0007 | [0.0761; 1.6475] | [4.5495; 2.2757; -4.1064; 3.9239; -0.8211] |
B0018 | [0.0824; 1.5801] | [-4.2300; -4.0529; 2.3312; 2.9800; -2.4340] |
平均绝对百分比误差(mean absolute percentage error,MAPE)和均方根误差(root mean square error,RMSE)以及RUL预测绝对误差RULae作为模型评价指标,公式如下:
式中,N为测试集样本数量;
图6为PSO优化的组合核函数(PSO-NN+PE-GPR)SOH估计结果以及单周期协方差核函数(PE-GPR)、单神经网络协方差核函数(NN-GPR)、组合核函数(NN+PE-GPR)的SOH估计结果,由于健康因子与电池SOH高度相关,因此SOH的估计曲线对容量再生片段均有一定的跟踪能力,单一核函数SOH估计模型在预测后期出现较大的偏移,未经超参数初值寻优的组合核函数SOH估计模型准确度虽然高于单一核函数模型,但精度仍低于本文所用方法。
图6
图6
不同核函数的SOH估计结果对比
Fig. 6
Comparison of SOH estimates for different kernel functions
表4为不同协方差核函数SOH估计结果评价,可知组合核函数NN+PE+GPR的最大MAPE为2.9605%,最大RMSE为0.0220,其预测精度高于单协方差核函数的PE-GPR和NN-GPR。而经过粒子群优化的PSO-NN+PE+GPR的最大MAPE仅为1.0376%,最大RMSE为0.0148,证明本文提出的改进高斯过程回归提高了模型的预测精度。
表4 不同协方差核函数SOH估计结果评价
Table 4
电池型号 | PE-GPR | NN-GPR | NN+PE-GPR | PSO- NN+PE-GPR | ||||
---|---|---|---|---|---|---|---|---|
MAPE/% | RMSE | MAPE/% | RMSE | MAPE/% | RMSE | MAPE/% | RMSE | |
B0005 | 8.4889 | 0.0767 | 3.2967 | 0.0290 | 2.9605 | 0.0220 | 0.6426 | 0.0070 |
B0006 | 7.5277 | 0.0554 | 5.9013 | 0.0452 | 2.5350 | 0.0197 | 1.0376 | 0.0092 |
B0007 | 3.9387 | 0.0384 | 3.4364 | 0.0259 | 2.5054 | 0.0204 | 0.5022 | 0.0051 |
B0018 | 5.6665 | 0.0416 | 3.4991 | 0.0324 | 1.8643 | 0.0200 | 0.9604 | 0.0148 |
图7
表5 不同方法SOH估计结果评价
Table 5
电池型号 | PSO-NN+PE-GPR | 文献[26] | RVM | |||
---|---|---|---|---|---|---|
MAPE/% | RMSE | MAPE/% | RMSE | MAPE/% | RMSE | |
B0005 | 0.6426 | 0.0070 | 0.6000 | 0.0120 | 2.9019 | 0.0263 |
B0006 | 1.0376 | 0.0092 | 1.2000 | 0.0190 | 3.4733 | 0.0282 |
B0007 | 0.5022 | 0.0051 | — | — | 3.6751 | 0.0366 |
B0018 | 0.9604 | 0.0148 | — | — | 4.0011 | 0.0373 |
对于RUL预测,采用滑动窗口采样实现单步外推,窗口长度为19。基于神经网络协方差核函数具有较强的局部拟合能力的特点实现SOH和RUL预测,由于B0007数据的特殊性,选取SOH=0.75作为其EOL。图8为GPR与二次函数拟合预测结果对比,SOH预测无法对未来的容量再生实现预测,但GPR的总体预测曲线与未来SOH真实值贴合程度较高,没有产生明显的偏移和异常值,除少数点外,SOH真实值均落在GPR预测的95%置信区间内,而基于二次多项式拟合的方法在循环后期误差较大。
图8
图8
不同方法的SOH和RUL预测结果对比
Fig. 8
Comparison of SOH and RUL predictions by different methods
表6 不同方法SOH和RUL预测结果评价
Table 6
4 结论
本文基于电动汽车充电过程提出一种改进高斯过程回归的锂离子电池SOH估计和RUL预测模型。提取有关电压、电流、温度的多元信息作为特征参数,采用Pearson系数和MIC筛选后得到健康因子,以主成分分析降维简化模型输入,选取组合核函数并使用粒子群算法优化高斯过程回归的超参数。在NASA锂电池数据集中验证了该模型的有效性,实现了准确的SOH实时估计、SOH和RUL未来预测,并输出95%的置信区间。将实验结果与不同方法对比,经验证,本文所提模型有更好的精度:B0005~B0018电池SOH估计的最大均方根误差(root mean square error,RMSE)为0.0148,SOH预测的最大RMSE为0.0169,RUL预测的最大绝对误差为1个循环次数。
在本文的研究中,B0005~B0007的SOH估计和RUL预测的起点为第100次循环,B0018为第80次循环,未来减小训练集规模,实现更早起点的准确SOH估计和RUL预测是进一步的研究方向。
参考文献
/
〈 |
|
〉 |
