Electricity Consumption Prediction for Steel Enterprises Based on CNN-BiLSTM-Attention
-
摘要:
为有效预测钢铁企业的电力能耗,提高资源利用的可持续性,提出一种基于CNN-BiLSTM-Attention模型的电力能耗预测模型。通过互信息法(MI)提取电力能耗特征,以优化模型的输入变量,提高模型的泛化性和鲁棒性。引入卷积神经网络(CNN)进一步获取多特征输入的空间关联特性,并采用双向长短期记忆网络(BiLSTM)提取序列时序变化特征,最后通过注意力机制(Attention)强化对关键信息的提取。结合某钢铁企业实际电力能耗数据进行对比实验,结果表明,该模型在数据集上的平均绝对误差(MAE)和均方根误差(RMSE)分别为
3.9840 、7.6907 ,在预测精度上优于其他对比模型。研究结果对钢铁企业的能源管理和节能减排工作具有一定的指导意义。-
关键词:
- 电力能耗预测 /
- 卷积神经网络(CNN) /
- 双向长短期记忆网络(BiLSTM) /
- 注意力机制
Abstract:To effectively predict the electric power energy consumption of iron and steel enterprises and improve the sustainability of resource utilization, an electric power energy consumption prediction model based on CNN-BiLSTM-Attention model is proposed. Firstly, the electric power energy consumption features are extracted by the mutual information (MI) method to optimize the input variables of the model and improve the generalization and robustness of the model. Then, a convolutional neural network (CNN) is introduced to further obtain the spatial correlation characteristics of multi-feature inputs, and a bidirectional long and short-term memory network (BiLSTM) is used to extract the sequence temporal change features, and finally, the extraction of key information is strengthened by the Attention mechanism (Attention). Comparison experiments are conducted with the actual electric power energy consumption data of an iron and steel enterprise, and the results show that the model has an average absolute error (MAE) and root mean square error (RMSE) of
3.9840 and7.6907 on the dataset, respectively, which is superior to the other comparative models in terms of prediction accuracy. The results of the study have certain guiding significance for energy management and energy saving and emission reduction in iron and steel enterprises. -
在当今工业社会,能源不仅是推动生产和经济发展的关键因素,也是实现可持续发展的重要支撑。钢铁产业作为全球经济的基础行业之一,在创造巨大价值的同时,对能源的需求日益增加。电力消耗在钢铁企业的总能耗中占据重要比例,其管理和优化对提高生产效率和降低环境影响具有重大意义。然而,钢铁企业在实际用能过程中面临着诸多挑战,如能耗数据复杂、耗能波动大、非线性和时变性强等,这对电力能耗的预测提出了更高的要求[1-2]。
随着环境保护意识的增强和对绿色生产方式的追求,钢铁企业亟需采用高效的电力能耗预测方法,以实现能源的优化配置和减少不必要的能源浪费。传统的能耗预测方法,如自回归差分移动平均 (autoregressive integrated moving average model, ARIMA) 和季节性ARIMA (seasonal autoregressive integrated moving average model, SARIMA) 等时间序列分析技术虽然被广泛应用,但由于数据稀疏性和复杂性的限制,这些方法难以捕捉数据中的非线性和时变性。此外,许多研究采用了线性回归、支持向量机 (support vector machine, SVM) 和神经网络等方法[3]。线性回归、SVM和神经网络等方法虽然在特定情况下有效,但它们在处理大规模数据集时面临过拟合问题,且需要手动调整参数[4-5]。
为克服这些限制,学者们开始探索基于循环神经网络 (recurrent neural network, RNN) 的方法,尤其是长短期记忆 (long short-term memory, LSTM) 网络[6]。LSTM通过引入门控机制,有效解决了RNN在处理长序列数据时的梯度消失和梯度爆炸问题,从而在时间序列预测中取得显著成效[7-8]。
基于此,学者们进行了大量基于LSTM网络的能耗预测研究。Akter等[9]提出一种基于LSTM网络的能耗预测模型, 并通过在Kaggle的每小时能耗数据集上的仿真实验,证明了LSTM模型在提高能耗预测精度方面的潜力。LSTM的成功应用激发了对更先进模型的探索,包括将其他网络与LSTM结合,以及引入注意力机制来提高模型对关键特征的关注度。任成国等[10]提出经验模态分解 (EMD) 算法和LSTM网络的组合模型,充分利用电力负荷数据的相关性以提高预测精度。肖世钊等[11]和罗恒等[12]则针对能耗序列的多影响因素,采用不同的特征选择方法,并结合LSTM网络和其他机器学习技术,如卷积神经网络和LightGBM,来提高预测的准确性。 Zaman等[13]为预测家用设备的电力能耗,将贝叶斯网络和LSTM网络结合,在预测电力能耗的同时进行不确定性估计,在实际的家用设备电力能耗数据集上验证了方法的实用性。为更好捕获时间序列数据的前后依赖关系,田晨璐等[14]将双向长短期记忆网络 (bidirectional long short-term memory, BiLSTM) 于小数据场景下的建筑能耗预测;田英杰等[15]结合注意力机制与建筑信息模型特征,对电力能耗进行预测,并与传统的长短期记忆神经网络和套索回归等模型进行对比,证明了模型的合理性和有效性,并显著提升了预测精度。
上述研究,探索了LSTM网络、注意力机制等方法在各种场景下能耗预测的可行性,但少有学者利用深度学习方法对钢铁企业的能耗进行预测。因此本文针对钢铁企业日益增大的数据体量和复杂的能耗模式,进一步探索了由卷积神经网络 (convolutional neural network,CNN) 、双向长短期记忆网络 (BiLSTM) 和注意力机制相结合的CNN-BiLSTM-Attention模型,用于钢铁企业的电力能耗预测。通过结合CNN的特征提取能力、BiLSTM的时序数据处理能力和注意力机制的权重分配功能,本模型不仅能够捕捉能耗数据的长期和短期依赖关系,还能够识别和强调对预测结果影响最大的特征。通过在某钢铁企业的实际电力能耗数据上的测试,所提模型展现出了优于传统模型的预测精度,为钢铁企业后续预测电力需求、优化能源管理、调整生产计划、优化设备运行等方面提供了较为有力的支持。
1. 研究方法
1.1 卷积神经网络 (CNN)
卷积神经网络 ( CNN) 是深度学习中最受欢迎的研究领域之一,广泛应用于计算机视觉,如图像识别、目标检测等。该网络可以提取全局空间特征,减少参数和特征的数量,避免过拟合。卷积神经网络的基本结构由输入层、卷积层、池化层、全连接层和输出层构成,如图1所示。
1.2 双向长短期记忆网络 (BiLSTM)
为了解决循环神经网络 (RNN) 存在的长期依赖记忆丢失、梯度消失和梯度爆炸等问题,Hochreiter等[8]在RNN的基础上提出带有记忆单元的长短期记忆网络 (long short-term memory neural network,LSTM) 模型。LSTM模型通过对不同的门结构以及神经元的使用,来控制学习率和遗忘率,从而使模型对长短间隔的序列数据都具有记忆功能。LSTM单元结构如图2所示。
对应的数学表达式为
ft=σ(Wf[ht−1,xt]+bf); (1) it=σ(Wi[ht−1,xt]+bi); (2) ˜Ct=tanh(WC[ht−1,xt]+bC); (3) ˜Ct=ft⊙Ct−1+it⊙ Ct; (4) ot=σ(Wo[ht−1,xt]+bo); (5) ht=ot⊙tanh(Ct)。 (6) 其中,
ft 、it 、ot 分别为遗忘门、输入门和输出门;C 和h 表示记忆单元状态(˜Ct 表示当前输入的单元状态)和隐藏层状态;σ 为sigmod激活函数,输出区间为(0, 1);⊙代表逐元素乘积;W 和b 分别为相应的权重矩阵和偏移变量。根据上述LSTM,通过引入双层LSTM并设置正向层和反向层,可以得到双向长短时记忆网络(BilSTM)。LSTM模型能够有效提取时序性数据的前向时间关联特征,然而时序性数据不仅与之前的数据具有相关性,而且与其后的数据可能也存在关联。BiLSTM增加了反向LSTM,使BiLSTM能够捕获可能被LSTM忽略的模式。其网络结构如图3所示。从图3可知,前向层和后向层共同连接输出层,输出层包括6个共享权重
W1 ~W6 。1.3 注意力机制 (Attention Mechanism)
注意力机制启发于人脑注意力集中于特定情况的关注,是一种序列处理优化组件。其核心思想是将更多的注意力集中在重要信息上,减少对其他无用信息的关注[16]。由于所需提取的时间与空间特征数量较多,本文在BiLSTM网络后添加注意力机制,用于捕捉预测模型中BiLSTM层输出的信息特征,通过计算注意力的概率分布,提取关键信息,提高电力消耗预测模型精度。注意力机制计算步骤如式(7) ~ (9)所示。
st=tanh(htWh+bh) (7) at=Softmax(exp(st)∑exp(st)) (8) s=∑atht (9) 其中,
Wh 和bh 分别为Attention的权重和偏置;ht 为特征;st 为特征的相关性量;at 为注意力分数量;s为经过注意力机制层分配权重后的输出向量。2. 预测性能评价指标与预测实现过程
本文将获得的数据按照8∶1∶1的比例划分模型训练集、验证集和测试集。引入损失函数Adam算法,也称自适应时刻估计方法 (adaptive moment estimation),是对随机梯度下降法的一种扩展,提高参数对于模型的预测性能。Adam损失函数表达式为
Elose=1nn∑i=1(^yi−yi)2。 (10) 2.1 预测性能评价指标
在模型训练阶段,本文通过比较电力能耗的真实值和预测值的平均绝对误差 (MAE) 、均方根误差 (RMSE) 和平均绝对百分比误差 (MAPE) 判断模型性能和预测结果。各指标表达式如式(11) ~ (13)所示。
MAE=1nn∑i=1|(^yi−yi)|; (11) RMSE=√1nn∑i=1(^yi−yi)2; (12) MAPE=1nn∑i=1|(^yi−yi)^yi|。 (13) 其中,n为样本数量;
yi 、^yi 分别为第i个采样点的实际用电量和预测用电量;MAE、RMSE以及MAPE值越小说明模型预测精度越高。2.2 CNN-BiLSTM-Attention模型构建
根据前文内容,构建基于CNN-BiLSTM-Attention的电力能耗预测模型。该模型架构如图4所示。该模型由CNN、BiLSTM、注意力机制组成。CNN提取时间序列数据的特征,BiLSTM可以根据提取的特征预测能耗,注意块为BiLSTM输出分配权重。
3. 算例分析
3.1 数据描述和处理
本文采用的数据集是某钢铁企业的电力能耗信息数据。该公司是一家标准的生产制造型企业,主要生产多种类型的线圈、钢板和铁板等产品。研究数据来源为该公司设备系统的电能消耗,采样间隔为15min,采样时间从2018年1月1日到2018年12月31日,共计
35040 组信息样本,每组信息样本包括11组数据,分别为当前数据采集的日期、电能消耗、滞后电流功率、超前电流功率、CO2浓度、滞后电流功率因数、超前电流功率因数、设备当日运行秒数、周状态、星期分类以及负载类型。数据来自UCI数据库[17],部分数据结构和样例见表1。图5为整个周期内的电能消耗情况,从图5可以看出能源消耗模式变化很大。表 1 钢铁企业电力能耗及相关因素信息Table 1. Electricity consumption and related factors日期时间 用电量/
kWh滞后电流
无功功率/
kVar超前电流
无功功率/
kVarCO2/
ppm滞后电流
功率因数超前电流
功率因数当日运行秒数/s 周状态 星期几 负载类型 02/02 03:30 6.41 5.33 0 0 76.89 100.00 12600 工作日 星期五 Light_Load 10/03 09:30 29.27 0 10.15 0.01 100.00 94.48 34200 周末 星期六 Medium_Load 19/05 08:00 3.17 5.00 0 0 53.55 100.00 28800 周末 星期六 Light_Load 12/06 16:45 86.00 28.73 0 0.04 94.85 100.00 60300 工作日 星期二 Maximum_Load 19/11 19:45 53.21 19.69 0 0.02 93.78 100.00 71100 工作日 星期一 Maximum_Load 3.1.1 数据标准化
本文是以公司目标电力消耗量为预测目标值,其余参数经过特征选择后作为特征值的多输入单输出预测。为了消除不同规模设备和时间变化的影响,提高数据的可比性和模型的准确性,因此将数据输入模型前首先对数据进行标准化处理,标准化公式为
x′=x−μδ。 (14) 其中,
x′ 为标准化后的特征值;x 为标准化前的特征实际值;μ 和δ 分别为原始数据的均值和标准差。3.1.2 互信息法特征提取
由于原始数据集中包含了诸多特征变量,其中可能存在不相关或者冗余的变量,这类特征变量的存在会使模型输入维度过大,增加内存和存储空间的使用;同时会导致模型的预测精度下降。因此对于收集到的包含多影响因素的特征变量需要进行特征选择,找出影响程度较高的特征,以提升模型的计算效率和预测精度。
基于互信息法 (mutual information,MI) 的特征选择是一种能够反映数据中各变量之间线性与非线性关系的方法,其度量的是一个特征变量包含另一个特征变量的信息量[18]。利用互信法计算电力消耗量与各个特征数据的互信息值以筛选出影响较为明显的特征。一般而言,两个时间序列的相关性越大,其互信息值就会越大[19]。
互信息法特征选择具体过程如下。
1) 计算特征向量X的信息熵。
H(X)=−m∑i=1p(xi)log(p(xi))。 (15) 其中,m代表X的元素长度,也就是数据集有m个样本向量;
p(xi) 为向量X内第i个离散点的概率密度函数。2)计算目标向量电力消耗量的信息熵。
H(Y)=−m∑i=1p(yi)log(p(yi))。 (16) 3)计算特征变量与电力消耗量之间的互信息量。
I(X,Y)=m∑i=1m∑t=1p(xi,yi)logp(xi,yi)p(xi)p(yi)。 (17) 式中,
I(X,Y) 表示特征变量与电力消耗量的互信息量;p(xi,yi) 为特征变量与电力消耗量的联合密度函数。根据上述步骤,计算得到各特征变量与电力消耗量的互信息量如图6所示。
由图6可以看出,星期天数和周状态两个特征与电力消耗量的互信息量较小(分别为
0.1028 ,0.0689 ),对于其预测的贡献度较少考虑剔除这两个特征。因此将滞后电流功率、超前电流功率、CO2浓度、滞后电流功率因数、超前电流功率因数、设备当日运行秒数和负载类型作为模型的输入变量,电力消耗量作为模型的输出变量。3.2 基于CNN-BiLSTM-Attention的钢铁企业电力能耗预测
为验证CNN-BiLSTM-Attention模型对能耗预测的有效性,本文采用某钢铁企业的电力消耗信息数据作为原始数据样本进行测试。仿真实验的运行环境为Windows11,计算机配置为 Intel (R) Core (TM) i7-13700KF CPU@3.40 GHz、NVIDIA RTX 3080 10 GB GPU,代码采用Python语言在Tensorflow深度学习框架上编写。
通过互信息法进行特征提取后,将筛选出的关键特征作为输入,对构建的CNN-BiLSTM-Attention模型进行训练和调优。模型参数设置如下。CNN模块包含两个一维卷积层,均为64个卷积核,采用ReLU激活函数,池化层的最大窗口设为2以降低特征维度;BiLSTM层由两层BiLSTM组成,第1层包含128个神经元,第2层包含64个神经元;模型还包括两层Dense层,第1层Dense节点数量为32,第2层Dense作为输出层,输出单个预测值。为了防止过拟合,本文选用Adam优化器进行模型训练,初始学习率设为
0.0001 ,以便在训练过程中自适应调整学习率。模型参数信息如表2所示。表 2 模型参数信息Table 2. Model parameters information参数名称 参数值 epochs 100 batch size 32 learning rate 0.0001 window_size 48 Convolution kernel1 64 Convolution kernel2 64 Maxpooling length 2 BiLSTM units1 128 BiLSTM units2 64 Dropout 0.2 在模型训练完成后,将测试集数据输入模型以评估其预测性能。实验结果如图7所示,CNN-BiLSTM-Attention模型能够准确捕捉电力能耗的时间序列特征,并在预测未来能耗时表现出较高的准确性。从图7可以看出,模型预测值与实际能耗值吻合度较高,但能耗波峰处仍较难准确预测,后续仍需进一步调整模型以适应峰值处的能耗预测。
为证明互信息法进行特征提取的可行性和由优越性,将全部特征输入模型进行训练,并对测试集的数据进行预测,得到的结果与本文特征选择后的预测结果进行对比,得到表3,由此可知利用互信息法进行特征选择后,模型的预测精度更高(*为特征选择后的模型)。
表 3 特征选择前后结果对比Table 3. Comparison of results before and after feature selection模型 MAE RMSE CNN-BiLSTM-Attention 4.4489 8.5890 CNN-BiLSTM-Attention* 3.9840 7.6907 进一步验证所提模型的鲁棒性、优越性和泛化性。将该模型与BiLSTM网络、CNN-BiLSTM网络的预测结果进行比较,得到表4的电力能耗评价指标和图8的各模型预测效果对比图。
表 4 各模型预测评价指标Table 4. Evaluation indicators for each prediction model模型 MAE RMSE MAPE BiLSTM 4.7108 8.3750 0.4329 CNN-BiLSTM 4.3092 8.1509 0.3580 CNN-BiLSTM-Attention 3.9840 7.6907 0.3075 通过对比实验,可以发现CNN-BiLSTM-Attention模型在预测精度上优于单一的BiLSTM网络和CNN-BiLSTM组合模型。采用CNN-BiLSTM-Attention模型对该钢铁企业的电力能耗进行预测所得到的MAE、RMSE及MAPE均比另外两种模型更小。其中,与BiLSTM模型相比较,分别下降了15.42%、8.17%和28.97%;与CNN-BiLSTM对比,分别下降了7.55%、5.65%和14.11%。这表明引入注意力机制能够较为有效地识别和关注对预测结果影响更大的特征,从而提高模型的整体性能。同时,从图9模型绝对误差的对比来看,本文模型在测试集上表现更好。
4. 结果与讨论
通过与其他模型的比较分析,论文提出的模型在钢铁企业的能耗预测任务中取得了更低的均方根误差 (RMSE) 、平均绝对误差 (MAE) 以及平均绝对百分比误差 (MAPE),这验证了CNN-BiLSTM-Attention模型在处理复杂工业能耗数据时的有效性和优越性。此外,模型的高性能预测能力为钢铁企业在能源管理和节能减排方面提供了有力的决策支持,具有重要的实际应用价值。
未来的研究可以在本模型的基础上进一步探索,例如引入更多的数据源和特征,或者在不同的工业场景中测试模型的泛化能力。此外,研究还可以关注模型的可解释性,例如通过可视化注意力机制学习到的特征,或者开发可解释模型预测结果的方法。这将更好地理解模型的预测机制,并为能源管理提供更深入的洞察。
-
表 1 钢铁企业电力能耗及相关因素信息
Table 1 Electricity consumption and related factors
日期时间 用电量/
kWh滞后电流
无功功率/
kVar超前电流
无功功率/
kVarCO2/
ppm滞后电流
功率因数超前电流
功率因数当日运行秒数/s 周状态 星期几 负载类型 02/02 03:30 6.41 5.33 0 0 76.89 100.00 12600 工作日 星期五 Light_Load 10/03 09:30 29.27 0 10.15 0.01 100.00 94.48 34200 周末 星期六 Medium_Load 19/05 08:00 3.17 5.00 0 0 53.55 100.00 28800 周末 星期六 Light_Load 12/06 16:45 86.00 28.73 0 0.04 94.85 100.00 60300 工作日 星期二 Maximum_Load 19/11 19:45 53.21 19.69 0 0.02 93.78 100.00 71100 工作日 星期一 Maximum_Load 表 2 模型参数信息
Table 2 Model parameters information
参数名称 参数值 epochs 100 batch size 32 learning rate 0.0001 window_size 48 Convolution kernel1 64 Convolution kernel2 64 Maxpooling length 2 BiLSTM units1 128 BiLSTM units2 64 Dropout 0.2 表 3 特征选择前后结果对比
Table 3 Comparison of results before and after feature selection
模型 MAE RMSE CNN-BiLSTM-Attention 4.4489 8.5890 CNN-BiLSTM-Attention* 3.9840 7.6907 表 4 各模型预测评价指标
Table 4 Evaluation indicators for each prediction model
模型 MAE RMSE MAPE BiLSTM 4.7108 8.3750 0.4329 CNN-BiLSTM 4.3092 8.1509 0.3580 CNN-BiLSTM-Attention 3.9840 7.6907 0.3075 -
[1] 方元庆, 何腊梅. 钢铁企业多能源网络优化调控的研究与思考[J]. 电工技术, 2024(10): 19-21. FANG Yuanqing, HE Lamei. Study and reflections on optimizing and regulating multi-energy-source networks in steel enterprises[J]. Electric Engineering, 2024(10): 19-21.
[2] 田冬明, 李玉光, 燕飞, 等. 钢铁企业智能电网发展研究概述[J]. 冶金自动化, 2023, 47(S1): 5-9. [3] AMASYALI K, EL-GOHARY N M. A review of data-driven building energy consumption prediction studies[J]. Renewable & Sustainable Energy Reviews, 2018, 81(pt.1): 1192-1205.
[4] 孙健平, 侯珂, 常静. 基于TentSSA-BPNN模型的钢铁企业能耗预测研究[J]. 华北科技学院学报, 2023, 20(2): 118-124. SUN Jianping, HOU Ke, CHANG Jing. Research on energy consumption prediction of steel enterprises based on TentSSA-BPNN model[J]. Journal of North China Institute of Science and Technology, 2023, 20(2): 118-124.
[5] LI J , ZHANG Q , WANG K , et al. Optimal dissolved gas ratios selected by genetic algorithm for power transformer fault diagnosis based on support vector machine[J]. IEEE Transactions on Dielectrics & Electrical Insulation, 2016, 23(2): 1198-1206.
[6] HINTON G. Recursive distributed representationse[M]. Cambridge: MIT Press, 1991
[7] BENGIO Y, SIMARD P, FRASCONI P. Learning long-term dependencies with gradient descent is difficult[J]. IEEE Transactions on Neural Networks and Learning Systems, 1994, 5(2): 157-166. DOI: 10.1109/72.279181
[8] HOCHREITER S, SCHMIDHUBER J. Long short-term memory. Neural Computation[J]. 1997, 9(8): 1735-1780.
[9] AKTER R, LEE J M, KIM D S. Analysis and prediction of hourly energy consumption based on long short-term memory neural network[C]//2021 International Conference on Information Networking (ICOIN). Jeju Island, Korea (South): IEEE, 2021: 732-734.
[10] 任成国, 肖儿良, 简献忠, 等. EMD-LSTM算法在短期电力负荷预测中的应用[J]. 电力科学与工程, 2019, 35(8): 12-16. REN Chengguo, XIAO Erliang, JIAN Xianzhong, et al. Application research of deep learning in short-term power load forecasting[J]. Electric Power Science and Engineering, 2019, 35(8): 12-16.
[11] 肖世钊, 刘天恒, 张飞, 等. 基于卷积神经网络与长短期记忆网络的多规格带钢精轧电耗分析预测[J]. 冶金自动化, 2022, 46(1): 25-33. XIAO Shizhao, LIU Tianheng, ZHANG Fei, et al. Analysis and prediction of power consumption of multi-specification strip steel finishing rolling based on convolutional neural network and long short-term memory network[J]. Metallurgical Industry Automation, 2022, 46(1): 25-33.
[12] 罗恒, 刘杭. 基于LightGBM-LSTM组合模型的商业建筑能耗预测[J]. 计算机应用与软件, 2022, 39(11): 36-42. LUO Heng, LIU Hang. Prediction of' commercial building energy consumption based on LightGBM-LSTM combined model[J]. Computer Applications and Software, 2022, 39(11): 36-42.
[13] ZAMAN M, SAHA S, ZOHRABI N, et al. Uncertainty estimation in power consumption of a smart home using bayesian LSTM networks[C]//2022 IEEE International Symposium on Advanced Control of Industrial Processes(AdCONIP). Vancouver, BC, Canada: IEEE, 2022: 120-125.
[14] 田晨璐, 刘业春, 杨爱新, 等. 小数据场景下基于迁移学习与BiLSTM的建筑能耗预测方法[J]. 计算机时代, 2023(4): 62-66. TIAN Chenlu, LIU Yechun, YANG Aixin, et al. Research on building energy consumption prediction based on transfer learning and BiLSTM[J]. Computer Era, 2023(4): 62-66.
[15] 田英杰, 郭乃网, 徐东辉, 等. 结合注意力机制与BIM特征的电力能耗预测[J]. 计算机应用与软件, 2021, 38(6): 39-45. TIAN Yingjie, GUO Naiwang, XU Donghui, et al. Electricity consumption forecasting based on bim and attention machansim[J]. Computer Applications and Software, 2021, 38(6): 39-45.
[16] CHAUDHARI S , POLATKAN G , RAMANATH R , et al. An attentive survey of attention models. [J]. ACM Transactions on Intelligent Systems and Technology, 2021, 12(5): 53.
[17] VE S, SHIN C, CHO Y. Efficient energy consumption prediction model for a data analytic-enabled industry building in a smart city[J]. Building Research & Information, 2021, 49(1): 127-143.
[18] SALEM O A M, WANG L. Fuzzy mutual information feature selection based on representative samples[J]. International Journal of Software Innovation, 2018, 6(1): 58-72. DOI: 10.4018/IJSI.2018010105
[19] LI C, ZHAN L, SHEN L. Friction signal denoising using complete ensemble EMD with adaptive noise and mutual information[J]. Entropy, 2015, 17(9): 5965-5979. DOI: 10.3390/e17095965