You are on page 1of 20

碳排放预测

摘要
碳排放问题在我国已引起广泛的关注,为制定有效的碳减排路径提供决策
依据,现需对外来几年的碳排放进行预测,题中需要我们采用多个模型进行
预测,其中GM(1,1)、BP神经网络是必须采用的方法,第三种预测模型我
们采用了多元线性回归进行预测。
模型一,GM(1,1)预测碳排放模型。本文收集了从1985—2010年26年的
碳排放总量的数据,刚开始的时候将26年的数据都拿进去进行预测,但相对
误差太大,故考虑到减少一部分数据,降低相对误差,最后利用1995—
2010年的数据进行预测,相对误差达到了9%。然后通过相关度检验及后验差
检验都是非常好的。并且求解预测出将来5年的碳排放总量,结果在下表。
模型二,BP神经网络预测碳排放模型。在分析各项影响因素时,提取了下
面七个因子:全国GDP、人口总数、城镇化、第三产业所占比率、能源强度能源消
费总量、煤炭煤炭石油所占百分比、实际碳排放。并且利用模型一GM(1,1)预测
各因子2011年—2015年的数据,最后利用BP神经网络进行预测,结果在下
表。利用权重对各影响因素进行分析,发现城镇化及能源强度为主要影响因素。
模型三,多元线性回归预测碳排放模型。在分析各项影响因素时,提取了
下面4个影响因子:人均GDP、人口总数、城镇化、能源强度能源消费总量。利用
SPSS对各个因子进行拟合得到未来几年的预测数据,然后利用多元线性回归
对未来几年的碳排放进行预测.并且能源强度与城镇化是主要影响因素。

年份
GM(1,1)
BP
回归

应用各模型对碳排放总量进行预测
2011
2012
2013
2014
88.403
96.616
105.59
115.4
88.037
88.974
87.741
87.974
94.2195 104.8865 117.1429 131.2383

2015
126.12
85.807
147.4613

现对上面的数据进行分析,只有BP神经网络在未来是有下降的趋势了,
故有两种可能,结合实际现对碳排放的控制逐渐上升,故BP预测有一定的可
取性,在2011年中GM(1,1)与BP相近,故在此预测2011年的碳排放为88亿
吨左右。
关键词 碳排放预测 GM(1,1) BP 神经网络 多元线性回归

1

1 问题的重述
中国是世界上能源生产与消费大国。碳排放问题在我国已引起广泛的关注,
“十二五”规划中明确提出要“节约能源,降低温室气体排放强度”。要实现这一
目标,需要对碳排放的影响因素进行深入分析,构建科学的预测模型来对未
来碳排放进行预测,为制定有效的碳减排措施提供决策依据。
请先收集中国历年碳排放及其影响因素的数据(收集至少近 20 年的相关
数据),然后根据收集的数据建立至少 3 种定量预测模型(其中 GM(1,1)
和 BP 神经网络模型必需,其它可考虑微分方程、多元回归分析等)来对未来
中国碳排放进行预测,并结合若干性能评价指标对模型进行分析比较,并指
出影响碳排放的主要因素,向有关部门提出具体建议。

2 模型的基本假设
1) 所有收集的数据是真实可信的;
2) 假设只考虑对碳排放有影响的几个主要因素可以对未来几年的碳排放进行
有效的预测,即可以暂不考虑那些次要的影响因素;
3)假设我国碳排放是以某种趋势变化的,无自然的突发因素来影响碳排放;

3 符号说明
X (0) :GM(1,1)中初始数据序列。
X (1) :GM(1,1)中对 X (0) 累加数据序列。
1
1
Z ( ) :GM(1,1)中 X ( ) 的紧邻生成序列。

∆ :GM(1,1)中相对误差序列。

ε 0 :GM(1,1)中相关度检验残差序列。
C :GM(1,1)中后验差检验均方差比值。
P :GM(1,1)中后验差检验的小概率误差。
m :BP 神经网络中输入层节点数。
n :BP 神经网络中输出层节点数。
l :BP 神经网络中隐层神经元个数。
y :多元线性回归中因变量碳排放总量。
X 1 :多元线性回归中自变量人口总数
X 2 :多元线性回归中自变量城镇化
2

4.1)预测模型建模原理 定理一:设序列 X ( 0) ( ) = x ( 0 ) ( 1) .2. x(1) ( 2 ) .5 (x) 1( )k k = 1.1. 2.1) 模型——模型一 控制理论中信息的多少常常用系统颜色的深浅来表示,灰色介于黑白之间 , 即部分信息已知,部分信息未知。灰色模型(Gray Model. L n 为原始数据序列 k = 1.1). b ) 为参数列,令 T 3 . L X ( 1) = x ( 1) ( 1) . X ( 1) 为 X ( 0) 的 1 − AGO 序列 +0. z ( ) ( 2 ) . 2.2 GM ( 1. x ( 0 ) ( 2 ) . i =1 1) 1 z (1 ) ( n ) ) ( k ) + az ( 1) ( k ) = b ,其中 X ( 0) ( k ) .其中,1 代表微分方程的阶数,N 代表变量的个数是 N 个。本文中采用最简单的灰色模型 GM(1.1 灰色 GM(1. L x (1) ( n ) 1 灰微分方程, X ( 0) k X ( 1) ( k ) = ∑ x ( 0 ) ( i ) .GM)是通过数据 序列建立微分模型来拟合给定的时间序列数据,从而对数据的发展趋势进行 预测。 灰色建模常用的模型是 GM(1,N).5( ) x( 1 k) , 1 −Z ( 1) 为 X ( 1) 的紧邻生成序列 若 aˆ = ( a. z( 1 ) ( k) = 0.问题分析 我国是世界上能源生产与消费的大国,碳排放的问题在我国已经引起广泛 的关注,“十二五”规划中明确提出要“节约能源,降低温室气体排放强度”。要 实现这 一目 标 ,就需要 对 碳排放的影响因素 进 行分析,然后构建 预测 模型 对 未来几年的碳排放进行预测,从而为制定碳减排路径提供决策依据。现建立三 个模型,分别对将来五年的数据进行预测,三个模型分别为 GM(1. L x ( 0 ) ( n ) ,且 X ( 0) 为非负序列 ( Z ( ) = ( z ( ) ( 1) .X 3 :多元线性回归中自变量人均 GDP X 4 :多元线性回归中自变量能源强度 4 模型的建立与求解 4. L n.1)、BP 神经 网络、回归分析。 4.

2.B =  M M M     x( 0) ( n )   − z (1) ( n ) 1     则灰微分方程 X ( 0) ( k ) + az ( 1) ( k ) = b 的最小二乘估计参数列满足: ) −1 a = ( BT B ) BT Y 定义一 设 X ( 0) k ( ) = x ( 0 ) ( 1) . i =1 k = 1. aˆ 如定理一所述 aˆ = ( BT B ) BT Y −1 则有: 1) 白化方程 dx (1) + ax (1) = b 的解或称时间响应函数 dt b b  x ( 1) ( t ) =  x ( 1) ( 0 ) −  e − at + a a  ( 0) ( 1) 2) GM ( 1. L n. 为 X ( 0) 的 1 − AGO 序列, Z ( 1) 为 X ( 1) 的 紧邻 生 成序列,称 dx( 1) + ax( 1) =b dt 为灰微分方程 x ( 0) ( k ) + az ( 1) ( k ) = b 的白化方程,也叫影子方程。 定理二 设 B.L n . a a  3)取 x ( 1) k = 1.1) 灰微分方程 X ( k ) + az ( k ) = b 的时间响应序列为 b b  xˆ (1) ( k + 1) =  x ( 1) ( 0 ) −  e − ak + . x( 0) ( 2 )   − z (1) ( 2 ) 1  ( 0)   ( 1)   x ( 3)   − z ( 3) 1 Y = . 2. x ( 0 ) ( 2 ) . Y . 2. L x ( 0 ) ( n ) 为非负序列 X ( 1) ( k ) = ∑ x ( 0 ) ( i ) . a a  4 k = 1. L n ( 0 ) = x( 0 ) ( 1) ,则 b b  xˆ (1) ( k + 1) =  x ( 0) ( 1) −  e − ak + .

L x(0 ) ( n ) − x(0) ( n ) 5 ) .5( ) x( 1 k) , 1 −Z ( 1) 为 X ( 1) 的紧邻生成序列 −1 T a  T 第三步,计算 aˆ =   = ( B B ) B Y b  第四步,得出预测模型 b b  xˆ (1) ( k + 1) =  x ( 0) ( 1) −  e − ak + . a a  k = 1.L x(0) ( n ) ) 残差序列为 ( (0) ε ( 0) = ( ε ( 1) .L n 第五步,累减还原 (0) xˆˆˆ ( k + 1) = x(1) ( k + 1) − x(1) ( k ) . L x (1) ( n ) k X ( 1) ( k ) = ∑ x( 0 ) ( i ) . x( 1) ( 2 ) .2. L n 4. k = 1. 2. x ( 0 ) ( 2 ) . ) k = 1. 2. L ε ( n ) ) = x( 0 ) ( 1) − xˆˆˆ ( 1) . L x( 0 ) ( n ) ) 相应的预测模型模拟序列为 (0) Xˆ (0) = ( xˆˆˆ ( 1) .5 (x) 1( )k +0.2. L n 4. x(0 ) ( 2 ) − x(0) ( 2 ) .4)还原值 (0) xˆˆˆ ( k + 1) = x(1) ( k + 1) − x(1) ( k ) . ε ( 2 ) . x( 0 ) ( 2 ) . L x ( 0 ) ( n ) ) 第一步,构造累加生成序列 ( X ( 1) = x ( 1) ( 1) .B =  M M M     x( 0) ( n )   − z (1) ( n ) 1     z( 1) ( k) = 0. x(0) ( 2 ) .2 模型的建立 给定数据列 X ( 0) ( = x ( 0 ) ( 1) .3 模型的检验 1 残差检验 设原始序列为 ( X ( 0) = x( 0 ) ( 1) . L n i =1 第二步,构造数据矩阵 B 和数据向量Y  x( 0) ( 2 )   − z (1) ( 2 ) 1  ( 0)   (1)   x ( 3)   − z ( 3) 1 Y = . 2. 2. k = 1.

其中.对于给定的 C0 > 0 . ( 0 )  x ( 1) x ( 2 ) x ( n)  1) 对于 k ≤ n ,称 ∆ k = ε ( k) x( 0) ( k )  n  = { ∆k } 1   为 k 点的模拟相对误差,称 ∆ = 1 n ∑ ∆ k 为平 n k =1 均相对误差; 2) 称 1− ∆ 为平均相对精度, 1 − ∆ k 为 k 点的模拟精度, k = 1. 以上三种方法都是通过对残差的考察来判断模型的精度. ( ) 2) p =P ε ( k ) -ε <0. C0 . n k =1 分别为残差的均值和方差。 l) C = S 2 / S1 称为均方差比值.当 C < C0 时. 2. ( 0) .相对误差序列为  ε ( 1) ε ( 2) ε ( n) ∆ =  ( 0) . n k =1 S12 = 1 n (0) ( x ( k ) − x)2 ∑ n k =1 S22 = 1 n ∑ (ε ( k ) − ε )2 n k =1 分别为 X ( 0) 的均值和方差; ε= 1 n ∑ε ( k ) . 关联度: 要求越大越好. ε 为 X ( 0) 与 xˆ (0) 的绝对关联度. ε 0 . p0 的一组取值. 常用的精度等级如表1所示.6745S1 称为小误差概率. 小误差概率合格模型检验 设 X ( 0) 为原始序列, xˆ (0) 为相应的模拟序列, ε ( 0) 为残差序列,则 x= 1 n ( 0) ∑x ( k) . 均方差比值C 越小 越好以及小误差概率p 越大越好. 平均相对误 差八和模拟误差都要求越小越好.有 ε >ε 0 ,则称模型为关联度合格模型。 3. 6 .L n ; 3) 给定 α ,当 ∆ ≤ α 且 ∆ n <α 成立时,称模型为残差合格模型。 2 关联度合格模型检验 设 X ( 0) 为原始列. 可供检验模型参考.称模型为均 方差比合格模型. 就确定了检验模 型模拟精度的一个等级. 对于给定的 p0 >0 当 p >p0 时. 称模型为小误差概率合格模型. xˆ (0) 为相应的模拟序列.给定 α . 若对于给定的 ε 0 >0 .L .

20 指标临界值精度等级 一级 二级 三级 四级 关联度 ε 0 均方差比值 C0 小误差概率 p0 0.95 0.8 29.35 0.6 7 2008 68.7 50.69 34.08883 k -201.1)模型预测碳排放总量 现收集了从1985年到2010年26年的数据,采用GM(1.7 40.9 30.2 62.08883.50 0.65 首先需要输入原始数据 X ( 0) ={28. k = 1.1)对其进行预测, 数据如表2 表2 近三十年来碳排放总量 1995 1996 1997 1998 1999 2000 2001 2002 年份 碳排放量 28.1 83.50 0.12 7 3 2006 58.7 28.05 0.3 0.2 0.4 相对误差曲线 误差值 0.10 0.49 29.10 5 8 2010 81.61 28.0 77.1 58.70 0.01 0.81 29.1)预测误差 0.417.表1 精度检验等级参照表 相对误差 α 0.64 年份 碳排放量 7 2003 40.93 30.b=17.70 0.89 8 7 2005 55.7 34.892 得出预测模型 xˆ (1) ( k + 1) = 229.9 28.69 2 4 2004 50. 2.80 0.6 28.80 0.90 0.9 55.2.67 28.3 28.6 68.732 ⋅ e0.60 模型的应用——碳排放的预测 4.17 1 7 2007 62. L n 检验:首先进行残差检验,得到的误差如图1。 GM(1.60 0.5 29.85 28.1 0 1995 2000 2005 年份 2010 2015 图1 残差检验中相对误差曲线 从图中可以看出,前面几年的误差比较大,而后几年的误差就很小了,最 7 .4 GM(1.2} 由MATLAB(见附录一)可求解得 a = -0.65 0.03 9 6 2009 77.

2. L n 合格,经计算,该模型的后验指标方差比 C = 0.59 115. C = 0.9781 最后进行后验差检验 P = 1.3.95 ,误差概率也符合要求。由精度检验等级参照表(表1)可知 模型精度检验达到1级等级精度,说明该模型有较好的预测精度和实用价值。 利用MATLAB将所有的结果进行预测以及与原数据进行对比,结果在图2 GM(1.4 2015 126.后求得相对残差 ∆ = 9.403 96.08883 k -201.3 BP 神经网络预测模型——模型二 4.1 模型假设 (1)碳排放问题涉及很多方面,为了方便建立模型,假设碳排放总量只与 全国 GDP(亿元)、人口总数(万人)、城镇化(%)、第三产业所占比率(%)、 能源强度(吨标准煤/万元)能源消费总量(吨)、煤炭煤炭石油所占百分比 (%)、实际碳排放(亿吨)。 8 .616 105. k = 1.1167 结合图1可以看出只有相对误差的较大,而其他的值都很好,故模型 xˆ (1) ( k + 1) = 229.417.732 ⋅ e0.35 ,后验指标小; 误差概率 P = 1 > 0.1)对未来五年碳排放的预测结果 2011 2012 2013 2014 88.12 4.1)预测 100 实际曲线 碳 排 放 量 /亿 吨 80 预测曲线 60 40 20 1995 2000 2005 年份 2010 2015 图2 真实数据与原有数据对比 预测近五年的碳排放的值单位是亿吨,数据在表3。 年份 预测值 表3 GM(1.1167 < 0.28% 然后进行关联度检验 ε = 0.

693 注:由于篇幅有限,仅取一部分数据,具体数据见附表 4 4.8 111026 25.951 2011 464520 134790 51.2 32.235 3.3.092 4.9 98703 92.072 43.1 96934 93.359 43.697 23.1)的方法对其预测。 具体步骤按上面即可。 数据如表 5 表 5 用 GM(1.8068 364020 86.843 44.2 数据收集与整理 针对以上七个数据,我们通过上网收集、查阅大量统计文献资料,整理出 以下几年的各项数据,具体数据见表 4: 表 4 收集及整理的各影响因素的数据 年份 GDP 人口总数 城镇化 第三产业所占比率 能源强度吨标准煤 能源消费总量 煤炭、石油所占百分 比 实际碳排放 1985 9016.2 1989 16992. m 第二层(隐藏层): 9 .7 28.753 22.3 数据的分析与处理 以上收集和整理的数据必须经过统一量纲和归一化处理后,才能用来进行 科学研究和建模。利用 MATLAB 进行数据归一,最后再反归一。 其中需要对各个影响因子预测出 5 年的值才可以用 BP 神经网络对其进行 预测。现采用上面 GM(1.(2)收集到的数据真实可靠,没有太大的误差 4.391 3.1)对各影响因素预测 5 年的数据 年份 GDP 人口总数 城镇化 第三产业所占比率 能源强度吨标准煤 能源消费总量 煤炭、石油所占百分比 2011 464520 134790 51.562 3.8 80850 93 1987 12058.6078 416060 85.015 2014 726160 136980 56.6 103783 93.578 19.3.562 45.5 8. 2.8 1991 21781.028 22.6 8.811 3.3.359 43.5 9.1 76682 92.3 112704 26.6 9.974 3.1 1990 18667.092 2012 539110 135520 53. L .4 115823 26.9 1986 10275.4 模型的建立 上文统计出了碳排放总量的七个影响因素,下面的工作就是分析这七个因 素对碳排放总量的具体影响程度。为了充分考虑各个影响因素的权重,我们采 取了 BP 神经网络模型。 理论上已经证明:具有偏差和至少一个 S 形隐藏层加上一个线性输出层的 网络,能够逼近人任何有理函数。针对本文实测目标,神经网络模型采用三层 前馈网络,由输入层,隐含层,输出层组成。输入层有七个神经元,每个神经 元对应一个影响因素,其输入为因素的归一化结果值;输出层有一个神经元, 输出为碳排放的总值。 第一层(输入层):将输入引入神经网络。 Outi(1) = Ini(1) = x. i = 1.4 86632 93.9103 340500 87.9 33.7059 389170 86.1 9.672 44.2 1988 15042.1 107507 24.6 109300 25.404 22.2 18.5 29.6 10.552 2013 625680 136250 54.1 92997 93.9103 340500 87.5123 444800 84.0 9.8 30.562 3.4 31.708 21.3 29.8 114333 26.03 105851 23.481 2015 842770 137710 58.

10] 来确定其初始值 l = 10 对于 BP 训练算法函数,本文选取“Levenberg-Marquardy”算法。与其他算法 相比,LM 算法对于大小适中的前向神经网络几乎是最快的,而且由于其自身 的求解特点可以最大程度减少内存使用,使其具有最快的收敛速度,并且 LM 算法最擅长函数逼近问题。 模型的求解 对于上面建立的基于 BP 神经网络的碳排放模型,我们利用了方便、实用的 MATLAB 来编程求解。把所有的数据分成两部分,其中用来训练,2 份用来检 验模型的效果。经过反复调整权值、阈值和隐层神经元个数,最终确定神经元 个数 l = 14 ,实现效果良好。 BP 神经网络的结构图如下图 3 所示。 图 3 BP 神经网络结构图 10 . (2) n (1) (1)  In j = ∑ wij ⋅ Outi i =1  Out (2) = f ( In(2) ) j j  j = 1. l 分别代表输入层节点数,输出层节点数,隐层神经元个数。根据本 问题可以直接确定 m = 7. L . n j =1 其中 m. 2. l 其中 f ( x) 为传递函数,这里采用的是正切 Sigmoid 函数: f ( x) = tanh( x) 第三层(输出层): yk = Out (3) k = In (3) k l (2) = ∑ w(2) j ⋅ Out j . k = 1. a ∈ [1. n = 1 。至于 l 不能直接确定,这里采用经验公式: l = m + n + a. n. 2. L .

训练结果如图 4 所示 Performance is 5.807 .00001.974 87.037 表 6 BP 神经网络的预测 2012 2013 88.64942e-007.741 11 2014 87.974 2015 85. 检验结果如图 4 所示。 BP神经网络预测 90 预测值 80 实际值 碳 排 放 量 /亿 吨 70 60 50 40 30 20 10 1985 1990 1995 2000 年份 2005 2010 2015 图 5 检验结果图 由上图可以看到,实际值的最后两个数据和预测值相当接近,故此 BP 神经 网络模型较好的实现了碳排放预测的功能,曲线拟合度较高。 对未来 5 年的预测结果如下表 6 年份 预测值 2011 88. Goal is 1e-005 Training-Blue Goal-Black 0 10 -5 10 0 1 2 3 5 Epochs 4 5 图 4 训练结果图 由图 3 可以看出,该算法通过 5 次训练就达到了预设的误差 0.

5861 0.5402 -1.0749 -1.4981 0.0789 0.6709 0.2645 0.8576 -0.0973 -0.8729 0.1848 0.7856 -0.3961 -1.2503 -0.5962 -0.5140 0.4562   -0.2913  -1.0322 0.5* tt1 tt 3 其中 t1 是 26 年里碳排放的真实值 , t2 是 26 年里预测 的数据, tt1 是 2009 年的真 实数据, tt 2 是预测 出的 2009 年的数据, tt 3 是 2010 年的真实 数据, tt 4 是预测 出的 2010 年的数据.8459 -0.1766  影响因素人口总数城镇化第三产业比率能源强度能源消费总量煤炭石油所占百分比 =  GDP 由于神经网络有七个输入因素,14 个隐层神经元节点。故权值矩阵呈现 12  .5* 1 n t2 − t1 ∑ n i =1 t1 tt 2 − tt1 tt 4 − tt 3 + 0.3844   -1.2822 0.3866 0. 最后求出的结果: ∆1 = 0.9767 0.7942 0.6110 -1.7129 -0.3544 -0.7256 0.4210 1.6 模型的分析 本文建立的 BP 神经网络碳排放模型经过不断的训练,最终通过检验,从 而验证了模型的正确性和可用性。基于神经网络的曲线拟合,其权值矩阵有着 一般曲线拟合的一维系数同样的共能,即表征各个同阶变量对因素的影响大 小。因此,可以用得到的权值矩阵来定量分析者七个因素对于碳排放的的制约 或影响程度的大小。           权值矩阵=            -0.9474 0.4896 1.3291 0.7233 0.7177 1.3872 -1.2125 -0.9350 -0.2115 0.0713  1.1882   -0.5517  0.6046 -0.3105 -0.4232 -0.5043 -0.6431 0.6533  0.1181 -0.8462 1.4247 0.8445 -0.1848 0.3553 -0.6830 0.9967 1.0296 0.6584 -0.0850 0.0028 -0.0309 0.5807 -0.1460 0.0164 0.3.8066 -0.4735 0.8995 -0.5 误差分析 对于预测的数据进行误差分析时,主要有两块,第一是总体误差分析 ∆1 ,第二是利用训练后的模型对检验数据进行预测并求出其误差 ∆ 2 。 ∆1 = ∆ 2 = 0.1968 1.3295 -0.9739 0.3.0704 -1.2977  -0.8039 -1.7571 -0.8469 0.6770 -0.50 从上面可以看出,预测效果相当好。 4.1320  0.3503 -0.3698 -0.7622 -0.3654 -0.58% ∆2 = 0.6014 -0.6746   0.4.4676 1.1301  1.7939   0.9510 1.1741 0.5331 0.0867   -1.7638 -0.6602 -1.2116 0.5588 -0.1118 -0.3028 1.1376 -0.

效果良好.000 ) ( 3. 为相关部门决策提供参考。 4.1 变量的选取与数据处理 对于影响碳排放指标选取. 预测了2011 ~ 2015年我国碳排放量.965 ) Sig ( 0.4预测分析 通过spss对2011~2015年的人口总数(万人)、城镇化、人均GDP(亿 元)、能源强度(吨标准煤/万元)进行了预测,数据如表7 13 . 精度较高.937 t ( −3. 采用1985~2010年的人口总数 X 1 、城镇化 X 2 、人 均GDP X 3 、能源强度 X 4 四个指标,资料来源于我国统计年鉴2011相关各期资 料。 4. 构建了多元线性回归 预测模型。预测结果表明.357 ) ( 8. 能够较为客观地反映我国碳的排放量。并在此基础上.680 ) ( 3.0534    结论:七个因素中城镇化和能源强度对碳排放的影响程度较大。在进行碳排 放限制中应该首先考虑。 4.0680 0.0704 0.0602 0.001) 根据SPSS的分析结果,得到可决定系数为0.1.2做重叠散点图 先对因变量碳排放量和自变量人口总数、城镇化、人均GDP、能源强度分别 做散点图,发现均呈线性关系,只是线性的不够严格。接下来进行多元线性回 归。 4.982,有显著的统计学意义。 4.4.0170 0.4 碳排放量回归模型分析 文中利用1985-2010年我国碳排放量的样本数据.946 X 2 + 0.4.001) ( 0.14 × 7 维矩阵。其中行代表输入的不同影响因素变量;列代表每个输入变量的 神经元权值,对应着七个影响因素。 这里采用“均值滤波法”进行权值与自变量系数的转换:求出同一变量的各 权值的平均值后取绝对值,作为相应因素对碳排放的最终影响系数。原因有以 下两点:同一变量不同权值的算术平均值可以表示其在整个网络中的整体权重 值;而不同变量的权重值最后都取绝对值又保证了他们比较的基准相同,可 以全部通过正向比较来区分不同权重的大小。此外,在 BP 神经网络中其权值 的符号只是用来在网络内部进行均衡调整,以使训练模型能尽快收敛,因此 在最终进行不同自变量比较时,可以不考虑。 下面用“均值滤波”法对输入权值求取相应的“影响程度系数”,结果为  GDP 人口总数城镇化第三产业比率能源强度能源消费总量煤炭石油所占百分比  0.001) ( 0. 打破了传统模型拟合优度低的 缺点.184 X 3 + 568.4.724 ) ( 0.00 ) ( 0.645 ) ( 0.1090 0.756 X 4 − 21484.模型的建立与分析 1.159 X 1 + 12.0766 0.4.3作多元线性回归分析 y = 0.

8865 117.年份 2011 2012 2013 2014 2015 表7 2011-2015年影响因素数据预测 人口总数 城镇化% 人均GDP 134645.1 通过这些预测的数据对碳排放量(万吨)进行拟合。数据如表8,为了使预测 的结果更有说服力,利用图6碳排放量-年份折线图进一步来表明在未来几年 碳排量的走势。 年份 碳排放量 2011 94.其中绝对误差=实际值-预测 值,相对误差=(实际值-预测值)/实际值。具体数据见如表9: 14 .42 136273.72 能源强度 3.1429 2014 131.26 135119.4.78 51.2195 表8 碳排放量预测值 2012 2013 104.56 56.4613 图6 2011-2015碳排放量预测值 4.8 42710.15 58.6 3.13 54.82 135933.2383 2015 147.5 3.28 135549.4 3.5模型检验 应用多元回归分析模型对1985-2010年碳排放量进行检验,通过EXCEL 软件得出实际值与预测值的绝对误差和相对误差.1 36993.5 49310.87 52.2 3.1 65729.3 56931.

01127 2008 6803.4 8239.9 6983. 由 15 . 预测精度为二级.5 对建立的模型进行分析比较与具体建议 在所建立的三个模型中,经过对预测值与实际值的相对误差进行比较可 以发现,模型 1 与模型 2 对碳排放的预测效果都比较好,通过检验可以发现 误差都不是很大,而模型 3 对碳排放的预测效果却没有这么好,GM(1.307 -0. 用MA TLAB 实现改进BP 神经网络模型具有计算精确、使用方便的优点。分析 得出的BP 神经网络预测模型.3265 -0.7089 0.5 7389.02568 2009 7710. 关联度、均方差比值和小误差概率均为一级.096 -73. 进一步提高预测能力.445 321.1) 模型仅适用于短期预测.l) 模型适用于短期和中期预测.019044 2007 6260 6331.00894 注:由于篇幅有限,仅取一部分数据,具体数据见附表 3 经对数据的分析与计算,发现该模型的平均误差为 8.327 -71. 它可以为以后制定环境规划等方 面提供科学依据。 2 模型的缺点与改进 1)灰色G M (1.1)预测和多元线性回归分析对 近20年的碳排放量进行分析,并对未来几年的进行了预测。 1)首先BP神经网络更能适应由多因素影响碳排放量预测的复杂性和小样 本性。克服了一般回归分析的不够精确的局限性,经过反复实验训练确定了最 佳的隐层结点个数.043448 2010 8165.1 5708.207 -179. 对于长期预测.1)模型和模型 3 中的多元回归模型对各个影响 因素的分析可知,能源强度与城镇化比率对碳排放的影响较大。因此政府可以 通过加快城镇化脚步与提高技术水平来减少碳排放。对于加快城镇化的发展这 一问题,政府可以倡导建立中国投资基金,加快基础设施的建设和公用事业 的发展,促进城镇化的快速发展,同时积极地改善住房难这一问题;而目前 对于减排的技术主要有 3 种技术方向和选择。一是采取化石能源的替代技术 , 主要包括清洁能源替代技术、可再生能源技术、新能源技术(核能目前已经被排 除在联合履约和 CDM 机制之外);二是提高能效,进而通过减少能耗实现削 减碳排放;三是碳埋存及生物碳汇技术。此外,适当的税收等财政金融政策可 以起到加速技术改造进程,优化资源配置,降低全社会减排成本的作用。 5 模型的分析与推广 1 模型的优点 本文采用三种模型BP神经网络、灰色GM(1.0554 0. 预测结果与实际值出入较小. 说明 G M (1. 精度较高.对于近一两年的预测值很精确.6964 -0.l) 模型在碳排放量预测中是可行的.3%。发现预测值与 实际值相差不大,也符合实际的走势,一次可以利用该模型对我国碳排放进 行短期的预测。 4.表9 误差检验表 年份 实际值 预测值 绝对误差 相对误差 2006 5817. 提高网络的可信度。 2)应用G M (1.l) 模型对中国未来碳排放量进行预测.391 108. 模型具有较高的应用价值. 可以不断添加历史数据. 合理地确定了最优的网络结构.而远期的数仅仅反应一 种趋势。根据模型 2 中的 GM(1.

计算机应用与软件. [13]杨华龙.郑冬喜. 7 附录 附录1 GM(1.GM(1.胡玉才.微电子学与计算机. [9] 罗党.曾令可.王慧.科技咨询导报.(01). 灰理论基础[M].(04).罗键. 基于改进BP神经网络的预测模型及其应用[J].夏冰./100. [2] 肖静.农业系统科 学与综合研究. 基于BP神经网络的预测方法应用研究[J].(04).中国统计出版社.于未来的扰动因素影响.金雪莉. [14]陶菊春.2008.灰色 模 型 GM(1.2002.计算机 测量与控制.系统工程理论方法应用. (08). 16 .clc x0=open('shuju4. BP神经网络预测的MATLAB实现[J].系统工程与电子技术. (02).1)模型的改进及应用[J].浅谈BP神经网络预测模型[J].数学的实 践与认识.(02).北京. 2007.中国工程科学.胡秀莲. x0=x0(10:length(x0)).1)模型的改进方法与应用[J].税安泽.孙永厚.2004.刘金霞. 哈尔滨金 融高等专科学校学报.灰色预测GM(1.(01) .中国统计年鉴. 2002.党耀国. 基于MATLAB的BP神经网络预 测系统的设计[J]. [8] 邓聚龙. [6] 袁泉. BP神经网络预测算法性能的改进策略[J].北京:能源研究所.郭其一. 2003. 可线性化非线性回归预测模型的剖析与改进[J].t1).1998.1)优化[J]. [5] 王钰.1)模型的精确解法[J].李维刚.刘莹.2011. 会使得预测精度降低。 2)采用多元线性回归模型误差较大,同时预测精度较低。 综上所述,在分析岩溶系统,农业机械化水平发展等复杂问题时,采用多种 方法进行比较分析,可以得出更符合实际的方法。 6 参考文献 [1] 姜克隽.1)预测MATLAB程序 clear.2009. 2007. [3] 焦淑华. [10]张辉.(23):39-46.mat').徐海静. [12]许秀莉.邹传平.2003.24(4):60-63. x0=(x0.2011.系统工程与电子技术.吴建民. [4] 李萍. for i=1:length(x0) x1(i)=sum(x0(1:i)).罗键.GM(1.中国与全球温室气体排放情景分析模型(IPACEmission).GM(1.(04).郭尚. [7] 王建平. (01).刘艳春. [11]许秀莉.武汉:华中科技大学出版社.刘思峰. 2001. [15]中华人民共和国国家统计局.1)模型的改进方法及其应用[J].2005. 2002.数学的实 践与认识.郑斌.胡适耕.(10).

/x0.1)Ô¤²âÎó²î') xlabel('Äê·Ý') ylabel('Îó²îÖµ') 附录2 BP神经网络预测MATLAB程序 clear. end b(:. E=(1+abs(gs0)+abs(gs1))/(1+abs(gs0)+abs(gs1)+abs(gs0-gs1)). ei=abs(d-mean(d)). S0=0.1:length(x0))-x0). y=(x0(2:length(x0)))'.5*f0(length(x0)). f1=(x0(1)-a(2)/a(1))*exp(-a(1)*t)+a(2)/a(1). S2=std(d).'b-'.'m-*') legend('ʵ¼ÊÇúÏß'. f0(1)=f1(1). plot(x.1)=-0. C=S2/S1.5)*x0(1)+0.1:length(x0)). gs1=sum(f0(2:length(x0)))-((length(x0)-1)-0.x0. w=d. P=mean(ei<S0).end for i=2:length(x0) b(i-1.'Ô¤²âÇúÏß') title('GM(1.x.5*(x1(i-1)+x1(i)). %rΪ¹ØÁª¶È gs0=sum(x0(2:length(x0)))-((length(x0)-1)-0.f0(1.w) legend('Ïà¶ÔÎó²îÇúÏß') title('GM(1.5*max(d)).2)=ones(length(x0)-1.5)*f0(1)+0. %r=mean(nl)./(d+0.clc %ÊäÈëѵÁ·ÏòÁ¿p£¬× ¢Òâ±ØÐëʹp£¬t¾ØÕýÁÐÏàµÈÆäÖÐÿÁбíʾһ¸öÑù±¾£¬ÐÐÊý±íʾ×ÜÑù±¾ 17 .1). S1=std(x0).5*max(d)). a=inv(b'*b)*(b'*y). t=0:length(x0)+4.6745*S1. end d=abs(f0(1. %wΪÏà¶ÔÎó²î %nl=(min(d)+0.5*x0(length(x0)). x=1995:1994+length(x0). for i=2:length(f1) f0(i)=f1(i)-f1(i-1).1)Ô¤²â') xlabel('Äê·Ý') ylabel('̼ÅÅ·ÅÁ¿/ÒÚ¶Ö') figure plot(x.

length(t1)).maxt). MSE=mse(E). %ÍøÂç·ÂÕæ PN=sim(net.'ʵ¼ÊÖµ') title('BPÉñ¾ÍøÂçÔ¤²â') xlabel('Äê·Ý') ylabel('̼ÅÅ·ÅÁ¿/ÒÚ¶Ö') 附表3 多元回归误差检验表 年份 实际值 预测值 1980 1448. net.mint.tn. %ѵÁ·Ñù±¾¹éÒ»»¯ [pn.goal=0.X1. %²âÊÔÄ¿±êt1 t1=pt.pn.00001. %ÍøÂç³õʼ»¯ net=init(net).5 1917. %ѵÁ·Ä¿±êÏòÁ¿t t=pt.73 -343.'trainlm').Êý pt=open('shuju5.t1.9 1850.t.9 1581.show=50.988 相对误差 -0.trainparam./100.mat').18585 . X1=1985:1984+length(t1).trainparam.888 18 绝对误差 -469.{'tansig'.maxp).minp.P_test. legend('Ô¤²âÖµ'.'purelin'}. net.trainparam. %ѵÁ·ÍøÂç [net.t2.tn). X2=1985:1984+length(t2).t2(1.'m-*'.[14.63 1982 1506. net. %×÷ͼ±íʾʵ²âÖµºÍ·ÂÕæÖµ figure(1).maxp.p2). net.maxt] = premnmx(p. plot(X2.tr]=train(net. %·´¹éÒ»»¯ [t2]= postmnmx(PN.p.272 -141.epochs=2000.'b-').1].mc=1. %²âÊÔÑù±¾P_test P_test=pt.minp.mint. p=pt. %´´½¨ÍøÂç²ÎÊý£¬¿ÉÒÔ¸ù¾Ý×Ô¼ºÒªÇóÐÞ¸Ä net=newff(minmax(pn).t).trainparam.08961 -0.772 1981 1439. %²âÊÔÑù±¾¹éÒ»»¯ p2= tramnmx(P_test.0.t1./100.2447 -0. %mseÖ¸±ê E = t1 .

268 1997 3081.302 1992 2449.697 3 8.404 7 9.2 2391.842 185.4 1159 92.9 18.03636 -0.1 7668 92.063 9 31.02246 0.131 2002 3464.2 22.4 1903.136 1 29.4 1741.043 1988 2240.7568 337.5 1539.8 26.098413 0.6067 253.08362 -0.3887 327.028 2 9.4 2938.7 3149.070773 0.242 1984 1724.04367 -0.8 3698.01527 0.8 1747.5 34.9 27.5096 290.723 2 33. 9 48197.3 25.14251 -0.008 2000 2849.967 附表4 BP神经网络中各项因子的数据 年份 GDP 人口总 城镇化 (亿 数(万 % 元) 人) 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 9016. 5 35333. 5 26923.17719 0.708 0 9.8 8085 93 19.2235 72.2 21.06308 -0.0 4 10275.1 22.342 1991 2359.492 70 7.111 1985 1857.671 6 29.308 -427.2 4162. 8 21781.022497 -0.693 83 7.979 1999 2885.056282 能源强度 能源消 煤炭、 实际碳排 吨标准煤/ 费总量 石油 放 万元 所占 百分 比% 10.315 .3 3014.553 2 33.2 24.9 9870 92. 2 12058.05299 0.8677 108.213767 0.024077 0.531 -233.3 2202.43294 -103.176 1989 2275.06046 0.9 1091 93. 8 16992.002 57.4 28.4 8663 93.1 9299 93.01581 -0.1853 293.3 2491.266 93 6.7 3276.8 22.392 1987 2102.755 5 33.6 2452.1983 1593.5 19 -0.514 6 32.203634 0.867 1990 2269.7 2973.4082 355. 10585 1 10750 7 10930 0 11102 6 11270 4 11433 3 11582 3 11717 1 11851 7 11985 23.6788 -263.07 2003 4069.08491 0.1933 318.71 2004 5089.1 9693 93.638 3 30.7 2798.796 2001 2969.738 1996 2893.81 1995 2861.120452 0.2 26.642 -132.578 2 9.6 3463.582 1998 2967.1184 -47.7 2373.4 26.9 26.993 1994 2831.096 -493.96245 -44.8 4799.685 24.2 23.032881 -0.27 -93.9 1227 92.618 1993 2626.569 28 28.13034 -0.5 2577.8 1530.6905 62.6 1037 93.58184 173.5 25. 3 18667.7 5218.615 2005 5512.8 1652.7 -147. 6 15042.192695 0.7333 第三产 业所占 比率% 28.607 1986 1970.753 4 8.

3 89677.9 33.6 49.1 28.891 5 41.3 77.6 55.862 7 32.497 90.2 4.6 4.5 41.68 20 6. 7 71176.673 92.425 3 43.822 4.4 34.233 7 40.817 91.696 90.1 4.6 6.8 41.672 7 39.934 91.5 43.3 34.692 90.020 4 40.65 .2 5.231 8 37.6 68.4 28.7 29.857 91.7 39.1 40.105 87 81.5 31.2 28.8 30.4 58.938 29 30.3 4. 1 99214.6 88.1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 9 60793.032 37 1311 76 1351 92 1359 09 1361 84 1405 69 1455 31 1504 06 1594 31 1837 92 2134 56 2359 97 2586 76 2805 08 2914 48 3066 47 3249 39 92.648 91 40. 6 10965 5 12033 3 13582 3 15987 8 18493 7 21631 4 26581 0 31404 5 34090 3 40120 2 0 12112 1 12238 9 12362 6 12476 1 12578 6 12674 3 12762 7 12845 3 12922 7 12998 8 13075 6 13144 8 13212 9 13280 2 13345 0 13409 1 5 32.8 43 43.617 92.127 90.9 62.510 6 40.8 36.142 1 4.9 45.9 4.9 44.7 5.1 29.039 88.7 46.455 6 41.5 4.8 4.173 9 36.1 28.171 89.3 5.898 90.772 4 34. 6 78973 84402.381 5 40.2 37.467 5 41.8 50.7 5 4.