CPI各分项权重估算

Original 2017-03-30 李慧勇王健余子珍 申万宏源宏观

文：申万宏源宏观李慧勇、王健、余子珍

感谢实习生黄云昊对本文作出的贡献！

结论或者投资建议：

我们研究了CPI分项权重的三种估计方法，并进行了适当的检验，拟合度比较好。

12选7解方程筛选法，适用2016年CPI八大类权重估计。采用2016年CPI八大类环比数据，从12个月中选取7个月，结合权重相加和为1的限制方程，解八元一次方程，得796组解；通过设置检验条件，得到14组合适的八大类权重估计值。此方法结果较好，但数据量要求较为苛刻。

最优化法，适用2016年CPI大类权重估计。用2016年CPI八大类环比数据在限制条件内，以最小均方误差为优化目标，采用拉格朗日法，得到最优化权重结果。这类方法适用范围广，但对波动较小的类别估计较差。

贡献率逆推法。结合统计局每月公布的食品分项同环比数据以及影响CPI数值，依据公式“权重*分项变化数=拉动CPI变化数”，并四舍五入影响，逆推出权重范围。此类方法结果精确，但随着样本数增加，权重范围交集较难取得，影响最终结果。

利用最优化法计算得到的权重具有极好的拟合效果。我们利用最优化法测算得到的CPI分项权重分别为：食品烟酒31.1%，衣着9%，居住19.4%，生活用品及服务5.5%，交通和通信14%，教育文化和娱乐9.4%，医疗保健7.5%，其他用品和服务4.2%。根据测算的权重对CPI进行拟合，拟合值与真实值之间的差约在0.01左右。

正文

国家统计局没有公布CPI各分项的具体权重，加大了CPI预测的难度。因客户问的比较多，我们研究了一些方法对CPI分项权重进行估计，并进行了适当的检验，拟合度比较好。

1. 解方程筛选法

12选7解方程筛选法，适用计算八大类CPI权重。采用2016年CPI八大类环比数据，从12个月中选取7个月，每个月列出权重相加方程，再加上相加和为1的限制方程，共8个方程8个未知数得到确定解，共796组解。然后设置筛选条件，用其余数据进行比对筛选，结合统计局公布信息，得到一组最合适的八大类权重估计值。

据统计局公布，CPI权重每5年大变动一次，每年小变动一次。最近一次大变动是2016年，所以我们可以用2016年全年CPI数据去估计CPI权重。

如果2016年各月权重固定，CPI应该等于各分项同比数值乘以权重。12个月CPI数据得到12个方程，限制条件为八个分项权重相加为1，每个分项权重大于0小于1，共13个方程8个未知数，理论上无精确解。从而我们选取7个月作为联立方程组，加上权重相加为1的方程组成8个方程8个未知数的方程组，可得到唯一精确解。

在matlab编程的帮助下，我们采用以下方法进行操作：

a. 设立未知数：设立八个权重未知数Wi（i取1至8），分别表示食品烟酒、衣着、居住、生活用品及服务、交通和通信、教育文化和娱乐、医疗保健、其他用品和服务的权重；

b. 建立方程组并求解：选取7个月CPI数据得到七个方程，即：

联立∑w_i =1（i=1,2,...8），表明八个CPI分项权重相加为1；建立八元一次方程组。

2016年有12个月CPI数据，每次选出7组，共有C_12^7种不重复的选法，得到792组有效解；

c. 第一次筛选：对上述792组解，采用条件“分项权重大于0小于1”，进行筛选，即满足：

剔除567组数据，剩余225组有效解；

d. 第二次筛选：利用剩下来5个月CPI环比数据对求解进行核算，与实际公布的CPI数值比较，剔除误差大于0.05的解，共剔除111组数据，得到114组有效解；

e. 第三次筛选：利用16年12个月CPI同比和累计同比数据进行核算，要求12个月都满足绝对误差小于0.05，共剔除100组数据，剩余14组数据，列举如下：

2. 最优化法

最优化法，适用于计算大类CPI权重。采用2016年CPI八大类环比数据在限制条件内，以最小均方误差为优化目标，采用拉格朗日法，得到最优化权重结果。具体地：

建立数学方程形式：

其中〖CPI〗_i代表2016年第i个月的CPI当月环比数据，〖CPI〗_i^sp代表第i个月CPI的分项环比行向量，W代表权重列向量。限制条件是每个权重大于0且小于1，分项权重相加为1。

列出上述线性最优化问题后，我们可采用拉格朗日法对其求最优解。得到CPI八大分项权重，且与第一种方法计算出的CPI分项权重差异较小。

数据验证：基于16年以来CPI当月同比和累计同比数据，对上述权重进行检验，我们发现除了16年1月份数据拟合效果略有差异，其他结果均非常精确。

类似的，我们给出CPI食品和非食品权重，以及消费品和服务权重：

3. 根据贡献度逆推法

根据统计局公布的贡献率逆推法，适用2017年CPI重点食品分项权重。国家统计局2017年1月与2月不仅公布当月同比和环比数据，对变化较大的重点食品分项同时还公布了对CPI拉动百分点数，这为计算食品分项权重提供一种渠道。具体公式如下：

权重*分项变化数=拉动CPI变化数

考虑四舍五入因素，我们对分项CPI变化数和拉动CPI变化数均考虑0.05的误差范围0.05，以2017年1、2月数据估计取交集得到最终权重范围。

以猪肉为例，按照国家统计局，2017年2月同比下降0.9%，影响CPI下降0.03个百分点， 2月环比下降1.6%，影响CPI下降0.05个百分点。按照同比数据，我们将猪肉价格取值为（0.85%，0.95%），拉动CPI取值为（0.045%，0.055%），算出交集权重为（2.73%,3.55%）,同理算出1月份权重区间，再取交集得到最终猪肉的权重范围为（2.73%，2.77%）

因数据过于精确导致极小的误差均能带来结果的改变，蔬菜、蛋类两项的权重无法取到交集范围，其他均能有效估出，具体范围如下：

数学的方法精度很高，目前来看检验效果很好，报告最后我们仍需提示以下几点：（1）中国CPI权重采用“五年一大调，一年一小调”原则，前两种方法使用16年数据计算得到权重，虽17年前两个月检验效果很好，后续如果有所微调可能对结果精确性带来影响。但作为大致范围估算，我们认为效果仍会不错。（2）第二种方法适用范围广，但对波动较小的类别估计较差，而对类似于食品烟酒类等变化较大的分项，估算更为准确。（3）第三种方法，通过国家统计局披露数据进行权重范围估计，随着样本数据增加，取交集的办法可能会导致最终没有公共范围，故权重上下限仅供参考。

李尚福、魏凤和双双被拿下，与美国一份报告是否有关？

“家属和记者取得联系”：记者的退场意味深长

圈内疯传某谣言

不要放过这些人渣

“被指居者”之死：嫌犯身体遭长时间束缚，警方称指居使用械具是惯例