Professional Documents
Culture Documents
No. 2 2006 Statistical Research 59
统计指数的贝叶斯方法
朱喜安 郜元兴
ABSTRACT
The paper put forward the author ’views about essence of index after discussing the concept of
Statistical Indices at the first . Then the author introduces the bayesian theory and the connection with
statistics indices. Combining Shanghai Stock Exchange ,the paper mainly introduce the model of point of
chain 180 index ,and empirical research of bayesian estimator for Statistical Indices.
其中 pt 为报告日某支股票的收盘价 , pt - 1 为前一交易日
二 、
基于上证 180 指数的实证分析
价格 。笔者选取了 2004 年 1~3 月份的数据 ,并详细计算
为了实证分析的需要 ,本文仅就上证 180 指数的环比 了每天的 180 支成份股指数的均值 、
中位数 、
偏度与峰度 ,
指数 ,说明统计指数的贝叶斯方法的基本原理及具体应 应用 SPSS 软件进行柯尔莫哥洛夫 —斯米尔洛夫检验 , 最
用。 后认为以正态分布作为上证 180 指数的总体分布是比较
( 一) 上证 180 指数及其算法 合适的 ,也是符合指数本身的特性的 , 更是符合实际应用
11 上证 180 指数及其现行算法 。 中计算简单明了的需要的 。柯尔莫哥洛夫 —斯米尔洛夫
上证 180 成份指数采用派许加权综合价格指数公式 检验结果如表 1 所示 。
计算 ,以样本股的调整股本数 由表 1 可以看到 ,在显著性水平 0101 下 , 除了 2 月 2
报告期指数 = ( 报告期成份股的调整市值) 日 ,3 月 3 日 、
11 日 ,23 日 、
24 日 、
25 日等少数几个交易日
Π( 基日成份股的调整市值) ×1000 (1) 外 ,其余交易日基本上能通过正态性检验 , 所以我们选取
其中 ,调整市值 = ∑(市价 ×调整股本数) ,基日成 正态分布作为其总体分布 。
份股的调整市值亦称为除数 , 调整股本数采用分级靠档 ( 三) 上证 180 指数先验分布的选择
的方法对成份股股本进行调整 。 常用的先验分布的确定方法有无信息先验分布 、
共
21 基于贝叶斯估计的上证 180 指数算法 。 扼先验分布 、
直方图方法 、
相对似然方法 、
多层先验分布 ,
由于上证 180 指数 ( 取收盘价为当天指数) 点数很大 , 以及杰弗莱原则 、
最大数据信息原则和不变测度原则等 。
不利于进行估计 。为了实证分析的需要 , 本文在估计中 , 这里我们主要应用直方图及矩方法来确定 。
以收盘价为一个变量序列{ Pt } ,去估计一个新的与 180 指 表 1 环比指数的柯尔莫哥洛夫 —斯米尔洛夫检验
数相关的环比总指数 , 实际上也就相当于是一种新的算 日期 K2S 值 P值 日期 K2S 值 P值 日期 K2S 值 P值
1月5日 01771 01592 2 月 11 日 11485 01024 3月8日 01617 01841
法。 1月6日 11415 01037 2 月 12 日 11412 01037 3月9日 11032 01237
估计总指数 Kt = Pt / Pt - 1 ,其中 Pt 为报告日上证 180 1月7日 11212 01106 2 月 13 日 01736 01651 3 月 10 日 11395 01041
1月8日 11452 0103 2 月 12 日 11412 01037 3 月 11 日 11636 01009
的收盘价指数 , Pt - 1 为研究上证 180 指数确定的新基日价
1月9日 11507 01021 2 月 13 日 01736 01651 3 月 12 日 11442 0103l
格指数 ( 本文为 2004 年 1 月 2 日的价格指数 ) , Kt 为总体 1 月 12 日 1102 0125 2 月 16 日 11175 01126 3 月 15 日 11209 01108
物价 ( 收盘价) 指数 。 1 月 13 日 11373 01046 2 月 17 日 11614 01011 3 月 16 日 11404 01039
1 月 14 日 11013 01256 2 月 18 日 11393 01041 3 月 17 日 11427 01034
Pt =
∑p q t t
×1000 , P0 3 = ∑p 0
3 q0 3
×1000 (2)
1 月 15 日 11196 01115 2 月 19 日 11276 01077 3 月 18 日 41861 01027
1 月 16 日 11299 01068 2 月 20 日 11344 01054 3 月 19 日 11212 0111
∑p q 00 t ∑p 00 q0 3
1 月 29 日 11399 0104 2 月 23 日 11163 01133 3 月 22 日 11627 0101
其中 ,00 为 180 指数现行算法的基期 ,0 3 为本文基 1 月 30 日 11412 01037 2 月 24 日 01819 01514 3 月 23 日 11671 01008
期 , t 为报告期 。有 2月2日 11746 01004 2 月 25 日 01686 01734 3 月 24 日 11821 01003
2月3日 11457 01029 2 月 26 日 11585 01013 3 月 25 日 31483 0
∑p q t t
×1000
2月4日 0198 01292 2 月 27 日 11571 01014 3 月 26 日 11278 01076
11352 01052 0197 01303 3 月 29 日 01622 01834
Kt = Pt ΠPt - 1 = ∑p q 00 00
= ∑ pt qt
(3)
2月5日
2月6日 11266 01081
3月1日
3月2日 11135 01152 3 月 30 日 01668 01764
∑p qt- 1 t- 1
×1000 ∑pt- 1 qt - 1 2月9日 01823 01507 3月3日 3185 0 3 月 31 日 11305 01066
=
∫ ∏
Θ
Kπ( K)
i =1
p ( x i | K) dK
(5)
600345
600350
长江通信
山东基建
50
20
n
江西铜业
∫
π( K) ∏p ( x | 600362 15
i K) dK
Θ i =1 600569 安阳钢铁 15
其中 ,Θ为参数 K 的取值空间 。特别的 ,如果总体为 600597 光明乳业 30
g ,再由 B = Ag ( R
等五个指标 ,确定一个权数矩阵 R g ) 就可 T
31 上证 180 指数实证分析结果 。
以得到每只股票的综合排名 ,据此可以选取样本 ,结果如 我们考虑 2004 年 1 月 5 日~3 月 31 日 ,共 55 个交易
62 统计研究