华泰金工周期系列研究:金融经济系统周期的确定(下)

2017-07-18 14:46:57 金融界网站 华泰金工组

【华泰金工林晓明团队】

华泰金工周期系列研究:金融经济系统周期的确定(上)/(下)

金融资产与经济数据共同周期的实证检验

共同周期的实证检验方法

阵列信号处理与MUSIC算法原理简介

经济金融系统周期运行对经济变量的影响与信号传播的原理有相似之处。在空间的电磁波中,携带着大量的信息,民用的移动通信,军用的雷达系统,都可以通过空间的电磁波传递信息。然而,由于多个信号源发射的信息相互混杂,信息接收端接收到的信号,也需要做一定的处理,才能还原出信号源发射出的原始信息。复杂经济金融系统正如同空间中相互混杂的电磁波,资产价格、宏观经济指标等的变化,都是由这个系统中接收到的信号引起的。对经济金融指标信号的提取与分解,就是对他们背后看不到的支撑着他们运动变化的经济金融系统周期的测度。

作为信号源的经济金融周期无法直接被观测,但正如天线可以接收和传递电磁波中携带的信息一样,股票价格、商品价格、宏观经济指标等一系列指标就如同一根根天线,可以接收和传递来自经济金融系统内部的信号,并以经济金融数据的形式展现在我们面前。如何有效的分析和利用这些数据,就是我们在探讨经济金融周期时,要面临的首要问题。

基于经济金融系统运行与信号传播原理的相似性,在这篇文章中我们将参考信号处理领域的相关技术来分析经济金融数据。在信号处理领域中,阵列信号处理的应用极为广泛。阵列信号处理是信号处理领域的一个重要分支,它采用传感器阵列来接收空间信号。所谓传感器阵列,是指由多个传感器按照一定顺序排列而成的接收装置。传感器可以是天线,超声探头,X射线检测器等。在经济金融系统中,股票价格、商品价格、宏观经济指标等经济金融数据就充当了传感器的作用。将多个指标分类或者综合起来获取数据,就得到了阵列信号。

阵列信号主要适用于处理空间滤波问题和空间谱估计问题。空间滤波是传统滤波的空域拓展,其根本目的是有效提取有用信号并抑制噪声和干扰,空间谱估计则是利用阵列输出的信号矩阵,获取关于波达方向,波形参数等信息。在经济金融周期的研究中,我们主要关心信号源的频率参数,也就是推动经济金融系统运行的“信号源”周期的长短,所以我们下面的讨论将会集中在阵列信号处理中空间谱估计问题的研究。

 华泰金工周期系列研究:金融经济系统周期的确定(下)

空间谱估计算法基本分为四大类:线性算法;一般的高分辨算法;参数模型拟合方法;以及子空间法等。其中子空间法受到了广泛的关注,多重信号分类(Multiple Signal Characterization,MUSIC)算法是子空间算法的典型代表。该算法的提出开创了空间谱估计研究的新时代,促进了特征结构类算法的兴起和发展,是空间谱估计理论体系中具有里程碑意义的算法。

MUSIC算法是由Schimidt R.O.等人在1979 年提出的一种空间谱估计的算法。前文提及的方法都是对阵列接收数据的协方差矩阵进行直接处理。MUSIC 算法则是将阵列输出数据的协方差矩阵进行特征分解,得到与信号分量相对应的信号子空间和与信号分量相正交的噪声子空间。然后,利用这两个子空间的正交性,构造出关于目标参数的功率谱函数,进而估计信号的参数(入射方向、频率、信号强度等)。这一系列操作方法大大提高了算法的分辨力。MUSIC算法的思想可以表示如下:

 华泰金工周期系列研究:金融经济系统周期的确定(下)

用MUSIC算法做信号处理之后,我们可以通过对功率谱函数的参数搜索,得到信号源频率参数的最优取值,也就是推动经济金融系统运行的内在推动力的周期。

MUSIC算法信源数的设定方法简介

问题的提出

尽管MUSIC算法的思想涉及诸多的数学推导,过程非常复杂,但在实际应用中,MUSIC算法模型的输入参数却是非常有限——除了原始经济金融时间序列矩阵之外,唯一需要,也是我们唯一可以人为设定的参数就是信源个数。MUSIC算法应用于信号处理领域波达方向(Direction of arrival,DOA)估计时,首先需要确定空间中有多少信号源,才可以精确地估计它们的位置;同理,当MUSIC算法应用于金融经济数据的处理时,也需要先确定经济金融市场运行的推动力究竟有几个,才可以进一步确定每个推动力所形成的周期的长短。

通过前文对MUSIC算法原理的简介,不难发现信号处理领域的信源个数,就是我们要寻找的周期个数。在区分信号子空间和噪声子空间时,每个信号源会对应一个比较大的特征值,这些特征值对应的特征向量构成信号子空间,因此信源数目与信号子空间的维数相同;在利用MUSIC谱函数做参数搜索时,信号子空间的每个向量都与噪声子空间正交,形成一个最小值,对应于MUSIC功率谱上就会出现一个谱峰。因此,信源数(也就是周期数),信号子空间的维数,功率谱图上的谱峰数理论上应该是相同的。

然而,周期个数本身,就是进行周期研究的一个重要的待解决问题。通过前期研究的积累,我们发现了市场中存在42个月,100个月和200个月的三个主要周期。在后文MUSIC算法实证中我们在大部分模型中输入信源个数参数为3,做出了符合预期的实证结果。然而,经济金融系统周期信号的研究与信号处理领域对波达方向的估计存在着不可忽视的差异。以下我们将进一步挖掘该参数的数学原理,重点讨论本文设置是否合理,调整这个参数会对模型输出结果造成怎样的影响?

问题的分析讨论

理想情况下,谱峰的数目应等于真实的信源个数,那么在MUSIC算法的实证中,设置不同的信源个数的值会对输出谱函数图中的峰值个数造成什么影响?为了回答这个问题,我们进行了两组模拟实验。在第一组模拟中我们构建了四个幅度相同都等于5,以及周期分别为42个月、100个月和200个月的三角函数信号,叠加形成四个时间序列,并对其分别添加信噪比为1 的高斯白噪声;第二组模拟中构建42个月周期幅度为1,其他两个周期幅度依然是5的信号序列,同样对其加信噪比为1的高斯白噪声,得到四条模拟的时间序列信号。分别输入不同的信源参数值,用MUSIC算法对两组模拟数据进行处理,得到的处理结果显示尖峰数量如下表(更加详细的实验结果请见本文附录中的“MUSIC算法信源数设定的方法及其对实证结果的影响”):

 华泰金工周期系列研究:金融经济系统周期的确定(下)

通过上述的实验研究,我们可以发现,三个周期幅度相同时,尖峰个数不受信源参数输入值的影响;其中一个周期幅度较小时,该周期对应的尖峰会随着信源参数设置的减小而消失。信源数参数的设置与频谱中峰值个数总体呈现正相关关系。具体原因有如下两个:

原因一:噪声的存在提供谱峰漏报的必要条件

理想情况下谱峰的数目应等于真实的信源个数,但是在处理实际的样本数据时,由于采样数目有限,所得数据中存在采样误差。信号处理的本质就是一个在噪声中“浪里淘沙”,发掘有用信号的过程,功率谱图上出现的峰值体现了该处的频率比周围频率的能量更强,更有规律,则该频率是有效信号的可能性较大。因此,在实际采样中,由于采样误差的存在,能量较强的噪声可能会被误以为是信号,而能量较弱的信号可能会被误以为是噪声,这也就是MUSIC算法在信噪比低的情形下可能失效的原因。振幅较小的周期能量也较小,体现在实证结果的数据中,就会出现振幅较小的周期对应的特征值很小,特征值序列下降速度快;体现在功率谱图上,振幅较小的周期的尖峰会比较矮,甚至可能观测不到,也就是在MUSIC空间谱中更容易被“淹没”,出现谱峰漏报的情况。

原因二:信源数目的设置影响功率谱函数的值

在信源数欠估计的情形下,会有一定数目的信号特征向量被划分到噪声子空间,而信号特征向量与功率谱函数中包含频率参数的参数矩阵不正交,这就使得功率谱函数分母部分的值变大,整体功率谱函数的值变小,能量强的信号可以保住尖峰,而能量弱的信号就会随着信源个数欠估计被淹没。而在信源个数过估计的情形下,会有一定数目的噪声特征向量没有被划分到噪声子空间,功率谱函数的分母部分就不会包含这些特征向量贡献的值,因此分母部分的值变小,信号处对应的尖峰相对更明显,甚至有可能造成伪峰。

综上可知,序列数量的特征值代表的是所有的周期信息,当这个信息减少时,减少的其实是幅度小的周期信息。换句话来说,当K=1时,MUSIC算法检测出的是能量最强的周期信息,K=4时,则可以观测到更多可能的周期信息(包含了噪声造成的伪周期信息)。因此,我们可以根据实际情况的需要自行设置K值的大小以获得有效的周期信息。

对于这一问题更加深入的剖析,还可参照本文附录部分的“信源数的设定方法”。我们提出了采用加权特征向量和主成分方法的思想来设定信源数的两种方案。其中第二种方案,基于经济金融系统周期信号的估算存在着高度复杂性,及其与物理信号不可忽视的差异,分析引入主成分分析思想的必要性,提出更有实际意义的经济周期信源数设定的方法。

  MUSIC算法的经济金融数据实证适用性分析

要分析MUSIC算法能否应用于经济金融周期的实证分析,首先需要理解经济系统与经济金融数据的特性;其次,需要深刻理解MUSIC算法的原理,才能对这一分析方法的适用性作出正确判断。

一般而言,任意一个非奇异函数都可以通过一系列操作从时域变换到频域,反之亦然。信号分析的数据处理方法和基本原理是相通的,大部分时间序列都可以转换成信号模型。处理经济金融时间序列的关键在于,针对研究的需要,寻找和运用合适的方法与技术。

MUSIC算法把频率和时域分析相结合,是数字信号理论上的一次重要突破,有人称之为信号的“数学显微镜”。经济金融周期分析采用的变量大多受到强烈的噪音干扰,一般的信号处理手段无法有效处理干扰噪音强烈的时间序列,因此将具备高抗噪特性的MUSIC算法引入经济金融周期分析领域,具有重要意义。

将MUSIC算法应用于经济金融周期的估计,需要满足以下两个基本假设:

1: 各待测信号源互不相关,每个信号源发出单一频率的波(即对应一个周期),各信号源发出波的频率各不相同;待测信号源的个数为K。

2:天线阵列是由M(M>D)个阵元组成的等间距直线阵,各阵元特性相同,各向同性,阵元间隔为d,并且阵元间隔足够小。

本文基本假设是市场存在统一的42个月、100个月、200个月的三个周期,通过华泰周期系列研究,以及前文的实证检验,初步论证了这三个周期信号的存在。这三个周期信号对不同类型的数据产生影响具有差异性,如不同序列发现的周期的相位不同,周期的能量强度不一等。表明有系统产生的三个周期各自独立的发出信号,具有互不相关,频率各不相同的特点。为此我们认为本文研究模型能够满足以上假设1的条件。

需要重点作出分析的是假设2,即我们分析所采用的经济金融周期变量,是否符合直线阵,且“阵元”之间间隔足够小的特点。为此,本文设计以下实证检验方法,通过计算不同变量之间的相关系数,并做统计学分析以获得相关结论。本文认为,变量之间相关系数越大,则可以认为变量之间越接近,即满足“距离足够小”的假设。统计学意义上,相关系数绝对值在0-0.3之间,认为低相关;0.3-0.5之间,认为中度相关;0.5以上则认为强相关。

本文的实证结果如下:

 华泰金工周期系列研究:金融经济系统周期的确定(下)

 华泰金工周期系列研究:金融经济系统周期的确定(下)

 华泰金工周期系列研究:金融经济系统周期的确定(下)

 华泰金工周期系列研究:金融经济系统周期的确定(下)

 华泰金工周期系列研究:金融经济系统周期的确定(下)

 华泰金工周期系列研究:金融经济系统周期的确定(下)

 华泰金工周期系列研究:金融经济系统周期的确定(下)

通过相关性分析,我们可以发现,大部分变量之间相关系数大于0.3,满足小间距假设。此外,尽管本文采用的变量中有少量变量之间相关系数低于0.3,我们依然将这些变量纳入分析范围,原因是:

1:造成变量之间低相关有两种可能,一是变量确实“距离”较远,不存在相关性;二是,变量是存在真正的周期的,但是因为周期之间相位差90度,形成正交,导致相关系数偏低。前者确实应该被排除在研究之外,但在后一种情形下,将变量纳入分析范围是有意义的,因为MUSIC算法不受相位影响,能准确测算不同变量的共同周期;

2:从经济学角度看,文章采用的变量都具备相似的经济学含义,只是因为这些变量存在于不同的国家之中,造成了存在相位差的现象。这一现象背后的理由也存在经济学意义,即不同市场之间的周期传导存在时滞,因此造成了变量的相位差。某些变量之间的相位差可能偶然形成了90度或接近90度的特性,因此相关系数较低。我们认为,只要在相关系数矩阵中,大部分变量的相关系数大于0.3,这一相关系数矩阵就应该被保留。

MUSIC算法检测国内重要金融资产与经济数据共同周期

如前文“国内重要金融资产与经济数据的共同周期现象”一节所展示的,我们发现国内重要经济金融指标序列存在明显的42、100、200个月三个共同周期信号。在“经济系统周期假说”、“经济系统周期的反馈原理与传导机制”及“经济系统周期运动对金融经济序列产生的周期共性影响分析”三节,我们论述了统一系统周期的原理,以及统一系统周期对所有经济金融序列产生的共性影响机制。

本节及下节,我们采用多重信号分类算法(MUSIC)--能够有效测量信号共同周期的检验方法对国内、全球的经济金融序列进行实证分析,以证明统一系统周期的存在。

由于我国资本市场历史较短,我们使用1997年1月至2016年12月近20年的市场数据。其中,选择上证综指和深证成指作为待检测的金融资产序列,作为经济系统晴雨表的证券市场的运行情况的代表;使用CPI(消费者物价指数)、PPI(生产者物价指数)、宏观景气指数、M1(狭义货币供应量)和M2(广义货币供应量)这四个指标表征宏观经济运行情况。

由于股票指数的波动幅度远大于宏观经济指标,导致股票指数的对数同比值也较大,如果将两种振幅差别较大的信号进行周期的联合估计,则可能导致结果向能量强度大的信号偏移。为此,我们参考前文,也将对数同比序列进行归一化处理。同时为了更好的捕捉周期信号,对存在明显趋势的数据进行了去趋势项处理(后文“MUSIC算法寻找‘类信号’共同周期的有效性分析”一节论述了去趋势项的可行性与必要性)。在完成前述的数据处理后,我们使用MUSIC算法检验7个经济金融同比序列是否存在共同周期,检测结果如下:

 华泰金工周期系列研究:金融经济系统周期的确定(下)

 华泰金工周期系列研究:金融经济系统周期的确定(下)

图表33是MUSIC算法得出的中国主要经济金融数据信号的能量分布情况,峰值对应的横坐标即为我们要寻找的共同周期。信号幅度前三的峰值:40.9、95.24和200.7,与华泰周期系列研究及前文初步实证检验、理论讨论提出的三周期:42、100、200个月相比,偏离仅为-2.61%,-4.76%和0.35%,基本证明了中国市场三个周期的存在,且最显著。

图表34的傅里叶变换法得出的各个指标的周期强度图中,我们发现几乎所有经济金融数据都存在明显的42个月左右和100个月左右周期,而200个月左右的周期仅在CPI、PPI和M2这三个指标中较为明显,上证综指、深证成指和M1这三个指标则没有明显的200个月周期。一方面,我们认为是样本数量有限,仅约240个月,相对长周期200个月略显不足(后文“MUSIC算法寻找‘类信号’共同周期的有效性分析”一节论述了测度长周期要求足够的数据长度);另一方面,相比短周期,政府企图“熨平”经济周期的干预行为,产生的影响可能对长周期产生更强的噪声干扰,在数据样本有限的情况下,影响尤为明显。故此,存在部分经济金融变量无法有效的捕捉系统的长周期信号,使得在共同周期检测中越短的周期能量越强。我们并不能够简单的将共同周期能量强度作为周期重要性的判别标准。他们共同驱动经济金融序列的运动,我们需要根据不同时间长度的择时策略综合考虑三周期的运行状态再判断决策。

  MUSIC算法检测全球重要市场金融资产与经济数据共同周期

在上一节我们通过MUSIC算法实证检验,证明了国内主要经济金融序列存在明显的42个月、100个月和200个月左右的共同周期。而在前文“全球重要市场金融资产与经济数据的共同周期现象”一节,我们发现全球重要市场经济金融指标序列也存在明显的42、100、200个月的三个周期信号。也即,周期现象不仅仅存在某一国家、地区的经济系统,将全球作为一个统一系统考虑,它也可能存在统一的周期运行规律。

经济系统最基本的构成单元“人”,本质上并无差异,我们在文章开头“周期研究的意义”中讨论到,由“人”构成的复杂系统,在系统发展到一定成熟阶段后,呈现出类似的稳定周期规律。任何一个国家和地区,既相对独立,又通过全球化的劳动分工、贸易等等,实质上在互联互通中构成一个更加庞大的统一系统。在前文“经济系统周期运动对金融经济序列产生的周期共性影响分析”一节中,讨论了局部系统与整体系统的关系。本节,我们在全球最重要的市场选取经济金融序列,采用MUSIC算法检验全球经济系统是否存在统一的经济周期。

在“共同周期的实证检验方法”一节中,我们分析了MUSIC能够剥离噪声与相位差异的影响,有效检测信号频率或周期共同项的算法优势。由于全球化分工的差异,各国经济发展成熟程度的不同,互相影响的不对称性,常常是由发达国家或者地区主导经济周期的运动,如同地球公转的春、夏、秋、冬在不同维度的国家相继轮动,经济周期在不同国家或地区也可能出现启动时间、结束时间,以及同一时间处在不同周期阶段的差异。

全球重要股票指数

我们使用中国上证综指、中国香港恒生指数、美国标普500、纳斯达克100、日本日经225、英国富时100、法国CAC-40、德国DAX、澳洲标普,以及印度孟买SENSEX30九个国家或地区的十个股票指数的同比序列进行实证检验。这九个国家或地区2016年的GDP占全球比重61.36%,具有较强的代表性。样本区间为:1993年5月至2017年4月,总计约25年,实证结果如下:

 华泰金工周期系列研究:金融经济系统周期的确定(下)

 华泰金工周期系列研究:金融经济系统周期的确定(下)

如图表35,可见三个能量最强的谱峰数值为:41.62、99.34、199.7,基本与我们提出的三周期假设一致,误差都不超过1个月。表明采用更加丰富的全球股票市场数据,更能有效的滤除局部市场噪音,更有利于统一周期规律的发现。

结合图表36经过傅立叶变换后各指数周期能量分布图可以看出,上述九个国家或地区金融市场的统一周期现象明显,在中国市场能量强度较弱的100、200个月周期在全球市场统一研究中能量强度显著,表明MUSIC算法在把握系统统一规律的应用上具有明显优势。

全球重要债券指数

在这一部分中我们使用中国中证全债、美国十年期国债指数、日本十年期国债指数和德国十年期国债指数来检验全球债券市场的共同周期。数据使用2006年9月至2017年1月约十年的同比序列。实证结果如下:

 华泰金工周期系列研究:金融经济系统周期的确定(下)

 华泰金工周期系列研究:金融经济系统周期的确定(下)

对于国债指数而言,由于数据时间长度较短,我们仅能观察到两个较强的预期中的共同周期,分别在42个月和100个月附近。结合傅里叶变换后的各国国债周期强度图来看,100个月附近的周期各国差异较大。另外我们还观测到26.44个月周期能量较强,以及200个月周期未被测量出来,出现以上两种情况,我们认为这主要是由于数据长度不足和序列中噪声干扰较强导致的。在后文“MUSIC算法检验仿真序列的共同周期有效性分析”一节,根据模拟周期信号序列实验结果发现,检验的序列长度一般需大于周期长度的两倍,否则难以有效的发现共同周期的存在。

全球重要市场CPI与PPI

在这一部分,我们使用中、美、日、英、法、德的CPI和PPI两种物价指数来检验全球主要市场的共同周期现象。数据使用1996年10月至2017年1月约21年的同比序列。实证结果如下:

 华泰金工周期系列研究:金融经济系统周期的确定(下)

 华泰金工周期系列研究:金融经济系统周期的确定(下)

CPI、PPI指数在40.66、88.69和207.6个月附近存在较强的共同周期,与我们假定的三周期理论数值相比偏离水平分别为-3.19%、-11.31%和3.8%。CPI和PPI常常是一国政府宏观经济目标调控的变量,受到政策因素影响明显。相比股票市场、债券市场数据,用于表征经济系统运行状态的客观性略显逊色,也因此存在一定的与系统统一周期的偏离。

从共同周期能量图以及指标各自的能量分布图看,能够较好的证明了三周期的存在。100个月的周期出现一定程度的偏离,我们结合图表40发现,偏离出现的主要原因是美国CPI、德国CPI、英国PPI等指标在70个月附近周期能量较强。这可能是各国政府宏观经济政策对市场的干预对序列产生较大的噪音,使得100个月周期附件能量分布较为分散。

CRB大宗商品指数

在这一部分中我们使用食品、食用油、家禽、金属、工业、纺织现货的价格指数同比序列来检验它们的共同周期。样本区间为1996年1月至2017年1月,总计约22年,实证结果如下:

 华泰金工周期系列研究:金融经济系统周期的确定(下)

 华泰金工周期系列研究:金融经济系统周期的确定(下)

如图表41我们同样可以观察到42个月、100个月和200个月附近的共同周期现象,找到峰值最高的三个点:40.8、91.12和200.3。与我们假定的三周期理论数值相比偏离水平分别为-2.86%、-8.88%和0.15%,基本符合假定。结合图表42的各指标的周期能量分布图来看,各指标在42个月和200个月处的周期能量较强且一致,而在60-100个月区间,除了100个月附近一致性的表现出共同周期,还在60个月周期附近有一定强度的能量,然而能量强度小于三周期,可能为市场噪音。

CRB大宗商品指数作为全球性的指标,它们具有较好的系统指标代表性,明显的三周期进一步证明了全球市场周期的统一性。

全球主要金融资产与经济数据

前文的实证,我们采用MUSIC算法分别发现,全球重要市场的股票指数、国债指数、CPI、PPI,以及代表大宗商品价格表现的CRB现货指数具有类似的共同周期规律。这一发现初步证实了前文提出的统一系统周期假说。

为了进一步证明系统统一周期规律,并确定共同周期长度,本节我们将全球重要市场的各种类型的经济金融序列,纳入统一的实证设计。这种包含广泛国家、地区,以及各种序列的实证检验,有助于更好的滤除某些国家、地区的某些序列存在的噪声项,更加有利于统一规律的发现。

在实证样本的选取上,由于国债指数的可选样本区间长度明显短于其他四类指标,且不足200个月,小于最长的共同周期长度。为此我们选取具有共同样本区间(1996年10月至2017年1月)的全球股票指数、CPI、PPI和CRB现货价格指数的同比序列数据。并采用与前文是实证类似的标准化、去趋势项等数据预处理操作。采用MUSIC算法检测共同周期的能量分布,实证结果如下:

 华泰金工周期系列研究:金融经济系统周期的确定(下)

全球四类指标共28个序列的MUSIC算法检测中,我们可以观察到三个显著的峰值为:41.03、92.24和206.9,与三周期理论假设值相比偏离仅为-2.31%、-7.76%和3.45%。

全球市场的统一周期特点同样可以在其傅里叶变换图中得到体现,如图表43可见,三周期附近各指标的能量的尖峰分布明显。

 华泰金工周期系列研究:金融经济系统周期的确定(下)

自此,我们通过实证检验证明了,全球重要经济金融市场存在42个月、100个月和200个月的三个系统级别的周期,这一系统级别的周期运动,对主要的经济金融数据产生明显的影响,并使其具有周期特点。或者说,各种类型的经济指标只是系统周期在不同维度下的表现,使得我们在不同的经济指标中可以观察到相似的周期现象。

  MUSIC方法寻找“类信号”共同周期有效性分析

MUSIC算法原本系使用在物理信号的研究上,本文基于其计算原理将之应用到经济金融领域寻找市场的共同周期。虽然我们可以将经济系统周期与各种数据指标的关系,理解为“信号源”与“传感器”的关系,然而事实上他们还是存在着不可忽视的差异性(本文将具有类似物理信号研究中对应关系的两者称为“类信号”和“类传感器”,如经济系统周期为“类信号”,受到市场周期影响的各种经济金融数据为“类传感器”)。

前文“MUSIC算法的经济金融数据实证适用性分析”从理论层面探讨了算法应用的可行性。以下,我们采用MUSIC算法寻找“类信号”共同周期的实证检验,企图进一步证明这一算法在经济金融市场周期规律研究中的有效性。

MUSIC算法实证检测自然世界里“类信号”的共同周期有效

MUSIC算法检测单种“类信号”的共同周期有效

本节我们将地球绕着太阳公转造成的一年四季的日照变化,理解为地球上自然百态、万物生长等变化的“信号源”,选取北京、开普敦、墨尔本、巴黎、香港、夏威夷六个位于不同纬度、不同经度的城市的日平均气温、日平均风速和日最高持续风力作为“传感器”。采用MUSIC算法分析这些自然现象背后的周期运行规律,并与我们的一般科学常识作比较。这一实证研究的意义在于,相比经济系统周期研究,实证结果具有可验证性。

 华泰金工周期系列研究:金融经济系统周期的确定(下)

 华泰金工周期系列研究:金融经济系统周期的确定(下)

 华泰金工周期系列研究:金融经济系统周期的确定(下)

 华泰金工周期系列研究:金融经济系统周期的确定(下)

 华泰金工周期系列研究:金融经济系统周期的确定(下)

 华泰金工周期系列研究:金融经济系统周期的确定(下)

 华泰金工周期系列研究:金融经济系统周期的确定(下)

从MUSIC实证结果我们可以得到六个位于不同纬度、不同经度的城市的日平均气温、日平均风速和日最高持续风力的能量强度最大的的公共周期,分别为:369天、370天和358天,与地球公转周期365天分别相差4天、5天和7天,偏离度为:1.10%、1.37、-1.92%。

地球的绕日公转是影响自然世界变化最大的周期。显而易见,它对一个地区气温的影响最为直接。“气温”作为地球公转“信号”的传感器,记录的“信号”清晰度较高。而其他影响因素中,比如海拔等都非“变量”,并不构成气温变化的“信号”。从图表47可见,六个城市日平均温度公共周期信号的噪声较少,且365天公转周期附近的信号能量强度十分明显。相比之下,日平均风速和日最高持续风力作为“传感器”的实证结果误差稍大,且噪声项更密集。

以风速和风力为“传感器”的周期测度结果不及气温,这是容易理解的:风速和风力受到地球公转影响没有气温那么直接,“信号”清晰度较低。本文经济系统周期研究所选择的变量--股票指数可以类比本节研究中的气温:股票市场拥有最为广泛的参与者,属于流动性较高的资产,价值发现效率高,受到经济系统信号影响反馈速度也最快最直接。而CPI、PPI、宏观经济景气指数等其他指标可以类比本节的风速、风力等,相比股票指数,这些指标对系统信号的反应稍慢,较不直接,且常常受到政府政策影响较为明显,作为系统周期研究的替代变量,可能包含更多的噪音。

以上三项实证结果符合科学常识,证明了MUSIC算法在检验“类信号”共同周期的有效性。这一研究还启发我们:一、研究变量的选择对实证结果影响明显:采用从逻辑上受到系统周期影响最直接,噪声干扰最少的“传感器”记录的数据能够实现对系统周期最为精准的测度;二、受到系统周期影响的“传感器”,即使不是最直接的,甚至还受到噪声干扰,MUSIC算法依然能够在一定的误差范围内实现对共同周期的有效测度。

MUSIC算法检测多种“类信号”的共同周期有效

参考前文“MUSIC算法检测全球重要市场金融资产与经济数据共同周期”一节的研究思路,将共同受到地球公转影响的气温、风速、风力统一进行实证检验,这种做法可以滤除某些指标的噪声项,同时利于发现更加普遍的周期规律。

由于三种类型指标的变化波动幅度存在差异,我们参考前文,利用最大值、最小值对原始数据进行标准化处理。标准化处理之后的时间序列如下图表所示。

 华泰金工周期系列研究:金融经济系统周期的确定(下)

以下图表是MUSIC算法结果,这次我们得到的共同周期峰值为369.2天,与气温数据的实证结果类似,滤除了在风速和风力检验中出现的噪声项。本节实证我们设置的信号源数皆为1,最大特征值与特征值综合值的比为:68.73%,说明最显著的周期信号能够解释时间序列数据里的大部分信息。

 华泰金工周期系列研究:金融经济系统周期的确定(下)

本节通过MUSIC算法得到的不同城市日平均气温、日平均风速和日最高持续风力的共同周期符合我们的科学常识判断,即温度、风速、风力等自然变量的变化周期与地球绕太阳转动的周期性运动密切相关。计算结果合理,说明通过MUSIC算法得到的周期是有意义的。

综上,MUSIC算法在测度“类信号”共同周期的研究上具有有效性。我们可以将逻辑上具有周期性影响关系的两种事物认定为“信号源”与“传感器”的关系,并对“传感器”记录的数据采用MUSIC算法检验“信号源”的周期规律。结合前文“MUSIC算法的经济金融数据实证适用性分析”一节的研究,我们认为采用MUSIC算法研究经济金融市场周期规律无论从理论层面还是实证层面都具有可行性与有效性。

MUSIC算法对样本长度及序列平稳性要求的仿真实验检验

上一节,我们利用MUSIC算法检验了自然世界里“类信号”信源的周期特点,实证结果具有意义,证明了算法的有效性。为了进一步挖掘MUSIC算法对研究数据的要求,以及数据内涵信号的不同构成特点对实证结果的影响,以下我们设计了一系列的仿真序列进行实验检验。

仿真序列的构建与MUSIC算法的有效性检验

基于保罗·萨缪尔森在1965年提出的股票价格几何布朗运动模型,同时考虑股价的周期运动,在模型随机项和趋势项之后加上一个周期项,可以得到本文模型的仿真资产价格序列:

 仿真资产价格序列

本文研究使用的是同比序列,股价序列经过同比处理之后,趋势项将不复存在。故此,我们在实际操作中,采用一系列初始相位不同且振幅不同的周期信号,叠加一个白噪声信号来模拟资产价格同比序列。根据前文的研究假定,我们选择的三个周期项为:42、100、200。以下列举一个序列的构建方法,其他三个序列方法类似

 序列

其中ε为服从标准正态分布的高斯白噪声。

具体实验步骤如下:首先,利用上述方法模拟资产价格同比序列,序列长度为200;其次,应用MUSIC算法对模拟序列进行检测,得到序列的共同周期能量分布图与能量的尖峰数值。最后,重复进行100次类似试验,根据多次实验的结果,分析MUSIC算法的有效性。

以下为某次实验的结果示例:

 华泰金工周期系列研究:金融经济系统周期的确定(下)

 华泰金工周期系列研究:金融经济系统周期的确定(下)

MUSIC算法测算的该次仿真实验的三个共同周期为:42.33、110.20和204.80,与预设的周期偏差为:0.786%、10.2%、2.4%,得到主要特征值占所有特征值之和的比例为93.09%。测算结果表明,MUSIC算法能够捕捉到序列中的周期信号,且该信号具有对同比序列较高的解释力,谱峰数值与预设周期偏差也足够小,单次实验证明MUSIC算法有效。同时,我们观测到,110.5个月周期之后的噪声明显,这可能与样本序列长度未能达到实验测算要求有关。

以下,我们将模拟实验重复进行100次,并统计三个周期信号的尖峰值分布情况:

 华泰金工周期系列研究:金融经济系统周期的确定(下)

 华泰金工周期系列研究:金融经济系统周期的确定(下)

 华泰金工周期系列研究:金融经济系统周期的确定(下)

由上述结果可见,MUSIC算法可以使我们较为精确地估计同比时间序列的主要周期构成,且在既定的样本长度下,越短的周期估算越精确。42个月的短周期,最大误差仅为1.6%,而且估计的峰值分布集中。100个月周期的测算误差不超过8%,在可接受的范围内。200个月周期的测算结果与预设值最大偏差达到22%,且测算值分布较为分散。

显而易见的,在样本数量有限的测算中,越长的周期测算的精确度越低,我们可以初步的判断,样本长度应当长于拟测算序列的周期长度,否则可能出现较大误差。以下模拟实验我们通过增加样本长度,来观测MUSIC算法对样本长度的要求。

增加样本数提升周期估计准确度的效果明显

我们把仿真序列长度由200增加到400,达到最长周期的两倍,考察样本长度对于实验结果的影响。以下是某次仿真实验及其共同周期的测算结果。

 华泰金工周期系列研究:金融经济系统周期的确定(下)

 华泰金工周期系列研究:金融经济系统周期的确定(下)

由上图表可见,样本数量的增加,MUSIC算法测算得到的周期能量分布的波峰和波谷越加明显,即序列中的信号与噪声得到有效的分离。三个峰值分别为:41.97、98.85、202.70,共同周期的测算准确度明显提高,主要特征值占所有特征值之和的比例高达98.22%。

类似的,以下我们将样本长度为400的模拟实验重复进行100次,并统计三个周期信号的尖峰值分布情况:

 华泰金工周期系列研究:金融经济系统周期的确定(下)

 华泰金工周期系列研究:金融经济系统周期的确定(下)

 华泰金工周期系列研究:金融经济系统周期的确定(下)

增加样本长度后,我们可以清楚的看到,实验结果的精确度有了显著的提高。42个月短周期的MUSIC测量最大误差不到0.1个月(偏离度0.24%),而且分布集中,100个月的周期测量误差不超过2个月(偏离度2.00%),200个月的长周期测量误差不超过8个月(4.00%)。相比较200个数据样本的实验而言,共同周期的估计准确度有了显著的提高,三周期的测算准确度都达到了可接受的范围之内(偏离度绝对值5%)。以上仿真实验提示我们在研究时应当尽可能提高样本长度,才可以确保研究结果的可靠性。

高阶趋势项影响长周期的测量准确度

以上的仿真实验,我们都假设资产价格服从周期几何布朗运动,其同比序列仅包含周期项与噪音项。然而,某些经济金融数据可能存在不满足我们假设的情况,比如侠义货币供应量M1和广义货币供应量M2的同比序列依然存在趋势项。这种情况的出现主要原因是:其原始序列存在高阶的趋势项(如下图表64)。而这个高阶趋势项产生的原因可能是由于:随着社会财富创造的不断积累,货币供应量本身就需要一个与财富创造相匹配的基本增速,而为了达到适度通胀以及其他政策目的,一国常常会在合理的货币供应量增速基础上进一步增发,形成高阶趋势项。

如下图表可见,美国M1加速度增长的现象明显。以下,我们首先采用模拟实验的方式考察高阶趋势项的不利影响;然后,提出在遇到具有高阶趋势项的经济金融序列时的实证解决方案。

 华泰金工周期系列研究:金融经济系统周期的确定(下)

 华泰金工周期系列研究:金融经济系统周期的确定(下)

以下列举一个序列的构建方法,其他序列方法类似 :

 华泰金工周期系列研究:金融经济系统周期的确定(下)

如下图表66,是我们模拟的带有趋势项的周期序列,样本长度200。

 华泰金工周期系列研究:金融经济系统周期的确定(下)

 华泰金工周期系列研究:金融经济系统周期的确定(下)

从图表66的序列形态初步判断,我们模拟的带有趋势的周期序列与图表64实际的美国M1同比序列走势图相似度较高,预期实验处理方案对实际问题的处理将具有指导作用。

在此次实验中,MUSIC算法测度的三个共同周期峰值分别为:42.24、98.75、278.42,

除了200个月周期偏离度(39.21%)较大之外,其他两个周期的测度与预设值接近。主要特征值占所有特征值之和的比例为96.69%,可见周期信号仍然具有较高的解释力,问题主要出现在长周期的估算上。

类似的,以下我们将样本长度为200的模拟实验重复进行100次,并统计三个周期信号的尖峰值分布情况:

 华泰金工周期系列研究:金融经济系统周期的确定(下)

 华泰金工周期系列研究:金融经济系统周期的确定(下)

 华泰金工周期系列研究:金融经济系统周期的确定(下)

由上述结果,并与“仿真序列的构建与MUSIC算法的有效性检验”一节对比,我们可以得出以下结论:趋势项对42个月短周期的估计影响较小,造成100个月周期的估计误差明显增大(最大偏离度达±20%),影响最大的是200个月周期的估计,最大偏离度超过40%,在100次试验中未有一次准确估计,且皆为高估。本次实验提示我们,当一个序列中包含高阶趋势项时,MUSIC算法对长周期的估计误差较大,与样本长度接近的周期常常存在高估的可能,且误差十分明显。可见对带有趋势项的同比序列进行去除趋势的数据处理十分必要。

增加样本数能够提升含趋势项周期信号估计准确度

上一节的研究提示我们对数据进行祛除趋势处理的重要性,“增加样本数提升周期估计准确度的效果明显”一节则提示我们应当尽可能的增加待测样本长度。

本节我们不祛除趋势项,仅将样本数从200增加到400,以便更好的模拟遇到实际问题时MUSIC算法的处理结果。以下是样本数增加后的某次实验估计结果:

 华泰金工周期系列研究:金融经济系统周期的确定(下)

 华泰金工周期系列研究:金融经济系统周期的确定(下)

由图表72可见,三个尖峰值:41.93、102、197.4与实验的预设值十分接近,三周期可以得到较为精准的测度。表明足够的样本数,即使待测序列包含不符合模型假定的趋势项,依然能够实现对周期信号的准确估计。

将周期能量分布图扩大展示区域,如图表73,我们意外的发现另一个能量强度更大的峰值:603.02,该值大于样本长度,很显然它的出现是由序列中的趋势项造成的。

 华泰金工周期系列研究:金融经济系统周期的确定(下)

最大特征值/所有特征值之和为88.46%,这是趋势项的信号能量占比,明显削弱了三周期信号对序列的解释力。表明当待测序列存在趋势项时,MUSIC依然能够较为准确的测算真实信号的周期,趋势项造成的干扰会使得共同周期能量分布图出现一个最大的尖峰,这一尖峰并无实际含义,这是我们需要注意的由趋势项造成的估计问题。

类似的,以下我们将模拟实验重复进行100次,并统计三个周期信号的尖峰值分布情况:

 华泰金工周期系列研究:金融经济系统周期的确定(下)

 华泰金工周期系列研究:金融经济系统周期的确定(下)

 华泰金工周期系列研究:金融经济系统周期的确定(下)

由上述结果,并与前三节的模拟实验结果对比,我们可以得出以下结论:1、即使待测序列中存在趋势项,只要样本数足够,依然能够实现对周期信号较为准确的估计—42个月周期的误差不超过0.49%;100个月周期的误差不超过4.26%;200个月周期的误差不超过5.81%。2、趋势项造成的噪声干扰产生一个能量强度较大的无周期意义的尖峰,削弱有意义的周期信号对序列的解释力。

总结本节的发现:MUISC算法应用时应当首先对待测序列是否包含趋势项进行检测,提升样本长度对于提高对信号周期的测度效果明显。

  【结论】经本文的理论分析与实证、实验检验证明,多重信号分类(MUSIC)算法是一种分析经济金融周期信号十分有效的研究方法。利用MUSIC算法能够有效滤除经济金融序列中的噪声,以及分离序列相位差异的特点。对在傅里叶变换频谱分析中发现具有类似周期能量强度分布的全球重要市场金融资产与经济指标同比序列,进行理论分析,提出系统中存在共同周期的假设,并通过实证证明:全球重要市场股票指数、CPI、PPI指数、CRB大宗商品指数存在42个月、100个月和200个月左右的三个周期信号,全球重要市场债券指数因时间较短仅检测出两个周期信号。数据中存在的三大周期信号是由市场中存在的统一的系统级别的周期运动造成的。

三大周期对各种类型经济金融序列波动的解释效果出众,三大周期合成的周期序列与原始同比回归的可决系数通常能达到50%以上,样本内表现优秀,表明三大周期在金融资产价格、经济数据运动变化中的支配作用。样本外则可通过周期序列良好的外推延展性,进行短期的市场预测。

本篇报告是华泰“市场周期系列”研究的进一步深化与系统化,更是“华泰量化投资时钟”的奠基性报告。我们挖掘的周期三因子乃至未来可能的周期多因子,区别于传统均线价量指标分析和宏观指标观测,将为市场择时方法提供系统性的新框架与新思路,对投资者选择市场进入时机、资产配置、行业轮动、风险管理等,提供全新的判别标准,具有重要的参考价值。

【华泰金工林晓明团队】

华泰金工周期系列研究:金融经济系统周期的确定(上)/(下)