量化投资的分类、基本流程、优势与不足
昨日,前海宜涛资产总经理肖冰在朋友圈转发了一篇文章《量化投资的缺陷》,因而想整理下自己对量化投资的看法。
一、什么是量化投资
笔者对量化投资的了解最早来自10年前,曾任上财金融学院院长的黄明教授创立了量化私募北京睿策投资管理有限公司,结合行为金融学在国内做量化投资。
行为金融学可以用来做量化投资,但量化投资并不等于行为金融学。马克维茨的投资组合理论,夏普的资本资产定价模型等相关投资理论上的重大突破,为量化投资的发展奠定了理论基础。计算机的出现和发展为量化投资提供了技术保障,二者结合推动了量化投资的诞生。1978年富国银行设立第一只量化公募基金。笔者在博士学习期间,也用SARS做过三因子模型、动量与反转策略模型等。量化投资的理论基石是:市场不是完全有效的。也就是说,投资者可以利用公开可得的各种信息获得超额收益。
2021年4月公布的《2021福布斯全球亿万富豪榜》中,沃伦巴菲特以960亿美元名列第6位,詹姆斯西蒙斯以246亿美元财富位列68名,雷伊达里奥以203亿美元财富位列88名,史蒂夫科恩和肯格里芬均以160亿美元财富位列119名,大卫泰珀以145亿美元财富位列142名,乔治索罗斯以86亿美元财富位列第288名。其中,詹姆斯西蒙斯、雷伊达里奥、肯格里芬均为量化投资的代表人物。量化投资是一种投资方法论,即将人的投资思想规则化、变量化、模型化,形成一整套完整、可量化的操作思路,这套操作思路可以用历史数据加以分析验证,在交易的执行阶段可以选择使用计算机自动执行。但量化投资不是唯一可以获得成功的方法论。除此之外,还有巴菲特基于公司价值的个股投资方法,史蒂夫科恩的短线交易,大卫泰珀的抄底不良资产,索罗斯基于反身性哲学理念的宏观投资方法。
量化投资不等于高频交易。投资分为研究和交易两个相互联系的环节。其中。研究是科学,投资交易是反人性的艺术。在投资中,量化既可以用于研究,也可以用于交易。量化投资包含程序化交易,但并不等同于程序化交易。在量化投资的应用上,有宏观择时、中观选择行业、微观择股和高频交易。量化投资可以是高频的,也可以是低频的,取决于具体的量化策略。从自动化程度来看,高频交易公司存在着半自动化交易和全自动化交易两种,而量化投资则是全自动化。
量化投资不等于对冲基金。量化投资可以采取风险对冲措施,也可以不采取市场中性策略。
量化投资不等于数据挖掘。量化投资分两类,一种是把投资人的思想、直觉、理念、理论、经验等融入到模型中,用模型来决定交易决策的投资行为,有理论逻辑支撑,重在因果性。一种是通过机器学习寻找股价与各种信息之间的统计经验,即数据挖掘,重在相关性。
量化投资的特征决定了公司创始人大都是那些有着极强专业背景的人,例如,文艺复兴科技的创始人西蒙斯,他有着极强的数学专业背景,再比如AQR的创始人Cliff Asness是金融学家出身。国内量化私募创始人也基本是专业出身。
二、五类主要的量化策略
1、多因子选股模型
在金融学理论中有多因子模型,是单因子模型的拓展。基本原理是采用一系列的因子(股价技术指标和公司基本面数据)选择预期收益率高的股票。多因子模型是所有量化模型中市场容量最大的模型,因为理论上来其市场容量与主动选股是一致的,最大可达百亿以上。多因子模型也可以包括宏观因子和行业因子。
2、事件驱动模型
在金融学计量中有事件研究方法,即对某项经济事件对资产价格造成影响的程度和持续时间进行度量以及检验。1933年,Dolly就运用事件研究法考察了股票分割的股价效应。第一步是找到驱动事件,譬如限售股解禁、公布财务报告、定向增发、大股东高管增持、高送转、股票回购、股权激励、并购重组、节假日效应等,确定事件窗口期。第二步是数据准备:合并事件数据与股票数据,找到驱动因子和股票超额收益之间的关系。
3、基于量化预测的宏观投资
基于量化预测的宏观投资就是运用量化的方法研究全球与中国金融市场运行规律,并用于投资。在《价值股反弹还是市场风格切换》中,笔者曾提出,投资可以分为三个层次:第一个层次是大类资产配置与仓位控制,第二个层次是板块选择,第三个层次是个股选择。桥水基金的达里奥就是通过建立复杂的数学模型,来计算政治冲突发展及其对市场的影响建立,预测经济的衰退,根据各国经济和金融运行情况做出大类资产配置的投资决策。
4、基于行为金融的量化投资
行为金融学理论框架有两大支柱,第一,套利具有局限性,套利者改变不了错误价格。第二,投资者具有心理偏差。投资者的心理偏差主要分为两部分,一个是认知错误,也叫预测中的错误;一个叫决策错误,也叫风险偏好中的错误。在《从刘邦品评汉初三杰看领导者的两大关键素质:战略能力与赋能能力》中,战略能力可以分为洞察力与决断力,洞察力即对应认知能力,决断力对应决策能力。因此,错误定价不会马上回归,甚至是会不断放大。譬如,恐慌后股价可能大幅下跌,在熔断机制或涨跌停限制下连跌几天。但是,股价不会一直错下去,股价偏离越大,安全边际越高,套利风险越小,这个时候套利资金就会进去促使股价回归。而量化投资根据行为金融学的原理,利用相关量化指标可以确定投资策略,并据此获利。
5、高频交易
高频交易的主要目的是通过市场短暂的价格波动获利,特点就在于“高频”。高频交易每次从开仓到平仓只有很短的时间间隔,以前按分钟线来决策交易就叫高频,现在由于计算机高频的应用,可以达到微秒级别了。因此对处理信息的速度要求极高,但这样无法分析大量信息,所以高频交易的模型趋于简单,主要依靠代码的运行效率。也因为高频,缺乏金融学理论基础,要么是技术分析法的高频应用,要么使用机器学习方法确定交易策略。
三、量化投资的基本流程
1、传统量化(类似于经济研究中的实证分析)
(1)策略开发,类似研究中的形成假设,譬如因子模型。
(2)数据处理。收集到数据之后,对异常值,缺失值等不符要求的数据进行处理
(3)回测,类似研究重的稳健性检验。利用历史数据对这个策略的盈利能力进行验证,判断其是否可行,是否是优质的策略。观察策略的稳定性,同时检验交易系统的可行性、代码是否有误、数据有没有问题等。频率越高,持仓越短,逻辑越复杂的策略,回测收益可参考性就越低。
(4)实盘交易与策略进化。策略开发完成后并不是万事大吉可以撒手不管了,市场中往往会出现一些程序无法理解,或者说策略没有考虑到的细节。这时候就需要人为的干预、修正和调整。策略也需要持续创新,不断的领先市场,才能持续的享受市场给你的获得利润。
2、机器学习
机器学习能够提供非线性关系的模糊处理,弥补了人脑思维模式,同时利用相关算法,可以大幅提高数据挖掘、处理效率。主要流传为:
(1)数据处理。包括缺失数据处理、类别数据处理,将数据集随机划分为训练数据集和测试数据集,
(2)选择模型。如监督学习、非监督学习,强化学习、遗传算法、类比学习、回归学习、分析学习、联接学习等。
(3)模型评估与参数优化。若模型的训练准确率和验证准确率之间有很大的差距,说明模型过拟合,是一个高方差模型;若模型的训练准确率和验证准确率都很低,说明模型欠拟合,是一个高偏差模型。
(4)模型验证。用测试数据集判断模型的优劣。
(5)实盘交易与模型进化。
四、量化投资的优势
1、避免人性弱点。量化交易可以避免情绪化操作。交易中的最大弱点是人性的贪婪和恐惧,若想交易成功,就要克制住贪婪和恐惧的本能。投资者经常会在有了些许浮盈后,害怕以后利润回吐,于是获利了结。但结果是,中途“下车”,严重踏空。等到下一次,鉴于上次踏空教训,没有止盈,想赚更多,但之后行情反转,不但利润全部回吐不说,本金也亏了。由于严格执行纪律化的电脑操作,量化交易则可以避免人性的弱点。
2、标的覆盖范围大。个人受限于时间和精力,关注的股票数量受到限制。量化投资可以覆盖远多于人脑的股票数量,根据各种因子进行批量筛选,从中选择几十个或者几百个来投资。并批量建仓,从而限制单一标的的仓位规模,分散风险,控制回撤。
五、量化投资的不足
1、模型错误风险。资产定价理论是量化投资的基础之一,倘若定价模型有缺陷,就会导致量化策略失败。尤其是小概率事件对资产价格的影响很容易错估。如果量化模型不适合市场环境,量化基金不仅容易增加交易费用,而且容易增加亏损的概率。全球知名的LTCM基金从基本面出发获取方向性判断,然后根据价差的历史数据进行简单的正态分布建模,并用来测算资金管理,卖出高估的债券,买入低估的债券。LTCM采用简单频率统计的方式假设其符合正态分布,其结果导致严重低估了价差朝持仓反方向运行的概率。1997—1998年各种国际突发事件恰好验证了金融资产价格走势的“肥尾”特征,即正态分布假设下的“小概率”事件也具有很大的现实概率。由于定价理论有缺陷,且在进行相对价值投资时对价差走势假设过于自信,缺乏必要的风控和止损设定,过度使用了杠杆,导致拥有诺贝尔经济学奖获得者罗伯特默顿(Robert Merton)和迈伦斯科尔斯的LTCM破产清算。
2、系统故障风险。对于量化投资而言,最重要的就是风险控制,如果风险控制不严,出现系统故障,瞬间产生无限循环程序交易将会带来不可估量的损失。2013年8月16日11时05分08秒至5分10秒,短短两秒内,由于光大证券量化投资系统中的订单生成系统发生故障,瞬间产生了26082笔预期外的市价委托订单,同时订单执行系统亦出现问题,导致这些订单被直接送至交易所。随后的11时07分,光大证券交易员发现问题并接到交易所问询电话,终止了系统运行并进行批量撤单。但短短三分钟内,仍然产生了72.7亿元的巨量交易。除此之外,在量化投资中,交易软件也存在系统故障风险。
3、数据质量风险。量化投资以数据为基础,尤其是AI/ML对数据的质量要求很高,学习效果跟数据质量有很大关系,我国 A 股市场发展的时间还不长,数据量不够充足,噪声也比较多,使得学习效果的稳定性不能充分得到保证。
4、量化策略市场容量限制策略有效性。以CTA(商品交易顾问策略)为例,几乎每个CTA策略的市场容量都是有限的。如果各个量化基金的交易标的和策略类似,往往会引发策略共振的负作用。2014年11月,在沪港通政策出台和加息的背景下,存在高度同质化却有隐藏着“错位对冲”的阿尔法策略受到了致命打击。量化策略的市场容量也限制了量化基金的规模。
5、未知事件。量化策略是基于历史会重复发生这一原理,倘若有新事件发生,量化策略就无法应对。
6、量化投资无法像定性研究那样发现伟大的公司。导致一些优质标的的买入时机不好,或者仓位太小。
7、在量化策略的使用过程中,可能存在过度拟合问题。即通过不断增加或优化参数,寻找回撤很小,甚至几乎没有回撤的策略。其结果就是符合条件的标的很少、交易次数很低,没有应用价值。