3.关于BackTesting中一些细节的思考-基于Matlab的量化投资

Discussion in 'Julia / MATLAB / SAS' started by faruto, Jul 30, 2012.

  1. http://blog.sina.com.cn/s/blog_4cf8aad30102e5g5.html

    <从一个例子说起-基于Matlab的量化投资>这篇文章中,我介绍了FRB策略在IF、CU、AL上使用经验固定参数的测试结果,我们看到FRB策略在IF、CU、AL上都是正收益的一个系统,但是资金曲线并不完美有好有怀,直观感觉FRB对于固定品种调整适当参数后其效果会变好,更多关于参数寻优调整和策略通用性的讨论放在后面文章进行,这里先来讨论一些关于回测(BackTesting)中的一些细节问题。

    回测的目的:尽可能的真实地还原实际交易过程!以期检测策略的表现。

    首先需要明确回测的目的是什么,这样做回测才有意义。回测的目的就是真实地还原实际的交易过程,来检查相关策略在历史行情的表现,下面关于回测中的一些细节问题讨论,我会时刻围绕这个目的来进行讨论,因为只有明确这个目的,讨论才有意义。

    回测标的的选取

    由于期货是有交割的,所以相应的品种的数据并不连续,这就涉及到一个问题,我们进行回测时选取什么回测标的?可以有N种定义方法将相关的期货合约品种连接起来,但那种是在某种意义上最合理的呢?回想回测的目的(尽可能的真实地还原实际交易过程!),实际交易中的你我是怎么进行的?

    我想对于单边趋势类策略大家肯定会在相关品种的主力合约上进行交易,对于其他类型策略(震荡类、对冲类)可能大家会有其他选择,这里单就单边趋势类策略而言。

    这里有个问题,“主力合约”怎么定义?可以定义 成交量*持仓量最大的为主力合约或者其他你认为合理的定义,目的是找出你心中的“主力合约”(活跃合约)。

    有了主力合约的定义,那么回到回测标的的选取就有了答案,那就用 主力连续合约 进行回测即可,这样就能真实的反应实际交易过程,主力连续合约的构造按照主力合约的定义给出即可:

    假设有A、B、C、D四个同一品种不同月份的期货合约,现把这几个不同月份的合约进行连接,设T为时间轴,在Ti天计算成交量*持仓量,该值为最大的合约为主力合约,但该换月过程“不可逆”,即若某一合约K(属于A、B、C、D中一个)在Tk天之前做过主力合约,在Tk天主力进行了换月,在Tk天之后的某一天又为K合约的成交量*持仓量为最大值,此时忽略K。

    可能有人采取使用某一品种的所有合约的加权平均的指数作为回测标的,或者采用在指数上发现信号,在主力合约上下单子进行回测,按照“尽可能的真实地还原实际交易过程”这个回测目的而言,我个人不认为这种选取加权指数或者其他方式为回测标的是好的方式,当然你可以认为这是一种信号再处理的方式,可以保留意见。

    冲击成本的估计

    冲击成本是回测中的未知量,其大小理论上和市场的深度和广度相关,最有说服力的估计方式就是你有多年的实盘账单,进而可以估计出某一品种的实际冲击成本的大小,但往往在做回测的您还拿不出“多年的实盘账单”,只能进行大致估计,一般而言,流动性好的品种,使用1-2slip作为冲击成本的估计应该足够了,流动性不好的需要更大的冲击成本,比如股指的远月合约,其冲击成本有时候可能会大到5-7个BP。

    PS:冲击成本也并不一定对你的策略是不利的,这点要见仁见智的看,依据不同的交易思路和策略,有时候冲击成本会对你有利。往往有时候可以巧妙的利用这一点来为我所用。

    手续费的设置
    手续费一般是固定的成本,为了严格一些可以将手续费设的大一些,比如设成交易所手续费的1.5-3倍,当然也没有必要将手续费设置的过大,因为所有的手续费在手续费趋向于无穷大的时候都会废掉,如果你手续费设置的过大,会湮没你策略本身的某些细节,只要手续费设置的稍微大一点,表明你的策略能抗衡手续费就行了,更多关于策略对于手续费的敏感性,可以单独做敏感性压力测试。

    入场离场位置的设置
    我采用的方式是,设Bar(k)为当前Tick的Bar,检查前一个Bar的收盘价Bar(k-1).Close(或者使用前一个Bar的其他价格)若发现入场信号,则用当前Bar的开盘价Bar(k).Open加入冲击成本作为回测的入场价,离场方式的确定类似。

    这样做的目的是为了“尽可能的真实地还原实际交易过程”,可能有人采用若在当前Bar的收盘价(或使用当前Bar的其他价格信息)上发现入场信号,则用当前Bar的收盘价加入冲击成本作为回测的入场价,你可以做做测试,上面两种入场离场方式的选取是有一定差异的,在合约连续性足够好的情况下,前一个Bar的收盘价可以无限逼近当前Bar的开盘价,进而两种方式可以近似等同,但现实情况往往不是这样,按照“尽可能的真实地还原实际交易过程”这个回测目的,我个人认为前者的方式更佳。

    交易系统的评价
    关于交易系统(策略)的好坏评价,这一部分后面会有专门文章进行讨论,这里先说几句,如何能更加全面的评价一个交易系统是一个很复杂的问题,这并不是用几个简单的指标(年化收益率、夏普比率等等)就能很好描述的,而且当下大家熟悉的指标都不是稳健的指标,并不能很好的描述这个交易系统的某个侧面,在后面我和大家讨论一些稳健的统计指标以及其他一些方面来综合描述一个交易系统,更多关于“稳健”的定义,请参看稳健统计学(Robust Statistics)的相关东西,这里不做深入的讲解。
    当然最NB的检验一个交易系统的方式,就是“实战”!其他方法仅仅能从方法论上给自己一个安慰,告诉上天我是在认认真真地最回测,做检验,阿弥陀佛!
     
  2. “所有的手续费在手续费趋向于无穷大的时候都会废掉”
    应该是“所有的策略”?