请问下列情况是否算过渡优化

Discussion in 'Model and Algorithm' started by yizhe2000, Oct 15, 2013.

  1. 1、在回测过程,使用了2个技术指标,比如MACD跟RSI,发现2个信号同时出现的时候,能有比较好的入市信号,这种类似的指标叠加或互相确认,是否算过渡优化,或者说有什么缺点我没考虑到?

    2、发现在某些指标信号发出来后,不是以第二天的开盘价格作为买入价格测试,而是以某一价格作为买入价格测试,这个价格是根据前几天的价格做调整的,暂时把这个价格叫做X,而把第二天最低的价格叫L,我是根据所有X>L的股票作为测试内容,而X<L的股票就认为是无法买入,做放弃处理。这样是否存在漏洞?

    3、对市场的波动性进行量化,然后根据统计数据(波动小于0.2就很差),比如入市信号必须波动大于0.2等作为筛选,这种算过渡优化吗?

    请各位前辈多指教。
     
  2. 2错了
     
  3. 1很正常,只要交易次数够,整个参数组表现良好。我个人不会使用多于三个参数的系统。
    3很正常,类似adx过滤
     
  4. “过渡优化”一般还是偏向指“过度拟合”, “过度拟合”就是说在拟合后不满意然后根据测试数据做“优化”以达到通过调节参数等设置来极力“拟合”测试数据。

    lz说的3种情况是都不归属于通常说的“过度优化”的。
     
  5. 过度优化有两种,过度曲线套入,和过度参数优化。
    过度曲线套入的做法是,根据样本内的走势,不断增加各种规则,
    最后设计出一个高自由度的复杂规则体系。

    所以,你现在在做得的工作属于曲线套入,但是算不算过度,这个不好说。
    最简单的判断方法,用样本外数据跑一下,换周期,换品种。
     
  6. 其实,我当初是这么考虑的,回测的过程,是假设了我的买卖不好对市场造成任何影响,包括市场的最高,最低价格,只要我不用到未来的数据,虽然我不知道这样是否算是用了未来数据了,因为我是用一定的价格假设去买,然后根据当日的最低价格,假设我能买到。


    我后来剔除了这个条件再测试,基本不太影响回测结果。不过作为研究讨论,希望大家能再指导下,这种情况是否算是用了未来数据?
     
  7. 其实,我这次不太敢相信自己的回测,在这里问这么多,是因为测试结果很不可思议,一般来说趋势性系统的特点是成功率低于50%,但赔率高,但我这次测试到的结果是,成功率到了70%,不过赔率有1.8,而且平均每月能有20左右的信号量。

    cassor 说得很对,用其他数据测试就比较好说话,我稍后会用随机数据做测试。不过很多指标数据是现成的,所以用随机数据,就是说要重新写过,又是一个工作啊。。。。
     
  8. 话说看到你这结果,觉得你没必要做外测了,差不多就是定性过拟了。
    机器要能做到这样,那太不把EMH当回事了。

     
  9. 另外你说用随机数据测试,这个我一直没搞明白,
    如何人工生成具有长尾分布的、郝斯特指数介于0.5-1之间的随机数?请教一下?
     
  10. 2应该是可以的,就是挂单呗。

    如果你挂的单不大,应该对市场不会有太大的影响

    还有,挂单的一般都是均值回复系统吧
     
  11. 实在不敢说指教,我胡乱说下,还真要你指教啊:
    我是这么想的,虽然是随机数据,但其实一定长的时期内,隔日的涨跌幅,是可以形成一个类似正态分布的图像的,不过有点偏态,这个可以通过调整正态分布形成。所以先形成这个有偏态的正态分布数据集合,然后再把这些数字作为每天的涨跌,就可以形成数据了。暂时看生成的数据可以有很长的趋势,也可以有很多的震荡。

    知识浅薄,请多赐教,谢谢!
     
  12. 这个应该不是任何一种已知分布,不过这不重要。
    重要的是,不论怎么调整,你这个情况下每次事件是独立的。
    而事实上技术分析的基本假设,之前的数据对之后的数据是有影响的。

    形成趋势不能说明问题,纯随机系统也可产生明显的趋势:
    http://www.oceantribe.org/vb/showpost.php?p=304179&postcount=49

    另一个问题是,在独立事件的条件下,进出场策略是无效的,或者说无论何种进出场策略本质上是等效的,只有资金管理策略能够产生有意义的影响,这就达不到测试策略的目的。

     
  13. 胜率不能在非严格条件下简单说明好与不好,举例:可以用一种方法去让趋势系统都达到超过50%的胜率,其他的就略过不说了...再高的胜率又能如何?
     
  14. 已经看了链接,举例跟我说的刚好是其中的一个步骤,如果把这个步骤重复多次,就会形成5,4,3,2,1,0,-1,-2,-3,-4,-5这种形态。另外,你可以尝试用市场信息(我用的是中国的A股数据)试试,取一段比较长的时间,统计隔日波动百分百,统计数量,会发现波动越多的数量越少。

    感谢一起讨论,:)