请问下列情况是否算过渡优化

yizhe2000 · Oct 15, 2013

1、在回测过程，使用了2个技术指标，比如MACD跟RSI，发现2个信号同时出现的时候，能有比较好的入市信号，这种类似的指标叠加或互相确认，是否算过渡优化，或者说有什么缺点我没考虑到？

2、发现在某些指标信号发出来后，不是以第二天的开盘价格作为买入价格测试，而是以某一价格作为买入价格测试，这个价格是根据前几天的价格做调整的，暂时把这个价格叫做X，而把第二天最低的价格叫L，我是根据所有X>L的股票作为测试内容，而X<L的股票就认为是无法买入，做放弃处理。这样是否存在漏洞？

3、对市场的波动性进行量化，然后根据统计数据（波动小于0.2就很差），比如入市信号必须波动大于0.2等作为筛选，这种算过渡优化吗？

请各位前辈多指教。

laot · Oct 16, 2013

2错了

rypan · Oct 17, 2013

1很正常，只要交易次数够，整个参数组表现良好。我个人不会使用多于三个参数的系统。
3很正常，类似adx过滤

wj2000 · Oct 17, 2013

“过渡优化”一般还是偏向指“过度拟合”， “过度拟合”就是说在拟合后不满意然后根据测试数据做“优化”以达到通过调节参数等设置来极力“拟合”测试数据。

lz说的3种情况是都不归属于通常说的“过度优化”的。

cassor · Oct 17, 2013

过度优化有两种，过度曲线套入，和过度参数优化。
过度曲线套入的做法是，根据样本内的走势，不断增加各种规则，
最后设计出一个高自由度的复杂规则体系。

所以，你现在在做得的工作属于曲线套入，但是算不算过度，这个不好说。
最简单的判断方法，用样本外数据跑一下，换周期，换品种。

yizhe2000 · Oct 17, 2013

laot said: ↑

2错了
Click to expand...

其实，我当初是这么考虑的，回测的过程，是假设了我的买卖不好对市场造成任何影响，包括市场的最高，最低价格，只要我不用到未来的数据，虽然我不知道这样是否算是用了未来数据了，因为我是用一定的价格假设去买，然后根据当日的最低价格，假设我能买到。

我后来剔除了这个条件再测试，基本不太影响回测结果。不过作为研究讨论，希望大家能再指导下，这种情况是否算是用了未来数据？

yizhe2000 · Oct 17, 2013

其实，我这次不太敢相信自己的回测，在这里问这么多，是因为测试结果很不可思议，一般来说趋势性系统的特点是成功率低于50%，但赔率高，但我这次测试到的结果是，成功率到了70%，不过赔率有1.8，而且平均每月能有20左右的信号量。

cassor 说得很对，用其他数据测试就比较好说话，我稍后会用随机数据做测试。不过很多指标数据是现成的，所以用随机数据，就是说要重新写过，又是一个工作啊。。。。

cassor · Oct 18, 2013

话说看到你这结果，觉得你没必要做外测了，差不多就是定性过拟了。
机器要能做到这样，那太不把EMH当回事了。

yizhe2000 said: ↑

其实，我这次不太敢相信自己的回测，在这里问这么多，是因为测试结果很不可思议，一般来说趋势性系统的特点是成功率低于50%，但赔率高，但我这次测试到的结果是，成功率到了70%，不过赔率有1.8，而且平均每月能有20左右的信号量。

cassor 说得很对，用其他数据测试就比较好说话，我稍后会用随机数据做测试。不过很多指标数据是现成的，所以用随机数据，就是说要重新写过，又是一个工作啊。。。。
Click to expand...

cassor · Oct 18, 2013

另外你说用随机数据测试，这个我一直没搞明白，
如何人工生成具有长尾分布的、郝斯特指数介于0.5-1之间的随机数？请教一下？

rypan · Oct 18, 2013

2应该是可以的，就是挂单呗。

如果你挂的单不大，应该对市场不会有太大的影响

还有，挂单的一般都是均值回复系统吧

yizhe2000 · Oct 20, 2013

cassor said: ↑

另外你说用随机数据测试，这个我一直没搞明白，
如何人工生成具有长尾分布的、郝斯特指数介于0.5-1之间的随机数？请教一下？
Click to expand...

实在不敢说指教，我胡乱说下，还真要你指教啊：
我是这么想的，虽然是随机数据，但其实一定长的时期内，隔日的涨跌幅，是可以形成一个类似正态分布的图像的，不过有点偏态，这个可以通过调整正态分布形成。所以先形成这个有偏态的正态分布数据集合，然后再把这些数字作为每天的涨跌，就可以形成数据了。暂时看生成的数据可以有很长的趋势，也可以有很多的震荡。

知识浅薄，请多赐教，谢谢！

cassor · Oct 21, 2013

这个应该不是任何一种已知分布，不过这不重要。
重要的是，不论怎么调整，你这个情况下每次事件是独立的。
而事实上技术分析的基本假设，之前的数据对之后的数据是有影响的。

形成趋势不能说明问题，纯随机系统也可产生明显的趋势：
http://www.oceantribe.org/vb/showpost.php?p=304179&postcount=49

另一个问题是，在独立事件的条件下，进出场策略是无效的，或者说无论何种进出场策略本质上是等效的，只有资金管理策略能够产生有意义的影响，这就达不到测试策略的目的。

yizhe2000 said: ↑

实在不敢说指教，我胡乱说下，还真要你指教啊：
我是这么想的，虽然是随机数据，但其实一定长的时期内，隔日的涨跌幅，是可以形成一个类似正态分布的图像的，不过有点偏态，这个可以通过调整正态分布形成。所以先形成这个有偏态的正态分布数据集合，然后再把这些数字作为每天的涨跌，就可以形成数据了。暂时看生成的数据可以有很长的趋势，也可以有很多的震荡。

知识浅薄，请多赐教，谢谢！
Click to expand...

asp_win · Oct 21, 2013

yizhe2000 said: ↑

其实，我这次不太敢相信自己的回测，在这里问这么多，是因为测试结果很不可思议，一般来说趋势性系统的特点是成功率低于50%，但赔率高，但我这次测试到的结果是，成功率到了70%，不过赔率有1.8，而且平均每月能有20左右的信号量。

cassor 说得很对，用其他数据测试就比较好说话，我稍后会用随机数据做测试。不过很多指标数据是现成的，所以用随机数据，就是说要重新写过，又是一个工作啊。。。。
Click to expand...

胜率不能在非严格条件下简单说明好与不好，举例：可以用一种方法去让趋势系统都达到超过50%的胜率，其他的就略过不说了...再高的胜率又能如何？

yizhe2000 · Oct 22, 2013

cassor said: ↑

这个应该不是任何一种已知分布，不过这不重要。
重要的是，不论怎么调整，你这个情况下每次事件是独立的。
而事实上技术分析的基本假设，之前的数据对之后的数据是有影响的。

形成趋势不能说明问题，纯随机系统也可产生明显的趋势：
http://www.oceantribe.org/vb/showpost.php?p=304179&postcount=49

另一个问题是，在独立事件的条件下，进出场策略是无效的，或者说无论何种进出场策略本质上是等效的，只有资金管理策略能够产生有意义的影响，这就达不到测试策略的目的。
Click to expand...

已经看了链接，举例跟我说的刚好是其中的一个步骤，如果把这个步骤重复多次，就会形成5,4,3,2,1,0,-1,-2,-3,-4,-5这种形态。另外，你可以尝试用市场信息（我用的是中国的A股数据）试试，取一段比较长的时间，统计隔日波动百分百，统计数量，会发现波动越多的数量越少。

感谢一起讨论，：）