量化交易与机器学习第六十六篇
上周我们讨论交易的博弈问题,博弈的规则1.是以博弈论为基础的,2.是信息不对称情况下最优选择的探讨,3.是机制设计是博弈的上层建筑,本周我们来继续讨论。1,先说问题 我们将博弈的方案是追求遗憾最小,那么怎样实施呢?遗憾匹配是从过去的行为学习告知未来决策,通过赞同它后悔以前没有采取的行为。在这个模式中,既有积极的遗憾和消极的遗憾。当消极遗憾被你定义成你期望的情况:在特别得情况下采取特别行动的遗憾。这意味着如果在这种情况下没有选择这个行为,agent会做得更好。积极的遗憾也定义成你期望的:这是一种agent可以跟踪导致积极结果的行为的机制。在agent在自我对抗的每场游戏后,最新游戏中遇到的负面和积极的遗憾都被添加到所有其他盘游戏中的总结里,并且计算出新的策略。简而言之,通过概率,它偏好采取过去产生的积极成果的行动并避免采取导致负面结果的行为。与其他的学习机制一样人类也有遗憾学习机制—我们尝试做一些事情,如果失败并引起消极的情绪反应,我们会记下这种遗憾,并让自己再次尝试。以猜拳游戏为例,如果我们在对手出布的时候出了石头,我们就后悔没有出剪子,在下次出现类似的情况就会有意识的纠正。2.关于实践http://i5.jrjimg.cn/201910/07/blog_attach/blog_attach_15704129684071.jpg
上图为上周分析的图形,例如在黄色圆圈位置,实际交易效果并不好,经过遗憾最小化处理,同样的情况会避免一些问题。http://i5.jrjimg.cn/201910/07/blog_attach/blog_attach_15704129842841.jpg
博弈是双方的活动,当负责做多的智能体调整策略后,做空的智能体也会跟着调整,最终再次达到新的纳什均衡。
3总结交易中我们常常说交易策略好在哪里,不好在哪里。这个问题实际上是交易评价问题,无目标的交易肯定是不行的,那么交易目标怎么衡量。我们实际上从以下几个方面考虑的:1.忘掉想赢的执念,我们的目标是不亏,具体来说就是一段时间收益为正,至于多少并不追求。2.追求遗憾最小化,能够通过遗憾匹配,对过去不好的交易进行纠正,我们追求的是策略的进化。3.不二的观点看待交易,策略是从短期看有好坏之分,短期用策略赚钱了,长期用这个策略不一定赚钱。博弈是动态的,不是静态的,策略本身不分好坏,在合适的时候用合适的策略就好。用四个字总结就是实事求是。
页:
[1]