A股天机 发表于 2018-12-3 08:50

量化交易与机器学习第三十四篇

上周我们讨论了机器学习中算法大的方向,特别是从概率和博弈的方面去考虑问题,本周我们继续讨论机器学习。
1,先说原理
做交易是一种博弈,特别是对于投机来说,交易不产生价值,最后博弈的结果是财富的再分配。
这其中有一些观点和前提:
每个人进入股市都是为了赚钱,都不想亏钱。
每个人都希望自己的收益最大化。
每个人都是理性在。
经过一段时间的博弈,理性保守的交易者会把自己的目标定义为,最小亏损的前提下,获取的最大收益。再进一步就是指局中人使得能够获得的最小收益最大化的策略(最大最小策略)。
现在考虑这样一个游戏:有三个盘子A、B和C,每个盘子分别放有三张纸币。A放的是1、20、50;B放的是5、10、100;C放的是1、5、20。单位均为“元”。有甲、乙两人,两人均对三个盘子和上面放置的纸币有可以任意查看。游戏分三步:
甲从三个盘子中选取一个。
乙从甲选取的盘子中拿出两张纸币交给甲。
甲从乙所给的两张纸币中选取一张,拿走。
其中甲的目标是最后拿到的纸币面值尽量大,乙的目标是让甲最后拿到的纸币面值尽量小。
我们从甲的角度考虑。其中正方形节点表示轮到我方(甲),而三角形表示轮到对方(乙)。经过三轮对弈后(我方-对方-我方),将进入终局。黄色叶结点表示所有可能的结局。从甲方看,由于最终的收益可以通过纸币的面值评价,我们自然可以用结局中甲方拿到的纸币面值表示终格局的价值。

轮到我方的节点叫做max节点,max节点的值是其子节点最大值。
倒数第三层轮到对方选择,假设对方会尽力将局势引入让我方价值最小的格局,因此这些节点的价值取决于子节点的最小值。这些轮到对方的节点叫做min节点。
最后,根节点是max节点,因此价值取决于叶子节点的最大值,根节点的价值为20,表示如果对方每一步都完美决策,则我方按照上述算法可最终拿到20元。
2,关于实践

真实问题一般无法构造出完整的格局树,所以需要确定一个最大深度D,每次最多从当前格局向下计算D层。
因为上述原因,Minimax一般是寻找一个局部最优解而不是全局最优解,搜索深度越大越可能找到更好的解,但计算耗时会呈指数级膨胀。
也是因为无法一次构造出完整的格局树,所以真实问题中Minimax一般是边对弈边计算局部格局树,而不是只计算一次,但已计算的中间结果可以缓存起来。
3.    总结
博弈论是一门很有意思的学问,实际问题中数据量巨大,不能简单的手工计算。只能通过计算机算法来进行求解。算法不同得到的结果不同,人们往往把博弈论和下棋结合起来,有人考虑之后的步数多,会选择有利于自己的走法,棋力强就是这个道理。
本周期货市场的上期技术故障,导致期货大面积跌停,好在最后恢复了,做技术也要时常有敬畏之心。

页: [1]
查看完整版本: 量化交易与机器学习第三十四篇