机器学习的几种重要模型在交易中的应用

机器学习(Machine Learning)使用统计方法来推断数据之间的联系。人工智能(AI)单元并非依赖于算法来告诉它应该找到哪些联系,而是使用统计分析从数据中学习并不断修正其参数和假设,达到找到正确联系的结果。

在监督学习中,机器可用的数据包括输入数据(input)与对应的输出结果(output)。人工智能单元建立了两者之间的关系,并使用此关系对进一步的输入数据进行预测。当公司有输入数据流并希望作出预测的情况下,监督学习技术,如贝叶斯回归或随机森林就很有用。

相反,无监督学习没有可供学习的样本。AI的单元只能尝试自己找到输入数据之间的关系。无监督学习可用于分类问题,如在聚类分析中确定哪些数据点彼此相似。

Portware的AI单元使用贝叶斯回归来计算不同订单流情况出现的概率。该公司首先从市场,社交媒体和新闻获取数据,来预测不同程度的订单流不平衡(order imbalance)的可能性。

“你可以将可能出现的不同的情况中的结果分类,计算每个情况出现的概率,并计算出概率加权的预期结果。例如,如果我们讨论订单流预测,我们可能将未来订单流的情况分类为非常积极,积极,中立,负面或非常负面的。” Waelbroeck说。

摩根大通通过限价订单簿中收到的订单市场数据,结合随机森林模型预测接下来的20个或更多的交易时刻(ticks)订单流的方向及其概率。

聚类分析(cluster analysis)的思想很简单:不同的物理对象在三维空间中聚集的概念。但将其应用于更多维度的理论空间。

例如,以债券为例,每个维度都可能代表一个债券的特征:期限,到期日,未偿还价值或货币等等。就像一个物理对象在三维空间中具有位置以及与其他对象的距离一样,债券在这个理论特征空间中也有自己的位置,并与其他债券之间存在“距离”。这些“距离”决定了债券的“相似性”。

Bloomberg的流动性评估工具——LQA旨在将有足够相似性的债券归类,因此他们的历史数据可以共享,并用于对该集群中的所有债券进行通用的预测。

在强化学习(reinforcement learning)中,AI单元学习如何在特定环境下选择最佳行动。例如,摩根大通通过生成很多模拟限价订单,训练AI单元如何交易。AI单元在这些模拟的订单流中进行交易,而其交易的预期成本由瞬时模型(transient model)来刻画。

AI机器人根据预期成本,成交概率和订单大小,为每一个给定的市场情况下的行动赋予价值。 在模拟的样本中,那些能够在整个交易样本中都降低订单成本,并允许将来获得更大的行动自由的交易行为将获得更高的价值。通过这种方法,AI单元学会了哪些行为能够将未来预期价值最大化,从而在实际交易中做出最佳决策。

【注】文章首发于公众号“量化风险研究”,公众号ID:RiskQuant。转载请注明。

你可能感兴趣的:(机器学习的几种重要模型在交易中的应用)