您现在的位置:首页 > 教案模板 > 正文

时间序列应用分析 机器学习用于金融市场预测难在哪?(2)

2018-02-26 10:03 网络整理 教案网

·??价值投资和经济周期在涉及多年内价格变化时最为重要。

专家群可以被用来组合不同规模的模型,但这也是一个难题。(请注意,专家群是把相同规模的模型进行组合的一个很常见的技术—几乎所有定量资产管理公司都采用。)

部分可见马尔科夫决策过程(Partially Observable Markov Decision Process)

应用时间序列分析王燕_时间序列分析及其应用_时间序列应用分析

我乐于考虑把价格的时间序列作为部分可见马尔科夫决策过程(POMDP).没有人在任何时间点都有完整的图片。不知道明天会发生什么—但你仍然要对交易做出决定。你得到的信息非常少。同时,数据的分布也在不断变化。

我已尝试将强化学习方法应用于金融问题。即使我把问题(即状态和行为空间)简化了,也学不到有用的东西。我花了几个星期对于为什么不工作而进行调试—结果是RL算法需要足够的可预测性。

推荐系统的相似性(Similarities to Recommender Systems)

ML可应用于非常广泛的领域。在所有这些中,我发现推荐系统是最贴近金融预测问题的。对比来说提出了潜在问题的难点。跟娱乐Recsys系统比较,分析提出了潜在问题的难点。

·??两者都有相对较低的精度.让我们考虑一下Netflix的例子。Netflix在主页上至少显示了20种电影选项。因此,对于每个建议,选择观看电影的用户的平均可能性小于1/20。有一个“小于”的标志,因为用户可能只是不看任何东西就离开了。同样地,金融时间序列中的大多数二进制分类问题的准确率已经徘徊在50%左右了。

·??两者的数据都有很多的杂音(noise).在这两种情况下,信噪比都很高。在金融时间序列离杂音较高,因为很多不同的因素影响着价格。Recsys数据集包含杂音(PDF),因为用户的浏览通常是受影响的-用户可以访问特定的亚马逊产品页面,完全无意从这类产品中买任何东西—这就结束添加杂音(noise)了。

·??两者的数据集都有季节性.假期间Amazon的购买模式(即产品销售分销)将与今年其它时间段不同。同样适用于其它的Recsys问题,如电影的兴趣和YouTube视频的选择还取决于在全年的时间。金融数据也是季节性的,最常见的季节性问题是经济周期。

·??两者都必须处理看不见的“事件/商品”.亚马逊在其目录中添加新商品,不断增加Netflix标题到商品列表,每一分钟新的视频都被上传到YouTube。推荐系统必须解决这个问题——如何推荐那些不是训练集一部分的商品。正如数据分布部分所提到的,金融数据可以包含与模型训练期间可用的完全不同的事件。

·??两者都必须结合不同类型的数据进行模型训练.YouTube上有一些独立的功能,比如“最后N个看过的视频列表”,它也有连续的功能,比如“最后一个视频的观看时长”。同样,金融数据集可以由较高的频率价格以及较低的频率经济数字组成。

结束思考:

如果因为一件事你要离开这个岗位,应该这样:金融时间序列是一个部分信息博弈(POMDP),甚至对于人类也是很难的,我们不应该期望的机器和算法突然超越人的能力。

这些算法擅长的是发现一个硬编码的模式并应用,这是一把双刃剑,但有时可以有时不行。它帮助绝大多数的简单模式来识别实例都已经被详细讨论了。通过无监督学习在金融时间序列中识别模式的下一阶段仍然是一个难以实现的梦想。