论文地址:https://arxiv.org/pdf/2411.15241v2
代码地址:https://github.com/AdityaLab/pets
为了更好地理解时间序列模型的理论与实现,推荐参考UP “ThePPP时间序列” 的教学视频。该系列内容系统介绍了时间序列相关知识,并提供配套的论文资料与代码示例,有助于理论与实践相结合。
https://space.bilibili.com/613453963
时间序列预测是各个领域中的关键挑战,近年来取得了显著进展。许多现实生活场景,如公共卫生、经济和社会应用,都涉及反馈回路,其中预测模型可以触发影响其预测结果的行为,从而改变目标变量的分布。这种现象被称为“执行性”,它引入了“自我否定”或“自我实现”预测的可能性。尽管对跨领域分类问题中的执行性进行了广泛研究,但从机器学习的角度来看,这种现象在时间序列预测的背景下很大程度上仍未得到探索。本研究将执行性时间序列预测 (PeTS) 正式化,解决了当可能发生执行性引起的分布变化时进行预测的挑战。本研究针对 PeTS 提出了一种新颖的解决方案——特征执行性移位 (FPS),它利用延迟响应的概念来预测分布变化并随后预测目标。本研究提供了理论见解,表明 FPS 可能会减少泛化误差。大量的实验结果表明,FPS 的性能始终优于传统的时间序列预测和概念漂移方法,突出了其在处理执行性引起的挑战方面的有效性。
本研究关注时间序列预测中的一个关键挑战:预测模型如何影响它们旨在预测的结果,从而改变目标变量的分布。时间序列预测在经济、城市计算和流行病学等多个领域至关重要,它涉及根据历史时间序列数据预测未来趋势或事件。深度学习方法的出现彻底改变了时间序列预测领域。然而,现有模型在开发过程中并未考虑输入特征和目标值之间的反馈回路,忽略了预测本身可以影响预测结果这一事实,这种现象被称为“执行性”。虽然执行性已在战略分类和强化学习等文献中得到广泛研究,但在时间序列预测问题中仍未得到充分探索。
本研究发现,执行性在现实世界中表现为“自我否定”或“自我实现”的预测。例如,交通预测会影响交通模式,疾病预测会影响行为干预,从而影响未来的预测。新冠病毒死亡率预测和出行特征之间存在一个执行性反馈回路。在这个反馈回路中,在疫情严重期间进行的预测会导致更严格的干预措施,从而减少出行,进而降低死亡率,反之亦然。执行性的普遍存在促使本研究对其在时间序列预测中的影响进行深入研究。尽管最近有理论研究探讨了执行性在分类问题的监督学习中的作用,但时间序列预测中的执行性在理论和实践上都缺乏研究。因此,本研究正式定义了执行性时间序列(PeTS)预测问题,旨在在存在执行性引起的分布变化的情况下进行稳健的预测。
本研究与传统的预测方法(假设数据来自固定分布)不同,执行性预测考虑了从动态分布中抽取的样本,其中外生特征可以对预测模型做出反应。这种演变的分布被称为执行性分布。时间序列预测与战略分类问题存在显著差异。虽然时间序列中的预测模型可以影响行动(例如新冠病毒死亡率和出行预测),但这些行动需要在做出预测后的一段时间才能做出反应。这与战略分类中的核心假设(即个人可以在应用预测模型之前战略性地修改其特征)形成对比。因此,与战略分类中的假设博弈不同,执行性时间序列预测涉及在随时间演变的执行性分布下预测目标值。与战略分类中从仅依赖于模型参数的动态分布中抽取样本不同,执行性时间序列预测需要在同时依赖于模型参数和时间的共同演变分布下进行优化。由于分布同时依赖于模型参数和时间,并且模型参数旨在使用从动态分布本身抽取的数据来最小化经验损失,因此随着时间的推移,PeTS 中自然会出现一个反馈回路,称为执行性反馈回路。该反馈回路可以描述为目标时间序列和外生时间序列之间随时间推移的相互作用。
为了解决执行性时间序列预测问题,一个自然的解决方案是识别目标和外生特征之间的时间相关性(例如确定适当的延迟时间),并对条件分布进行建模以准确捕捉执行性反馈回路。在实践中,执行性分布变化可能不会发生在所有特征上。遵循先前的研究设定,本研究通过定义执行性特征(其分布可以作为对模型预测的响应而主动变化)来区分多变量时间序列中的执行性和非执行性特征。PeTS 研究仅针对执行性特征的分布变化。因此,解决 PeTS 的预测模型将来自变化的执行性特征和未变化的非执行性特征的串联作为输入来进行目标预测。执行性和概念漂移都研究了当数据分布随时间变化时的学习问题。虽然执行性专门解决了由于预测模型导致的执行性特征分布的变化,但概念漂移包含了更广泛的分布变化来源。
本研究探索时间序列预测中的执行性问题,提出执行性时间序列预测(PeTS)和特征执行性偏移(FPS)方法。
执行性时间序列预测(PeTS)问题的提出:
特征执行性偏移(FPS)方法的提出:
实验结果验证FPS的有效性:
PeTS问题的正式定义:
️ 执行性特征和非执行性特征的区分以及FPS的三个关键组件: ️