0-Polynet:学习神经组合优化的多样解策略(未完)

文章目录

  • Abstract
  • 1 Introduction
  • 2. 文献综述
  • 3 POLYNET
    • 3.1 背景
      • 3.2 概述
    • 3.3 训练
    • 3.4 网络架构
    • 3.5 搜索
  • 4 EXPERIMENTS
  • 5 结论

0-Polynet:学习神经组合优化的多样解策略(未完)_第1张图片

Abstract

基于强化学习的方法在构建组合优化问题的解方面,其性能正迅速接近人类设计的算法。为了进一步缩小差距,基于学习的方法必须在搜索过程中高效地探索解空间。最近的方法通过手工设计规则来强制生成多样化的解,从而人为地增加探索性。然而,这些规则可能会损害解的质量,并且对于更复杂的问题来说,设计这样的规则也较为困难。 在本文中,我们介绍了 PolyNet,这是一种通过学习互补的解策略来提高解空间探索效率的方法。与其他工作不同,PolyNet 仅使用单个解码器和一种训练方案,而不通过手工设计规则来强制生成多样化的解。我们在四个组合优化问题上对 PolyNet 进行了评估,观察到其隐式的多样性机制使得 PolyNet 能够找到比那些明确强制生成多样化解的方法更好的解。

1 Introduction

近年来,在基于学习的组合优化(CO)问题求解方法领域取得了显著进展(Bello 等,2016;Kool 等,2019;Kwon 等,2020)。特别是强化学习&

你可能感兴趣的:(文献阅读,学习,人工智能,算法)