在现代Web开发中,「无限滚动(Infinite Scrolling) 」早已取代了传统的分页模式。以微博热搜流、知乎首页、抖音推荐页为例,用户向下滚动时会自动加载更多内容,这种体验虽提升了交互性,却让传统爬虫面临巨大挑战:
requests
类爬虫无法感知页面行为因为页面数据不是一次性在HTML中加载,而是通过以下形式动态拉取:
javascript
复制编辑
window.addEventListener("scroll", () => {
fetch("/api/more-data?page=2").then(...)
});
Playwright 是由微软开发的浏览器自动化工具,支持: