python 环境下使用selenium获取页面内多个href标签办法

这个方法使用前提是,你想要获取的多个href标签,它们单独所属的xpath位置有一定规律。

这里吐槽一下,类似”/@href“的写法在很多场景都难以试用。

m=0
url_num=edge.find_elements('xpath','//ul[@id="content_listContainer"]/li/div/h3/a')
# 这里是对整个所需要的href所在位置进行寻找存储为列表格式
#(href在a标签位置下,此处举例是以li为href变化的序列)
for j in url_num:
    m+=1
print(m)
# 记录一共有多少个href需要进行抓取
for i in range(1,m+1):
        url_get=edge.find_element('xpath','//ul[@id="content_listContainer"]/li[{0}]/div/h3/a'.format(i)).get_attribute('href')
    print(url_get)

#  for循环输出每一个li标签下的href标签

你可能感兴趣的:(selenium,python,pycharm,爬虫)