通过Python+Selenium查询文章质量分

文章目录

  • 前言
  • 一、环境准备
  • 二、查询文章质量分
    • 1.引入模块
    • 2.引入浏览器配置
    • 3.设置无头模式
    • 4.启动浏览器实例,添加配置信息
    • 5.访问质量分地址
    • 6.窗口最大化
    • 7.定位到输入框并输入博文地址
    • 8.定位到查询按钮并点击
    • 9.强制等待1s
    • 10.获取博文标题
    • 11.获取博文发布时间
    • 12.获取博文质量分
    • 13.获取博文质量分建议
    • 14.打印结果
    • 15.效果
  • 三、代码
  • 总结

前言

大家好,我是空空star,本篇给大家分享一下《通过Python+Selenium查询文章质量分》

一、环境准备

浏览器:本篇使用的是Chrome
Chrome驱动版本:110.0.5481.77
Python版本:Python3.8
selenium版本: 4.8.2
Selenium基础篇之环境准备

二、查询文章质量分

1.引入模块

import pprint
import time
from selenium import webdriver
from selenium.webdriver.common.by import By

2.引入浏览器配置

options = webdriver.ChromeOptions()

3.设置无头模式

options.add_argument('--headless')

4.启动浏览器实例,添加配置信息

driver = webdriver.Chrome(options=options)

5.访问质量分地址

driver.get('https://www.csdn.net/qc')

6.窗口最大化

driver.maximize_window()

7.定位到输入框并输入博文地址

driver.find_elements(By.CLASS_NAME, 'el-input__inner')[0].send_keys(blog_url)

8.定位到查询按钮并点击

driver.find_elements(By.CLASS_NAME, 'trends-input-box-btn')[0].click()

9.强制等待1s

time.sleep(1)

10.获取博文标题

title = driver.find_elements(By.TAG_NAME, 'span')[3].text

11.获取博文发布时间

posttime = driver.find_elements(By.TAG_NAME, 'span')[4].text

12.获取博文质量分

score = driver.find_elements(By.TAG_NAME, 'p')[1].text

13.获取博文质量分建议

remark = driver.find_elements(By.TAG_NAME, 'p')[2].text

14.打印结果

pprint.pprint({'title': title, 'posttime': posttime, 'score': score, 'remark': remark, 'url': blog_url})

15.效果

{‘posttime’: ‘- 空空star · 2023-05-16 18:35:51 -’,
‘remark’: ‘文章质量良好’,
‘score’: ‘85’,
‘title’: ‘通过Python的wordcloud库将单词生成词云(心形形状)’,
‘url’: ‘https://blog.csdn.net/weixin_38093452/article/details/130704860’}
Process finished with exit code 0

三、代码

def qc(blog_url):
    options = webdriver.ChromeOptions()
    options.add_argument('--headless')
    driver = webdriver.Chrome(options=options)
    driver.get('https://www.csdn.net/qc')
    driver.maximize_window()
    driver.find_elements(By.CLASS_NAME, 'el-input__inner')[0].send_keys(blog_url)
    driver.find_elements(By.CLASS_NAME, 'trends-input-box-btn')[0].click()
    time.sleep(1)
    title = driver.find_elements(By.TAG_NAME, 'span')[3].text
    posttime = driver.find_elements(By.TAG_NAME, 'span')[4].text
    score = driver.find_elements(By.TAG_NAME, 'p')[1].text
    remark = driver.find_elements(By.TAG_NAME, 'p')[2].text
    pprint.pprint({'title': title, 'posttime': posttime, 'score': score, 'remark': remark, 'url': blog_url})
    return {'title': title, 'posttime': posttime, 'score': score, 'remark': remark, 'url': blog_url}

总结

单篇查询文章质量分至此结束,下一篇介绍《如何快速获取作者所有文章的质量分并保存到excle》。

你可能感兴趣的:(Selenium,python,selenium,开发语言)