Python 刑法文本爬取示例 Excel条款格式 openpyxl写入

开篇废话(干活请看下个大标题)

近期学习刑法,总结的时候需要用Excel表将刑法条文分条列出,在手动复制粘贴了半个小时后想到用爬虫来解决,才接触过requests库,有了想法后便去MOOC听了会儿爬虫,只讲了下载文本和图片,没讲到编辑Excel这种文件。

于是就bing了一系列博客,下载了xlrd,xlwt,后来发现它们打不开xlsx格式,而且写入操作看教程觉得鸡肋。又学习了beautifulsoup,研究了正则表达式,查看了openpyxl的说明文档。磕磕绊绊七个小时,终于写出了这几十行代码。

其实如果只是要求文本,获得soup之后取soup.text写入txt文件即可。

效果图

Python 刑法文本爬取示例 Excel条款格式 openpyxl写入_第1张图片

全代码

import requests
import openpyxl
from bs4 import BeautifulSoup

header={
	"User-Agent":"Mozilla/5.0 (Windows NT 10.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.106 Safari/537.36"
}
url = "http://search.chin

你可能感兴趣的:(Python)